디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[정보] 애플, 온디바이스 AI용 오픈 소스 sLM '오픈ELM' 출시

ㅇㅇ(182.230) 2024.04.25 20:05:52
조회 120 추천 2 댓글 2
														

https://www.aitimes.com/news/articleView.html?idxno=159124

 



7ce88977b78607f739ee85e140ee77682ea09b40add1a9c13592397742ebc087af



애플이 초경량급 오픈 소스 소형언어모델(sLM)을 출시했다. PC 및 모바일 장치 등 단일 플랫폼에서 완전히 실행되도록 최적화돼 있는 것이 특징이다.


벤처비트는 24일(현지시간) 애플이 클라우드 서버에 연결하지 않고도 장치에서 로컬로 실행 가능한 온디바이스 인공지능(AI)용 오픈 소스 sLM ‘오픈ELM(OpenELM)’에 관한 논문을 온라인 아카이브에 게재했다고 전했다.


이에 따르면 오픈ELM은 텍스트 생성 작업을 효율적으로 수행하도록 설계된 소형 모델로, 허깅페이스에서 4개의 사전 훈련 모델과 4개의 명령 조정 모델을 공개했다. 매개변수 수는 각각 2억7000만개(0.27B), 4억5000만개(0.45B), 11억개(1.1B), 30억개(3B)로 현재 공개된 sLM 중 가장 작은 규모다.


사전 훈련은 모델이 일관되고 잠재적으로 도움이 되는 텍스트를 생성하도록 하는 방법이며, 명령 조정은 사용자의 특정 요청에 대해 보다 관련성이 높은 출력으로 응답하도록 하는 방법이다. 


애플은 모델 가중치와 추론 코드만 제공하고 비공개 데이터 세트에 대한 사전 훈련만 제공하던 일반적인 사례와 달리, 오픈ELM은 학습 로그, 다중 체크포인트, 사전 훈련 구성을 포함해 공개 데이터 세트에서 언어 모델을 학습하고 평가 및 명령 조정하기 위한 전체 프레임워크를  공개했다. 


오픈ELM 라이선스는 ‘애플 샘플 코드 라이선스’하에 배포됐다. 해당 라이선스에 따르면, 상업적 용도로 오픈ELM을 사용하거나 수정할 수 있으나 향후 재배포 과정에서는 라이선스에서 제시한 문구와 면책 조항을 함께 명시해야 한다. 또한 모델 결과가 유해하거나 편향된 결과를 생성할 수 있다며 결과에 대한 안정성을 애플이 보장하지 않는다고 설명했다.


지난해 10월 멀티모달언어모델 ‘페럿(Ferret)’에 이은 애플의 두번째 오픈 소스 언어모델이다.


애플은 깃허브, 위키피디아, 레딧, 아카이브 등의 1조8000억개의 토큰으로 구성된 공개 데이터셋을 활용해 오픈ELM을 사전훈련했다고 밝혔다. 


오픈ELM 모델들은 상용 노트북 또는 일부 스마트폰에서 실행하기에 적합하다. 애플에 따르면 인텔 i9-13900KF CPU와 64GB DDR5-4000 DRAM, 그리고 엔비디아 RTX 4090 GPU와 24GB VRAM을 장착한 우분투 22.04에서 작동하는 워크스테이션에서 실행되었으며, M2 Max 시스템 온 칩(SoC)과 64GB RAM이 장착된 맥OS 14.4.1에서 작동하는 애플 맥북 프로에서도 실행됐다.



7ce88977b78607f739ee85e141ee776b6203ed57c77bfd075e98d86519bf98cbc6



성능 면에서도 오픈ELM이 상당히 좋은 것으로 나타났다. 특히 0.45B 모델이 전반적으로 우수한 것으로 나타났다.


1.1B 모델은 올모 1.2B보다 2.36% 더 성능이 뛰어나며 필요한 사전 훈련 토큰은 2배 더 적다. 지식과 추론 능력을 테스트하는 ARC-C 벤치마크에서 사전 훈련된 오픈ELM 3B 는 42.24%의 정확도를 기록했다. MMLU와 헬라스웩(HellaSwag) 벤치마크에서는 각각 26.76%, 73.28%를 기록했다.


한편 마이크로소프트(MS)가 최근 출시한  38억 매개변수와 4K 컨텍스트 길이의 파이-3 미니가 ARC-C 벤치마크에서 84.9%, MMLU에서 68.8%, 헬라스웩에서 76.7%를 기록하며 1위를 차지했다.


오픈ELM 모델군 테스트를 시작한 한 사용자는 "견고한 모델이지만 매우 정렬된" 것으로 보인다고 지적했다. 인간이 원하는 작업을 AI가 수행하게 만들고, 원하지 않는 작업을 수행하지 않도록 하는 정렬(alignment)에는 뛰어나지만, 창의적이지는 않다는 말이다.


벤처비트는 "애플이 오픈ELM을 오픈 소스로 출시한 만큼, 장기적으로 성능은 점차 개선될 것으로 예상된다"라고 평했다. 



자동등록방지

추천 비추천

2

고정닉 1

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2858 설문 SNS로 싸우면 절대 안 질 것 같은 고집 있는 스타는? 운영자 24/05/06 - -
463240 일반 자율에이전트 [1] 메타(Meta)갤로그로 이동합니다. 05.06 209 0
463239 일반 빌게이츠는 체면만 내려놓으면 20살 여친 만들 수 있는데 [16] ㅇㅇ(218.147) 05.06 533 0
463238 일반 지금 버핏되기 vs 나인채로 살기 [4] ㅇㅇ(221.147) 05.06 241 0
463237 일반 찰리멍거 사망함? [2] ㅇㅇ(112.159) 05.06 181 1
463236 일반 핵심은 소프트웨어 [1] ㅇㅇ갤로그로 이동합니다. 05.06 80 0
463235 일반 알트만 트윗 맥락 [3] ㅇㅇ(14.55) 05.06 457 1
463234 일반 안드로이드 로봇이 인간처럼 움직일 수 있게 하려면 [3] ㅇㅇ갤로그로 이동합니다. 05.06 116 1
463233 일반 니들 지금 버핏이 된다면 뭐할거냐? [4] ㅇㅇ갤로그로 이동합니다. 05.06 132 0
463232 일반 돈 많아도 나이가 80대 90대면 의미가 없음 [1] ㅇㅇ(113.61) 05.06 198 0
463230 일반 라마3은 분명히 과대평가돼있음 [3] ㅇㅇ갤로그로 이동합니다. 05.06 200 0
463229 일반 제미니 지피티 둘다 구독하고 쓰고있는데 [17] 자애갤로그로 이동합니다. 05.06 252 0
463228 일반 버핏이 갑자기 AI 기웃거리는 이유가 머겠냐? [3] ㅇㅇ(124.28) 05.06 452 1
463226 일반 근데 구글은 로봇 뭐 없냐 ㅇㅇ(211.197) 05.06 39 0
463225 일반 만약에 검색엔진+gpt5+ 자율에이전트 다같이 출시하면 투우사갤로그로 이동합니다. 05.06 104 0
463224 일반 안드로이드 로봇의 문제가 대체 뭘까 [5] ㅇㅇ갤로그로 이동합니다. 05.06 149 0
463223 일반 요즘 구글 검색 왜이리 검열이 심해졌냐 ㅇㅇ(211.197) 05.06 86 0
463222 일반 어디서 봤는데 일론이 뉴럴링크로 vr가능성 있다고 들었는데 [8] 투우사갤로그로 이동합니다. 05.06 233 0
463221 일반 버핏 요새 ai 언급 왤케 많이하지 [7] ㅇㅇ(210.106) 05.06 418 1
463219 일반 이번 검색엔진 발표 때 GPT 5도 내놓지 않을까 [4] ㅇㅇ(118.33) 05.06 212 0
463218 일반 어제 테슬라 옵티머스보고 존나 멀었다는걸 느꼈음 [6] 친근한게이브갤로그로 이동합니다. 05.06 194 1
463217 일반 올초에 테슬라봇 이정도면 년말에 노동 대체 가능 [4] ㅇㅇ(218.147) 05.06 273 0
463216 일반 안드로이드 기술의 핵심은 관성에 대한 이해 [2] ㅇㅇ갤로그로 이동합니다. 05.06 60 0
463215 일반 스토리디퓨전 로컬이라서 검열없죠? ㅇㅇ(183.105) 05.06 52 0
463214 일반 역노화는 뇌가 제일 문제지 않음? [1] ㅇㅇ(210.182) 05.06 162 0
463212 일반 가상현실을 만들어서 거기서 AI를 수련시키자 [3] ㅇㅇ갤로그로 이동합니다. 05.06 124 2
463210 일반 mmlu가 98이면 뭐함? [1] ㅇㅇ(220.116) 05.06 201 0
463209 일반 오늘도 노동해방과 특이점을 향한 기도를 올립니다 ㅇㅇ(219.240) 05.06 22 0
463208 일반 LLaMA 3 405B는 완전 훈련시 mmlu 약 92-94% 예상 [3] 메타(Meta)갤로그로 이동합니다. 05.06 275 0
463206 일반 머스크가 agi 2025년에 나온다고 했다고? [2] ㅇㅇ(223.39) 05.06 242 0
463205 일반 요즘 뉴욕이 가라앉는다 특이점 나오려면 멀었다는거 보고든 생각인데 [2] ㅇㅇ(175.124) 05.06 210 2
463203 일반 난 머스크 말을 믿는다. [4] ㅇㅇ(220.86) 05.06 334 1
463200 일반 적당한 트랜스휴먼만 되도 사고로 죽기힘들지 [1] ㅇㅇ갤로그로 이동합니다. 05.06 128 0
463198 일반 얀르쿤 피셜 agi는 몇십년 뒤에 오니까 [2] ㅇㅇ(223.39) 05.06 297 4
463197 일반 특이점 오면 사고나 병으로 죽을 일이 없음 ㅇㅇ갤로그로 이동합니다. 05.06 70 0
463196 일반 당분간 선형충할란다 ㅇㅇ(180.228) 05.06 101 0
463195 일반 사고나 병으로 안죽는 기술도 나올테니까 그렇지 ㅇㅇ갤로그로 이동합니다. 05.06 41 0
463193 일반 아니 근데 왜 역노화만 되면 영원히 살 수 있을거라 생각함? [8] ㅇㅇ(223.39) 05.06 255 0
463191 일반 gpt4이후 첫 업데이트가 코앞이다 [2] et갤로그로 이동합니다. 05.06 231 0
463190 일반 로봇에 적용되는 ai는 강화학습 기반임? [2] ㅇㅇ(211.197) 05.06 93 0
463188 일반 gpt2자꾸 언급하지마라 ㅇㅇ(14.53) 05.06 160 0
463187 일반 알트만 트윗 [5] ㅇㅇ갤로그로 이동합니다. 05.06 494 2
463186 일반 군대 경계근무 <- 언제까지 사람이 하냐 [1] ㅇㅇ(211.197) 05.06 83 0
463185 일반 항상 최첨단 기술은 군대부터 최우선 적용됐지 [2] ㅇㅇ(58.127) 05.06 167 0
463184 일반 특이점 오면 잘나가는 놈들이 더 잘나감. [1] ㅇㅇ갤로그로 이동합니다. 05.06 147 0
463183 일반 인간의 과학 기술은 식물 씨앗보다 구리다 [3] ㅇㅇ(120.142) 05.06 168 0
463182 일반 존버883일차 alphaca갤로그로 이동합니다. 05.06 40 1
463181 일반 왜 머스크 말고 일리야 수츠케버 같은 사람 말을 듣는거냐 [5] ㅇㅇ(220.86) 05.06 314 0
463180 일반 AGI만 나오면 사실상 특이점인데... [2] ㅇㅇ갤로그로 이동합니다. 05.06 245 0
463179 일반 선형충들아 왜 자꾸 돈 모으라고 하는거냐? [14] ㅇㅇ갤로그로 이동합니다. 05.06 414 2
463178 일반 AI Api 활용에서 나오는 프로그램 많던데 어떻게 한건지 궁금함 ㅇㅇ(203.236) 05.06 82 1
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2