디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[정보/뉴스] Apple, 기기 내 사용을 목표로 하는 8개의 소형 언어 모델 릴리즈

ㅇㅇ(182.230) 2024.04.29 19:58:58
조회 155 추천 2 댓글 2
														

https://arstechnica.com/information-technology/2024/04/apple-releases-eight-small-ai-language-models-aimed-at-on-device-use/

 



2cadc02ae0ed2ca97dace9bd13c32b028faf9f749f4dcd9637b8916ed5041d89df4f8fbdba514507



- Apple이 스마트폰에서 직접 실행할 수 있을 정도로 작은 크기의 AI 언어 모델인 OpenELM을 공개

- OpenELM은 "Open-source Efficient Language Models"의 약자로, Hugging Face에서 Apple Sample Code License로 사용 가능

- 소스 코드는 공개되었으나 라이선스에 일부 제한이 있어 일반적인 "오픈 소스" 정의에는 맞지 않을 수 있음


OpenELM 모델의 특징

- OpenELM은 2억 7천만에서 30억 개의 매개변수를 가진 8개의 모델로 구성됨

- 최근 연구는 몇 년 전의 대규모 AI 언어 모델만큼 능력 있는 작은 AI 언어 모델 만들기에 초점을 맞추고 있음

- OpenELM 모델은 사전 학습된(pretrained) 버전과 명령어 학습된(instruction-tuned) 버전, 두 가지 유형으로 제공됨

 ㄴ OpenELM-270M, OpenELM-450M, OpenELM-1_1B, OpenELM-3B

 ㄴ OpenELM-270M-Instruct, OpenELM-450M-Instruct, OpenELM-1_1B-Instruct, OpenELM-3B-Instruct


OpenELM 모델의 학습 데이터와 성능

- OpenELM은 최대 2048 토큰의 컨텍스트 윈도우를 가지고 있음

- 약 1.8조 개의 토큰 데이터로 학습되었으며, 이는 공개적으로 사용 가능한 RefinedWeb, PILE의 중복 제거 버전, RedPajama의 하위 집합, Dolma v1.6의 하위 집합 데이터셋을 포함

- Apple의 "layer-wise scaling strategy"를 통해 매개변수를 각 레이어에 더 효율적으로 할당하여 계산 자원을 절약하고 모델 성능을 향상

- OpenELM은 Allen AI의 OLMo 1B보다 절반의 사전 학습 토큰으로도 2.36% 더 정확한 성능을 보임


공개된 추가 자료와 Apple의 목표

- Apple은 OpenELM 학습에 사용된 CoreNet 라이브러리의 코드와 재현 가능한 학습 레시피를 공개

- 주요 기술 기업으로서는 이례적으로 가중치까지 공개하여 투명성을 강조

- 소스 코드, 모델 가중치, 학습 자료를 공개함으로써 "개방형 연구 커뮤니티를 강화하고 풍부하게 만드는 것"이 목표

- 그러나 공개 데이터셋으로 학습되었기에 부정확하거나 유해하거나 편향되거나 반감을 살만한 출력물이 나올 가능성이 있음을 경고


향후 전망

- Apple은 아직 새로운 AI 언어 모델 기능을 소비자 기기에 통합하지는 않았음

- 그러나 6월 WWDC에서 공개될 것으로 예상되는 iOS 18 업데이트에는 사용자 개인 정보 보호를 위해 기기 내 처리를 활용하는 새로운 AI 기능이 포함될 것으로 추측됨

- 더 복잡한 기기 외부 AI 처리를 위해 Google이나 OpenAI를 고용하여 Siri를 업그레이드할 가능성도 있음

자동등록방지

추천 비추천

2

고정닉 1

원본 첨부파일 1

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2868 설문 힘들게 성공한 만큼 절대 논란 안 만들 것 같은 스타는? 운영자 24/06/10 - -
473541 일반 현재 존나 즐거운 새끼 [2] ㅇㅇ(125.183) 05.15 158 4
473540 일반 정보) OpenAI가 따려고 하는 것은 검색 엔진 그 자체이다 [1] ㅇㅇ(119.202) 05.15 136 2
473538 일반 생각의 체인 입갤 ㅋㅋㅋㅋㅋㅋㅋㅋ ㅇㅇ갤로그로 이동합니다. 05.15 49 0
473537 일반 서클투서치 <-- ㅇㅈ [2] ㅇㅇ갤로그로 이동합니다. 05.15 97 0
473536 일반 구글 검색 나락가는데 무슨 제미니 검색이노 ㅋㅋㅋㅋ ㅇㅇ(218.232) 05.15 62 0
473535 일반 맨마지막에 하사비스 나와서 ㅇㅇ갤로그로 이동합니다. 05.15 58 0
473534 일반 솔직히 구글 검색할때 요약뜨는건 좀 편하더라 ㅇㅇ ㅇㅇ갤로그로 이동합니다. 05.15 50 0
473533 일반 Perplexity 구글버전 나오나???? ㅇㅇ(221.155) 05.15 57 0
473532 일반 제미니 시대의 검색 입갤 ㅋㅋㅋㅋㅋㅋㅋ ㅇㅇ갤로그로 이동합니다. 05.15 45 0
473531 일반 좆글은 그 많은 직원으로 대체 뭐함? [1] ㅇㅋ갤로그로 이동합니다. 05.15 86 1
473530 일반 근데 여기는 왤케 구글 까내리고 오픈 ai를 좋아함? [16] ㅇㅇ(58.234) 05.15 260 2
473529 일반 구글링 입갤 ㅋㅋㅋㅋㅋㅋㅋ ㅇㅇ갤로그로 이동합니다. 05.15 40 0
473528 일반 공공기관 pt보는거 같음. ㅇㅇ(218.232) 05.15 48 0
473527 일반 어어 이가 왜 이렇노 ㅇㅇ(119.64) 05.15 43 0
473526 일반 월1코 씹나락은 꼬숩노 ㅋㅋㅋ ㅇㅇ갤로그로 이동합니다. 05.15 92 2
473524 일반 구글은 어디서 봤던걸 보여주면 안됨 ㅇㅇ갤로그로 이동합니다. 05.15 47 0
473523 일반 아니 난 oai 어제 발표 반응 속도가 제일 신기함 [3] ㅇㅇ(218.154) 05.15 155 3
473522 일반 oai도 비디오입력인데 스냅샷 이라는 개소리는 어디서나온거 ㄹㅇㅋㅋ [2] ㅇㅇ(218.153) 05.15 131 0
473521 일반 지금 무슨 축제중인가요? [6] FIREKICK갤로그로 이동합니다. 05.15 109 0
473520 일반 Circle to seach 개짜치네 [4] 기능제어갤로그로 이동합니다. 05.15 111 0
473519 일반 발음에서 왤캐 기계음 나는것 같냐 ㅇㅇ(220.116) 05.15 27 0
473518 일반 구글 오늘 영상도 반응속도 주작질 친거 나올듯 ㅇㅇ갤로그로 이동합니다. 05.15 41 0
473516 일반 오픈AI <<< 이 새끼들밖에 없으면 개추........ ㅇㅇ갤로그로 이동합니다. 05.15 76 7
473515 일반 알트만이 구글 머리 꼭대기에서 노는구나 ㅇㅇ(121.131) 05.15 88 2
473514 일반 ㅈ도 모르는 ㅈ문가들이 뭐가 낫니 마니하는게 웃기네 ㅋㅋㅋ [5] ㅇㅇ(121.140) 05.15 110 1
473513 일반 어떻게 이렇게 새로운게 단 하나도 없노? ㅇㅇ(119.77) 05.15 28 0
473512 일반 병신.jpg ㅇㅇ(125.183) 05.15 182 2
473511 일반 그냥 AI로 구글이 사는 방법은 이거 하나임 ㅇㅇ(218.39) 05.15 143 0
473510 일반 구글은 왜 혀만 긴거같아요??? 키보드워리어갤로그로 이동합니다. 05.15 49 0
473509 일반 Gemini 1.5 pro <— 사실 난 이게 제일 유용했음 [4] ㅇㅇ(174.177) 05.15 260 0
473508 일반 수냉! ㅇㅇ(175.112) 05.15 33 0
473507 일반 난 시연하나도 안하고 입만터는거 이해함 ㅇㅇ(175.213) 05.15 83 0
473506 일반 걍 이게더 쩔어보이는데 ㅇㅇ(1.240) 05.15 142 1
473505 일반 니네 하사비스 앞에서도 그말할수 있음? ㅋ ㅇㅇ(58.29) 05.15 80 0
473504 일반 걍 한숨만나오네 ㅇㅇ갤로그로 이동합니다. 05.15 41 0
473503 정보/ GPT-4o 비디오 입력되는거 맞구만 ㅋㅋ [1] ㅇㅇ(119.77) 05.15 252 5
473502 일반 슬슬 초상집 분위기 나는거 같은데 퐁칸8갤로그로 이동합니다. 05.15 75 1
473501 일반 사기꾼 특징 = 말만 ㅈㄴ 하고 실제 라이브 데모는 없음 ㅋㅋㅋㅋ ㅇㅇ(218.232) 05.15 48 0
473500 일반 특갤 반응 보니까 구글이 잘하고 있나본데 ㅋㅋㅋ [2] ㅇㅇ(58.234) 05.15 139 1
473498 일반 진짜 병신이네 ㅇㅇ(119.64) 05.15 38 0
473497 일반 오픈AI는 혓바닥 없이 보여줬는데 이새끼들은 시발ㅋㅋㅋ ㅇㅇ갤로그로 이동합니다. 05.15 47 0
473496 일반 뭐야 녹방이었어? ㅋㅋㅋㅋㅋㅋ 알트만 연전연승ㅋㅋㅋㅋㅋㅋ ㅇㅇ(211.192) 05.15 126 3
473495 일반 TPUv6 입갤 ㅋㅋㅋㅋㅋㅋㅋㅋㅋ ㅇㅇ갤로그로 이동합니다. 05.15 65 0
473494 일반 하드웨어도르 TPU 입갤 ㅋㅋㅋㅋㅋㅋㅋㅋ ㅇㅇ갤로그로 이동합니다. 05.15 54 0
473493 일반 울트라 다오 울리내놔 ㅇㅇ갤로그로 이동합니다. 05.15 23 0
473492 일반 Gemini 1.5 ultra 없으면 끝이다.. ㅇㅇ(119.64) 05.15 51 0
473491 일반 구글 씹련들 때문에 gpt5는 내년일 예정 ㅇㅋ갤로그로 이동합니다. 05.15 74 0
473490 일반 발표만 봐서는 OAI랑 기술수준 별 차이 없는데 왜 욕함? [17] ㅇㅇ(121.140) 05.15 301 1
473489 일반 내가 알트만이면 구글 행사 끝나고 바로 검색엔진 발표함 [1] ㅇㅇ(218.39) 05.15 119 0
473488 일반 별거없네 토마스골드갤로그로 이동합니다. 05.15 38 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2