디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[정보/뉴스] Apple, 기기 내 사용을 목표로 하는 8개의 소형 언어 모델 릴리즈

ㅇㅇ(182.230) 2024.04.29 19:58:58
조회 152 추천 2 댓글 2
														

https://arstechnica.com/information-technology/2024/04/apple-releases-eight-small-ai-language-models-aimed-at-on-device-use/

 



2cadc02ae0ed2ca97dace9bd13c32b028faf9f749f4dcd9637b8916ed5041d89df4f8fbdba514507



- Apple이 스마트폰에서 직접 실행할 수 있을 정도로 작은 크기의 AI 언어 모델인 OpenELM을 공개

- OpenELM은 "Open-source Efficient Language Models"의 약자로, Hugging Face에서 Apple Sample Code License로 사용 가능

- 소스 코드는 공개되었으나 라이선스에 일부 제한이 있어 일반적인 "오픈 소스" 정의에는 맞지 않을 수 있음


OpenELM 모델의 특징

- OpenELM은 2억 7천만에서 30억 개의 매개변수를 가진 8개의 모델로 구성됨

- 최근 연구는 몇 년 전의 대규모 AI 언어 모델만큼 능력 있는 작은 AI 언어 모델 만들기에 초점을 맞추고 있음

- OpenELM 모델은 사전 학습된(pretrained) 버전과 명령어 학습된(instruction-tuned) 버전, 두 가지 유형으로 제공됨

 ㄴ OpenELM-270M, OpenELM-450M, OpenELM-1_1B, OpenELM-3B

 ㄴ OpenELM-270M-Instruct, OpenELM-450M-Instruct, OpenELM-1_1B-Instruct, OpenELM-3B-Instruct


OpenELM 모델의 학습 데이터와 성능

- OpenELM은 최대 2048 토큰의 컨텍스트 윈도우를 가지고 있음

- 약 1.8조 개의 토큰 데이터로 학습되었으며, 이는 공개적으로 사용 가능한 RefinedWeb, PILE의 중복 제거 버전, RedPajama의 하위 집합, Dolma v1.6의 하위 집합 데이터셋을 포함

- Apple의 "layer-wise scaling strategy"를 통해 매개변수를 각 레이어에 더 효율적으로 할당하여 계산 자원을 절약하고 모델 성능을 향상

- OpenELM은 Allen AI의 OLMo 1B보다 절반의 사전 학습 토큰으로도 2.36% 더 정확한 성능을 보임


공개된 추가 자료와 Apple의 목표

- Apple은 OpenELM 학습에 사용된 CoreNet 라이브러리의 코드와 재현 가능한 학습 레시피를 공개

- 주요 기술 기업으로서는 이례적으로 가중치까지 공개하여 투명성을 강조

- 소스 코드, 모델 가중치, 학습 자료를 공개함으로써 "개방형 연구 커뮤니티를 강화하고 풍부하게 만드는 것"이 목표

- 그러나 공개 데이터셋으로 학습되었기에 부정확하거나 유해하거나 편향되거나 반감을 살만한 출력물이 나올 가능성이 있음을 경고


향후 전망

- Apple은 아직 새로운 AI 언어 모델 기능을 소비자 기기에 통합하지는 않았음

- 그러나 6월 WWDC에서 공개될 것으로 예상되는 iOS 18 업데이트에는 사용자 개인 정보 보호를 위해 기기 내 처리를 활용하는 새로운 AI 기능이 포함될 것으로 추측됨

- 더 복잡한 기기 외부 AI 처리를 위해 Google이나 OpenAI를 고용하여 Siri를 업그레이드할 가능성도 있음

자동등록방지

추천 비추천

2

고정닉 1

원본 첨부파일 1

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2864 설문 비난 여론에도 뻔뻔하게 잘 살 것 같은 스타는? 운영자 24/06/03 - -
242613 공지 특갤 통합 공지 / 댓글 신고,문의 / 차단 해제 요청 [3118] 특갤용갤로그로 이동합니다. 23.08.06 39639 43
433260 공지 웬만하면 신문고에 문의 해주시면 차단 풀어드립니다 [2] 부패하는유전자!!!갤로그로 이동합니다. 24.03.06 2634 2
363220 공지 선형글 삭제 기준 [7] 특갤용갤로그로 이동합니다. 23.10.14 7322 24
375493 공지 필독) 유입 특붕이를 위한 AI 정보글 모음 (01/23) [40] ㅇㅇ(182.230) 23.11.11 13477 122
373402 공지 직업 비하, 조롱 글 30일 차단됩니다. [51] 특갤용갤로그로 이동합니다. 23.11.07 9016 79
385147 공지 구글의 AGI 분류 체계 [17] ㅇㅇ갤로그로 이동합니다. 23.11.22 8479 31
332612 공지 음모론 삭제 기준을 안내드립니다. [23] 특갤용갤로그로 이동합니다. 23.08.25 9230 30
412470 공지 레이 커즈와일 신간 6월 25일 발매 [29] 모브갤로그로 이동합니다. 24.01.24 8116 34
259237 공지 특갤 용어 모음집 [6] 특갤용갤로그로 이동합니다. 23.08.09 22842 33
486029 일반 2025년까지 반년도 안남았는데 ㅇㅇ(118.32) 08:27 14 0
486028 일반 라면의 나트륨이 두렵다면 ㅇㅇ(221.167) 08:25 18 0
486027 일반 1달만에 갤들어옴 특떡머 [3] 살균맨갤로그로 이동합니다. 08:22 40 0
486025 일반 영양제만 먹으면 식비 0이다. [2] ㅇㅇ(112.169) 08:16 46 0
486024 일반 식비 최대한 아끼는법 [10] ㅇㅇ(221.167) 08:10 109 0
486023 일반 돌 시즌2 입갤 ㅋㅋㅋ [1] ㅇㅇ(112.169) 08:00 153 0
486022 정보/ X(트위터)에서 NSFW가 허용됨 [3] 디시콘발사대갤로그로 이동합니다. 07:59 177 4
486021 일반 주말에 샘이 만든 세계동전 가입할까 함 ㅇㅇ(175.192) 07:56 61 1
486020 일반 우리나라 산유국되면 돌맹이 이상가는 거 아님? [3] ㅇㅇ(112.161) 07:49 119 0
486019 일반 뭐냐 6월 3일 근들갑 떨더니 [1] ㅇㅇ(121.182) 07:44 101 0
486018 일반 클로드 다음작은 소식없어?? 엠창인생막장의끝갤로그로 이동합니다. 07:34 54 0
486017 일반 오늘 특갤 다른날 아침보다 좀 조용하노 [1] ㅇㅇ(223.38) 07:29 103 0
486016 일반 창작물 속 AI는 꼭 시뮬레이션을 돌리고 경우의 수를 분석하던데 ㅇㅇ(119.202) 07:27 56 0
486015 일반 20%면 시도해보는 게 맞는거야 ㅇㅇ(121.134) 07:24 61 0
486014 일반 오늘도 저는 출근을합니다. ㅇㅇ(221.154) 07:20 37 0
486012 일반 Gpt5 공개늦는이유 ㅇㅇ(121.139) 06:48 128 0
486011 일반 아니 씨발 20% 5번 파면 무조건 한번 성공하는거아님? [6] 내꺼야호날두갤로그로 이동합니다. 06:39 380 3
486010 일반 씻기존나귀찮네 ㄹㅇ [1] ㅇㅇ(121.139) 06:39 71 0
486009 일반 역노화때문에 특갤알게됨 [2] ㅇㅇ(121.139) 06:37 106 0
486008 일반 Ai는 진짜 거품일뿐일까 [7] ㅇㅇ(121.139) 06:35 182 0
486007 일반 스칼렛요한슨 아니었으면 [3] ㅇㅇ(121.139) 06:32 162 0
486006 일반 허깅페이스에서 운영하는 인공지능 플랫폼에서 불법적 접근 흔적 나타나 ㅇㅇ(112.161) 06:30 64 0
486005 일반 지피티5가 엄청난 혁신일 확률 얼마나되냐? [4] ㅇㅇ(121.139) 06:25 162 0
486004 일반 아 스트레스 받아 아 스트레스 받아 ㅇㅇ(27.119) 06:16 56 1
486002 일반 믿었누? 초존도초갤로그로 이동합니다. 05:28 73 0
486001 일반 일론은 나노머신쪽에 관심 없나? [5] ㅇㅇ(175.192) 05:07 131 0
486000 일반 Gpt5 나오면 생화학쪽 질문을 많이 해봐야 하겠어 ㅇㅇ(175.192) 04:51 93 0
485998 일반 chatgpt 업데이트 떳다 !!! ㄷㄷㄷㄷㄷㄷㄷ [2] ㅎㅎ(61.82) 04:41 453 0
485997 일반 gpt 원래 고집이 센가요? [1] ㅇㅇ(118.46) 04:16 118 0
485996 일반 특붕이들은 또또또또속았습니다 ㅇㅇ갤로그로 이동합니다. 04:15 107 0
485995 일반 갤주:너희를 다 죽여버리겠다 ㅇㅇ(175.192) 04:12 112 0
485994 정보/ 일론머스크, 르쿤이햄 언팔 [3] ㅇㅇ(119.77) 04:12 300 1
485993 정보/ MS, 5000배 빠른 SOTA 날씨 예측 모델 공개 [2] ㅇㅇ(119.77) 04:06 214 3
485992 일반 갤주: 특이점을 과소평가하는 태도는 너를 죽일수 있다 ㅇㅇ(223.38) 04:05 104 0
485991 정보/ 보이스 대신 치타 발표 떴다 ㄷㄷ [5] ㅇㅇ(119.77) 04:03 401 4
485990 정보/ 갤주 : AI의 힘을 과소평가하는 태도는 너를 죽일수도 있다 [3] lightvector갤로그로 이동합니다. 04:01 264 1
485988 일반 전세계적으로 오늘 뉴 보이스 적용된다는 걸 믿은 집단은 유일하게 특갤 [2] ㅎㅎ(61.82) 03:57 164 2
485987 일반 ㅋㅋㅋ 이걸 또 믿은 병신 흑우 새끼들 없재? [1] ㅇㅇ(118.235) 03:54 109 0
485985 일반 대충 트위터 계정파서 대충 프사 전문적이게 바꾸고 그럴듯한 찌라시쓰면 [3] ㅇㅇ(121.157) 03:43 163 0
485983 일반 이럴줄 알았다 ㅋㅋㅋㅋㅋㅋㅋ ㅇㅇ(175.223) 03:13 138 0
485982 일반 에이 오늘은 여기까디~ 도서관킬러갤로그로 이동합니다. 03:13 49 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2