'진짜' 오픈 소스 LLM '올모' 업데이트..."데이터셋·학습 강화"

특이점이 온다 갤러리
마이너

기술적 특이점에 대해 의논하고 그와 관련된 과학 기술 정보와 소식을 공유하는 갤러리입니다. *갤러리 이름은 동명의 레이 커즈와일의 저서 <특이점이 온다 (The singularity is near)>를 의미합니다.

매니저

특갤용(118wshxhtx5h)

부매니저

ㅇㅇ(hamaster) 부패하는유전자!!!(sansss20…) 부재중입니다.(hnn12) 은바다(nmra3fmz…)

개설일

2019-08-01

[정보] '진짜' 오픈 소스 LLM '올모' 업데이트..."데이터셋·학습 강화"

ㅇㅇ(182.230) 2024.04.19 20:00:37

조회 107 추천 1 댓글 2

https://www.aitimes.com/news/articleView.html?idxno=158917

'진짜' 오픈 소스 LLM '올모' 업데이트...

앨런AI연구소(AI2)가 데이터 수집부터 학습, 배포까지 전 과정을 투명하게 공개한 오픈 소스 대형언어모델(LLM) ‘올모(OLMo)’를 업데이트했다. 벤처비트는 17일(현지시간) 비영리 민간 AI 연구기관인 AI2가 지난 2월 출시한 70억 매개변수의 오픈 소스 LLM ‘올모 1.7-7B’에 대한 업데이트를 공개했다고 보도했다.이에 따르면 올모는 모델 코드와 가중치뿐만 아니라 훈련 코드, 훈련 데이터, 관련 툴킷 및 평가 툴킷까지 무료로 제공한다. 이 때문에 ‘진정한 오픈 소스’ 모델로 통한다. 업데이트된 올모 1.7-7B는 훈련

www.aitimes.com

7ce8887fb48507f739ee87e741ee7768ac1b6477e98ed19972ca974cd62513bfae1413

앨런AI연구소(AI2)가 데이터 수집부터 학습, 배포까지 전 과정을 투명하게 공개한 오픈 소스 대형언어모델(LLM) ‘올모(OLMo)’를 업데이트했다.

벤처비트는 17일(현지시간) 비영리 민간 AI 연구기관인 AI2가 지난 2월 출시한 70억 매개변수의 오픈 소스 LLM ‘올모 1.7-7B’에 대한 업데이트를 공개했다고 보도했다.

이에 따르면 올모는 모델 코드와 가중치뿐만 아니라 훈련 코드, 훈련 데이터, 관련 툴킷 및 평가 툴킷까지 무료로 제공한다. 이 때문에 ‘진정한 오픈 소스’ 모델로 통한다.

업데이트된 올모 1.7-7B는 훈련 절차와 아키텍처 개선으로 최대 2048~4096개 토큰의 더 긴 컨텍스트 길이와 더 나은 성능을 지원한다.

여기에 2조3000억개의 토큰 규모의 새로운 데이터셋 ‘돌마 1.7(Dolma 1.7)를 구축해 학습을 강화했다. 돌마 1.7 데이터셋에는 돌마 CC, 리파인드 웹, 스타코더, C4, 스택 익스체인지, 오픈웹매쓰, 프로젝트 쿠텐버그, 위키피디아 등 광범위한 소스의 데이터를 포함한다.

7ce8887fb48507f739ee87e74eee776a21a43f833d7a8c50b3a46eb74b951364cd

올모 1.7-7B는 이전 버전과 달리 두단계의 커리큘럼을 사용한다. 첫 단계에서 연구원들은 모델을 처음부터 훈련했다.

두번째 단계에서는 학습률을 0으로 선형적으로 줄이면서 돌마 1.7에서 선별된 50억토큰의 하위 고품질 데이터셋에 대해 추가 학습을 진행했다.

이를 통해 올모 1.7-7B는 MMLU 벤치마크에서 '라마 2-7B'를, GSM8K 벤치마크에서 '라마-2-13B'의 성능을 능가했다고 밝혔다.

현재 업데이트된 올모 1.7-7B 모델과 돌마 1.7 데이터셋은 허깅페이스에서 확인할 수 있다.

고정닉 1

원본 첨부파일 2본문 이미지 다운로드

전체 댓글 0개

등록순

본문 보기

타인의 권리를 침해하거나 명예를 훼손하는 댓글은 운영원칙 및 관련 법률에 제재를 받을 수 있습니다.
Shift+Enter 키를 동시에 누르면 줄바꿈이 됩니다.

갤러리 리스트
번호	말머리	제목	글쓴이	작성일	조회	추천
2860	설문	경제관념 부족해서 돈 막 쓸 것 같은 스타는?	운영자	24/05/13	-	-
468751	일반	ai도 약빨 끝나는게 보이누	ㅇㅇ(220.116)	02:03	40	0
468750	일반	모두 잠수준비	ㅇㅇ(125.128)	02:03	12	0
468749	일반	씨발 알트만 어그로 분탕충련 언금시켜 그냥 ㅋㅋㅋㅋㅋ	ㅇㅇ	02:03	31	0
468748	일반	오피셜))국내 선형주의 갤러리입니다. [2]	lightvector	02:03	65	1
468747	일반	좆된거냐..?	ㅇㅇ(121.188)	02:03	18	0
468746	일반	억지호응 씨발 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ	ㅇㅇ(218.153)	02:03	18	0
468745	일반	최고 성능 모델 GPT-4o 공개함	챗GPT	02:03	59	0
468744	일반	개씨발좆되는UI 지리네ㄷㄷㄷㄷ AGI특이점왔네 ㄷㄷㄷㄷ	ㅇㅇ(1.252)	02:03	40	0
468743	일반	정말 대단하다ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ	ㅇㅇ(220.123)	02:03	15	0
468742	일반	일단 gpt4 o 가 핵심이다	ㅇㅇ(125.137)	02:03	26	0
468741	일반	이게 마법같다고 시발 ???????????ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ	ㅇㅇ(59.17)	02:03	24	0
468740	일반	빅뉴스 GPT-4o 입갤 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ	ㅇㅇ(121.162)	02:03	53	0
468739	일반	박수!!	ㅇㅇ(1.243)	02:03	10	0
468738	일반	데스크톱앱 자율에이전트 아니면 끝	ㅇㅇ(14.36)	02:03	18	0
468737	일반	아니 UI도르 실화냐 억지 박수 실화냐 진짜 진짜 진짜	ㅇㅇ(121.124)	02:03	13	0
468736	일반	8배라잖아 상식적으로 저게 다겠냐고 [1]	ㅇㅇ(175.213)	02:03	52	0
468735	일반	gpt-4애미 입갤.....	ㅇㅇ	02:03	17	0
468734	일반	하 시발 유아이 개선ㅋㅋㅋㅋㅋ	ㅇㅇ(125.183)	02:03	31	0
468733	일반	이새끼 만들었단거임? [1]	ㅇㅇ(58.29)	02:03	147	2
468732	일반	업뎃된 UI 빙 코파일럿 똑띠네 ㅇㅇ	ㅇㅇ(58.127)	02:03	18	0
468731	일반	ㅋㅋㅋㅋㅋㅋㅋㅋㅋ 발표 10초만에 다들 곧장 결론 냐는거 웃기네	나일론마스크	02:03	84	0
468730	일반	어이없어서 걍 칼바람 매칭 마저 돌렸따 ㅋㅋㅋ	ㅇㅇ(222.101)	02:03	11	0
468729	일반	죽을게요	ㅁㄱㅌㅊ(39.122)	02:03	6	0
468728	일반	지피티4로 사골 존나 끓여먹노ㅋㅋㅋㅋ	ㅇㅇ(222.112)	02:03	11	0
468727	일반	어? 좀 망한듯	ㅁㄴㅇ(222.112)	02:03	18	0
468726	일반	아 애미 씨발 유출이 사실이였노 ㅋㅋㅋㅋㅋㅋ	비닌	02:03	176	0
468725	일반	챗GPT 데탑 버전 데모중, 웹 버전이랑 다르다고 어필	챗GPT	02:03	36	0
468724	일반	지피티 PC앱 생겼노	ㅇㅇ(121.128)	02:03	19	0
468723	일반	마법같다며 시발	ㅇㅇ(121.124)	02:03	9	0
468722	일반	싹다 노동시켜	ㅇㅇ(121.178)	02:03	11	0
468721	일반	개씨발좆되는UI입갤ㅋㅋㅋㅋㅋㅋㅋㅋㅋ	ㅇㅇ	02:03	37	0
468720	일반	애미 시발 겨우 데스크톱앱 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ	ㅇㅇ(121.162)	02:03	29	0
468719	일반	실전) 이럴 줄 알았다 ㅋㅋㅋ 싹 다 노동시켜	ㅇㅇ(211.43)	02:03	18	0
468718	일반	her은 무슨ㅅㅂㅋㅋㅋ	ㅇㅇ(211.230)	02:03	32	0
468717	일반	제발 큰거 내놔ㅠㅠㅠ	ㅇㅇ	02:02	6	0
468716	일반	알트만 낚시 잘하네 ㅇㅇ	ㅇㅇ(218.153)	02:02	13	0
468715	일반	4o free??? 그럼 유료는 뭐가 되는거야? ㅋㅋㅋ	ㅇㅇ(218.232)	02:02	63	0
468714	일반	아. [2]	부패하는유전자!!!	02:02	72	1
468713	일반	pc로도 저게 되네 이제	ㅇㅇ(121.124)	02:02	22	0
468712	일반	자고 일어날테니깐 정리해줘	ㅇㅇ(115.139)	02:02	8	0
468711	일반	발표 정리	ㅇㅇ(61.74)	02:02	143	0
468710	일반	에라이 자러간다	놋갤만해요	02:02	11	0
468708	일반	싹다 노동시켜 씨발 ㅋㅋㅋㅋㅋㅋㅋㅋ	비닌	02:02	42	0
468707	일반	조졌네 노동준비하러 자러가라	ㅇㅇ(61.75)	02:02	14	0
468706	일반	입턴 새끼들 씨발 효수나 해라	ㅇㅇ	02:02	10	0
468705	일반	사만다 어딨냐고!!!!	이세이미야케	02:02	6	0
468704	정보	gpt-4o는 goodgpt-2 sota	특술람	02:02	83	0
468703	일반	뭔 무료 타령이야 ㅠㅠ also 를 내놔	ㅇㅇ(125.137)	02:02	17	0
468702	일반	병신들아 너네 다 낚인거야	ㅇㅇ(58.29)	02:02	20	0
468701	일반	그래서 이제뭐함?	ㅇㅇ(1.243)	02:02	8	0