디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[정보] '진짜' 오픈 소스 LLM '올모' 업데이트..."데이터셋·학습 강화"

ㅇㅇ(182.230) 2024.04.19 20:00:37
조회 107 추천 1 댓글 2
														

https://www.aitimes.com/news/articleView.html?idxno=158917

 



7ce8887fb48507f739ee87e741ee7768ac1b6477e98ed19972ca974cd62513bfae1413



앨런AI연구소(AI2)가 데이터 수집부터 학습, 배포까지 전 과정을 투명하게 공개한 오픈 소스 대형언어모델(LLM) ‘올모(OLMo)’를 업데이트했다.  


벤처비트는 17일(현지시간) 비영리 민간 AI 연구기관인 AI2가 지난 2월 출시한 70억 매개변수의 오픈 소스 LLM ‘올모 1.7-7B’에 대한 업데이트를 공개했다고 보도했다.


이에 따르면 올모는 모델 코드와 가중치뿐만 아니라 훈련 코드, 훈련 데이터, 관련 툴킷 및 평가 툴킷까지 무료로 제공한다. 이 때문에  ‘진정한 오픈 소스’ 모델로 통한다. 


업데이트된 올모 1.7-7B는 훈련 절차와 아키텍처 개선으로 최대 2048~4096개 토큰의 더 긴 컨텍스트 길이와 더 나은 성능을 지원한다.


여기에 2조3000억개의 토큰 규모의 새로운 데이터셋 ‘돌마 1.7(Dolma 1.7)를 구축해 학습을 강화했다. 돌마 1.7 데이터셋에는 돌마 CC, 리파인드 웹, 스타코더, C4, 스택 익스체인지, 오픈웹매쓰, 프로젝트 쿠텐버그, 위키피디아 등 광범위한 소스의 데이터를 포함한다.



7ce8887fb48507f739ee87e74eee776a21a43f833d7a8c50b3a46eb74b951364cd



올모 1.7-7B는 이전 버전과 달리 두단계의 커리큘럼을 사용한다. 첫 단계에서 연구원들은 모델을 처음부터 훈련했다.


두번째 단계에서는 학습률을 0으로 선형적으로 줄이면서 돌마 1.7에서 선별된 50억토큰의 하위 고품질 데이터셋에 대해 추가 학습을 진행했다. 


이를 통해 올모 1.7-7B는 MMLU 벤치마크에서 '라마 2-7B'를, GSM8K 벤치마크에서 '라마-2-13B'의 성능을 능가했다고 밝혔다.


현재 업데이트된 올모 1.7-7B 모델과 돌마 1.7 데이터셋은 허깅페이스에서 확인할 수 있다.


자동등록방지

추천 비추천

1

고정닉 1

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2860 설문 경제관념 부족해서 돈 막 쓸 것 같은 스타는? 운영자 24/05/13 - -
468751 일반 ai도 약빨 끝나는게 보이누 ㅇㅇ(220.116) 02:03 40 0
468750 일반 모두 잠수준비 ㅇㅇ(125.128) 02:03 12 0
468749 일반 씨발 알트만 어그로 분탕충련 언금시켜 그냥 ㅋㅋㅋㅋㅋ ㅇㅇ갤로그로 이동합니다. 02:03 31 0
468748 일반 오피셜))국내 선형주의 갤러리입니다. [2] lightvector갤로그로 이동합니다. 02:03 65 1
468747 일반 좆된거냐..? ㅇㅇ(121.188) 02:03 18 0
468746 일반 억지호응 씨발 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ ㅇㅇ(218.153) 02:03 18 0
468745 일반 최고 성능 모델 GPT-4o 공개함 챗GPT갤로그로 이동합니다. 02:03 59 0
468744 일반 개씨발좆되는UI 지리네ㄷㄷㄷㄷ AGI특이점왔네 ㄷㄷㄷㄷ ㅇㅇ(1.252) 02:03 40 0
468743 일반 정말 대단하다ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ ㅇㅇ(220.123) 02:03 15 0
468742 일반 일단 gpt4 o 가 핵심이다 ㅇㅇ(125.137) 02:03 26 0
468741 일반 이게 마법같다고 시발 ???????????ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ ㅇㅇ(59.17) 02:03 24 0
468740 일반 빅뉴스 GPT-4o 입갤 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ ㅇㅇ(121.162) 02:03 53 0
468739 일반 박수!! ㅇㅇ(1.243) 02:03 10 0
468738 일반 데스크톱앱 자율에이전트 아니면 끝 ㅇㅇ(14.36) 02:03 18 0
468737 일반 아니 UI도르 실화냐 억지 박수 실화냐 진짜 진짜 진짜 ㅇㅇ(121.124) 02:03 13 0
468736 일반 8배라잖아 상식적으로 저게 다겠냐고 [1] ㅇㅇ(175.213) 02:03 52 0
468735 일반 gpt-4애미 입갤..... ㅇㅇ갤로그로 이동합니다. 02:03 17 0
468734 일반 하 시발 유아이 개선ㅋㅋㅋㅋㅋ ㅇㅇ(125.183) 02:03 31 0
468733 일반 이새끼 만들었단거임? [1] ㅇㅇ(58.29) 02:03 147 2
468732 일반 업뎃된 UI 빙 코파일럿 똑띠네 ㅇㅇ ㅇㅇ(58.127) 02:03 18 0
468731 일반 ㅋㅋㅋㅋㅋㅋㅋㅋㅋ 발표 10초만에 다들 곧장 결론 냐는거 웃기네 나일론마스크갤로그로 이동합니다. 02:03 84 0
468730 일반 어이없어서 걍 칼바람 매칭 마저 돌렸따 ㅋㅋㅋ ㅇㅇ(222.101) 02:03 11 0
468729 일반 죽을게요 ㅁㄱㅌㅊ(39.122) 02:03 6 0
468728 일반 지피티4로 사골 존나 끓여먹노ㅋㅋㅋㅋ ㅇㅇ(222.112) 02:03 11 0
468727 일반 어? 좀 망한듯 ㅁㄴㅇ(222.112) 02:03 18 0
468726 일반 아 애미 씨발 유출이 사실이였노 ㅋㅋㅋㅋㅋㅋ 비닌갤로그로 이동합니다. 02:03 176 0
468725 일반 챗GPT 데탑 버전 데모중, 웹 버전이랑 다르다고 어필 챗GPT갤로그로 이동합니다. 02:03 36 0
468724 일반 지피티 PC앱 생겼노 ㅇㅇ(121.128) 02:03 19 0
468723 일반 마법같다며 시발 ㅇㅇ(121.124) 02:03 9 0
468722 일반 싹다 노동시켜 ㅇㅇ(121.178) 02:03 11 0
468721 일반 개씨발좆되는UI입갤ㅋㅋㅋㅋㅋㅋㅋㅋㅋ ㅇㅇ갤로그로 이동합니다. 02:03 37 0
468720 일반 애미 시발 겨우 데스크톱앱 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ ㅇㅇ(121.162) 02:03 29 0
468719 일반 실전) 이럴 줄 알았다 ㅋㅋㅋ 싹 다 노동시켜 ㅇㅇ(211.43) 02:03 18 0
468718 일반 her은 무슨ㅅㅂㅋㅋㅋ ㅇㅇ(211.230) 02:03 32 0
468717 일반 제발 큰거 내놔ㅠㅠㅠ ㅇㅇ갤로그로 이동합니다. 02:02 6 0
468716 일반 알트만 낚시 잘하네 ㅇㅇ ㅇㅇ(218.153) 02:02 13 0
468715 일반 4o free??? 그럼 유료는 뭐가 되는거야? ㅋㅋㅋ ㅇㅇ(218.232) 02:02 63 0
468714 일반 아. [2] 부패하는유전자!!!갤로그로 이동합니다. 02:02 72 1
468713 일반 pc로도 저게 되네 이제 ㅇㅇ(121.124) 02:02 22 0
468712 일반 자고 일어날테니깐 정리해줘 ㅇㅇ(115.139) 02:02 8 0
468711 일반 발표 정리 ㅇㅇ(61.74) 02:02 143 0
468710 일반 에라이 자러간다 놋갤만해요갤로그로 이동합니다. 02:02 11 0
468708 일반 싹다 노동시켜 씨발 ㅋㅋㅋㅋㅋㅋㅋㅋ 비닌갤로그로 이동합니다. 02:02 42 0
468707 일반 조졌네 노동준비하러 자러가라 ㅇㅇ(61.75) 02:02 14 0
468706 일반 입턴 새끼들 씨발 효수나 해라 ㅇㅇ갤로그로 이동합니다. 02:02 10 0
468705 일반 사만다 어딨냐고!!!! 이세이미야케갤로그로 이동합니다. 02:02 6 0
468704 정보 gpt-4o는 goodgpt-2 sota 특술람갤로그로 이동합니다. 02:02 83 0
468703 일반 뭔 무료 타령이야 ㅠㅠ also 를 내놔 ㅇㅇ(125.137) 02:02 17 0
468702 일반 병신들아 너네 다 낚인거야 ㅇㅇ(58.29) 02:02 20 0
468701 일반 그래서 이제뭐함? ㅇㅇ(1.243) 02:02 8 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2