디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[정보] '진짜' 오픈 소스 LLM '올모' 업데이트..."데이터셋·학습 강화"

ㅇㅇ(182.230) 2024.04.19 20:00:37
조회 105 추천 1 댓글 2
														

https://www.aitimes.com/news/articleView.html?idxno=158917

 



7ce8887fb48507f739ee87e741ee7768ac1b6477e98ed19972ca974cd62513bfae1413



앨런AI연구소(AI2)가 데이터 수집부터 학습, 배포까지 전 과정을 투명하게 공개한 오픈 소스 대형언어모델(LLM) ‘올모(OLMo)’를 업데이트했다.  


벤처비트는 17일(현지시간) 비영리 민간 AI 연구기관인 AI2가 지난 2월 출시한 70억 매개변수의 오픈 소스 LLM ‘올모 1.7-7B’에 대한 업데이트를 공개했다고 보도했다.


이에 따르면 올모는 모델 코드와 가중치뿐만 아니라 훈련 코드, 훈련 데이터, 관련 툴킷 및 평가 툴킷까지 무료로 제공한다. 이 때문에  ‘진정한 오픈 소스’ 모델로 통한다. 


업데이트된 올모 1.7-7B는 훈련 절차와 아키텍처 개선으로 최대 2048~4096개 토큰의 더 긴 컨텍스트 길이와 더 나은 성능을 지원한다.


여기에 2조3000억개의 토큰 규모의 새로운 데이터셋 ‘돌마 1.7(Dolma 1.7)를 구축해 학습을 강화했다. 돌마 1.7 데이터셋에는 돌마 CC, 리파인드 웹, 스타코더, C4, 스택 익스체인지, 오픈웹매쓰, 프로젝트 쿠텐버그, 위키피디아 등 광범위한 소스의 데이터를 포함한다.



7ce8887fb48507f739ee87e74eee776a21a43f833d7a8c50b3a46eb74b951364cd



올모 1.7-7B는 이전 버전과 달리 두단계의 커리큘럼을 사용한다. 첫 단계에서 연구원들은 모델을 처음부터 훈련했다.


두번째 단계에서는 학습률을 0으로 선형적으로 줄이면서 돌마 1.7에서 선별된 50억토큰의 하위 고품질 데이터셋에 대해 추가 학습을 진행했다. 


이를 통해 올모 1.7-7B는 MMLU 벤치마크에서 '라마 2-7B'를, GSM8K 벤치마크에서 '라마-2-13B'의 성능을 능가했다고 밝혔다.


현재 업데이트된 올모 1.7-7B 모델과 돌마 1.7 데이터셋은 허깅페이스에서 확인할 수 있다.


자동등록방지

추천 비추천

1

고정닉 1

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2858 설문 SNS로 싸우면 절대 안 질 것 같은 고집 있는 스타는? 운영자 24/05/06 - -
461640 일반 지금까지 안나온거면 걍 답나온거지 [1] ㅇㅇ(118.235) 05.01 186 0
461639 일반 늦네에....ㅅㅂ [1] ㅇㅇ(118.235) 05.01 154 0
461638 일반 GPT-5 발표가 늦어지는 이유.. [3] 00(112.153) 05.01 348 1
461637 일반 핵융합 상용화되면 금도 만들어낼수 있는거 아니냐? [1] ㅇㅇ(218.155) 05.01 167 1
461636 일반 역노화 거부감있고 인구폭증 우려하는 사람 특징. [1] ㅇㅇ갤로그로 이동합니다. 05.01 243 1
461635 일반 재추론이 왜 사기냐면 [5] ㅇㅇ갤로그로 이동합니다. 05.01 188 0
461634 일반 AI 성능 ㅈ되게 올릴 방법 찾았다 [1] ㅇㅇ갤로그로 이동합니다. 05.01 138 0
461633 일반 먹고살 생존 문제라 ㅇㅇ(117.111) 05.01 56 0
461632 일반 뭐지 뤼튼 이번엔 검열 다시 풀렸나 ㅇㅇ(180.230) 05.01 128 0
461631 일반 학벌로 꿀빠는 직업은 없어질라면 국민 정신 개조부터 해야함 [2] ㄴㅇㅁㅇㅁㄴ(121.178) 05.01 198 0
461630 일반 AI가 늦는 이유 ㅇㅇ(76.38) 05.01 105 0
461629 일반 요즘 분위기 많이 가라앉았네 [2] ㅇㅇ(58.77) 05.01 306 0
461627 일반 가정로봇 언제 나와 ㅇㅇ(59.26) 05.01 50 0
461626 일반 ai거품이면 안되는데 ㅇㅅㅇ... [1] 초코냥갤로그로 이동합니다. 05.01 283 0
461625 일반 gpt4 요새 사용자 알고리즘 타냐? 케이프타운의무법자갤로그로 이동합니다. 05.01 67 0
461624 토의 무슨직업 대체가 더 빠를까 [5] 테이리갤로그로 이동합니다. 05.01 251 3
461623 일반 역시 4시에 아무일도 안일어났네 ㅇㅇ(182.211) 05.01 69 0
461622 일반 존버878일차 alphaca갤로그로 이동합니다. 05.01 56 0
461621 일반 ai 거품론 슬슬 고개들고있네 [6] 거더라갤로그로 이동합니다. 05.01 674 6
461620 일반 사실 지금까지 사람들은 자본의 불평등만 이야기했지만 [1] ㅇㅇ(1.229) 05.01 164 0
461619 일반 머야 gpt2가 진짜 다음 버전인가보네 [5] ㅇㅇ(115.138) 05.01 572 0
461618 일반 특갤이 해냈다! gpt2 조기 종료 ㅋㅋㅋ [8] ㅇㅇ(119.56) 05.01 723 5
461617 일반 역노화까지만 나와도 소원이 없겠음. ㅇㅇ(1.239) 05.01 87 0
461616 일반 챗아레나 reka-flash 이 새끼 뭐임? 왤캐 좋냐 [3] ㅇㅇ(119.56) 05.01 207 1
461615 일반 astribot 얘기는 왜안함? ㅇㅇ(1.236) 05.01 82 0
461614 일반 선형의 승리인 거 같으면 개추ㅋㅋㅋ [1] ㅇㅇ(103.249) 05.01 402 13
461613 일반 알트만 트윗에서 gpt 언급할 때 항상 - 붙였음? [6] ㅇㅇ(211.36) 05.01 276 0
461612 일반 gpt2 정체 밝히기 싫으면 아예 무시하던가 [6] ㅇㅇ(59.4) 05.01 538 8
461611 일반 2세대면 그냥 다른 이름을 썼을 거 같은데 ㅇㅇ(116.120) 05.01 73 0
461610 일반 gpt-2가 아니라 gpt2라서 2세대 모델이라는거임? [4] ㅇㅇ(211.36) 05.01 314 0
461609 일반 일관성은 결국 기억력 문제 ㅇㅇ갤로그로 이동합니다. 05.01 75 0
461608 일반 특이점은 온다. ㅇㅇ(1.239) 05.01 51 0
461607 일반 지금 선택할만 한 방식이 ㅇㅇ(59.13) 05.01 70 0
461606 일반 내가 말한대로 개발되고 있긴 하냐? [1] ㅇㅇ갤로그로 이동합니다. 05.01 136 0
461605 일반 이름가지고 장난치는거 보니까 슬슬 끝물같으면 개추ㅋㅋㅋ [5] ㅇㅇ(211.197) 05.01 4047 40
461604 일반 오늘 도메인마저 결국 아무것도 없었나 ㅇㅇ갤로그로 이동합니다. 05.01 86 0
461603 일반 특이점 언제와..? [9] KURO갤로그로 이동합니다. 05.01 260 1
461602 일반 결국은 하드웨어 문제 처리한 groq인가 ㅇㅇ(59.13) 05.01 94 0
461601 일반 클로드 넘 개씹멍청해져서 개짜증 [2] 초존도초갤로그로 이동합니다. 05.01 215 0
461600 일반 크리스퍼 가위는 아직 조심해서 써야 할 것 같긴하당.. [15] ㅇㅇ갤로그로 이동합니다. 05.01 424 1
461599 일반 CHARACTER AI이거 [1] ㅇㅇ(59.13) 05.01 119 0
461598 일반 파인튜닝이나 프롬프트 엔지니어링이 의미가 없어지는 건가? [4] ㅇㅇ(59.13) 05.01 188 0
461596 일반 역노화 이론적으로는 가능한거긴함? [9] ㅇㅇ(112.159) 05.01 362 0
461595 일반 아레나 좋은게 지금 핫한 AI 다 써볼수있음 [1] ㅇㅇ(182.211) 05.01 180 0
461594 일반 GPT2 챗봇 물건이긴하네... [1] ㅇㅇ(154.90) 05.01 548 1
461593 일반 근데 gpt2는 무료임? [3] ㅇㅇ갤로그로 이동합니다. 05.01 295 0
461592 일반 openai 생각보다 존나 센놈이었네 ㅇㅇ(59.13) 05.01 238 0
461591 일반 중국에서 비밀리에 인체실험으로 역노화연구 진행중이지 않을까? [4] ㅇㅇ(125.249) 05.01 291 0
461590 일반 아.. [2] ㅇㅇ(112.144) 05.01 206 1
461589 일반 제일 싸가지없는 언어모델 [3] ㅇㅇ(119.207) 05.01 313 1
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2