메타, '라마 3' 소형 버전 출시...머스크 "나쁘지 않아"

특이점이 온다 갤러리
마이너

기술적 특이점에 대해 의논하고 그와 관련된 과학 기술 정보와 소식을 공유하는 갤러리입니다. *갤러리 이름은 동명의 레이 커즈와일의 저서 <특이점이 온다 (The singularity is near)>를 의미합니다.

매니저

특갤용(118wshxhtx5h)

부매니저

ㅇㅇ(hamaster) 부패하는유전자!!!(sansss20…) 부재중입니다.(hnn12) 은바다(nmra3fmz…)

개설일

2019-08-01

[정보] 메타, '라마 3' 소형 버전 출시...머스크 "나쁘지 않아"

ㅇㅇ(182.230) 2024.04.19 19:57:32

조회 341 추천 2 댓글 3

https://www.aitimes.com/news/articleView.html?idxno=158943

메타, '라마 3' 소형 버전 출시...머스크

메타가 오픈 소스 대형언어모델(LLM) ‘라마 3’ 중 소형 버전 2개를 공개했다. 이에 대해 일론 머스크 테슬라 CEO는 X(트위터)에 “나쁘지 않다(Not bad)”라고 평가했다.메타가 18일(현지시간) 라마 3 시리즈 중 매개변수 80억개(8B)와 700억개(70B)의 소형 버전을 공개했다. 메타는 매개변수 4000억개(400B)의 가장 큰 버전도 개발하고 있다고 밝혔다.라마 3는 사전 훈련과 미세조정 과정을 고도화, 성능이 대폭 향상됐다. 사전 훈련을 위해 데이터셋의 양을 늘리고, 필터링 과정을 거쳐 고품질 데이터만을 선별했

www.aitimes.com

7ce8887fb18107f739ee86ec44ee776530687cda330f31ae595a75c4649f9c3911dc8f

메타가 오픈 소스 대형언어모델(LLM) ‘라마 3’ 중 소형 버전 2개를 공개했다. 이에 대해 일론 머스크 테슬라 CEO는 X(트위터)에 “나쁘지 않다(Not bad)”라고 평가했다.

메타가 18일(현지시간) 라마 3 시리즈 중 매개변수 80억개(8B)와 700억개(70B)의 소형 버전을 공개했다. 메타는 매개변수 4000억개(400B)의 가장 큰 버전도 개발하고 있다고 밝혔다.

라마 3는 사전 훈련과 미세조정 과정을 고도화, 성능이 대폭 향상됐다. 사전 훈련을 위해 데이터셋의 양을 늘리고, 필터링 과정을 거쳐 고품질 데이터만을 선별했다.

특히 15조개 이상의 토큰을 동원, 학습량이 라마 2 대비 7배 이상 많으며 코드량은 4배 더 많다. 다만 데이터셋은 공개하지 않았다.

이후 미세조정에는 일상적인 질문부터 과학·기술·공학·수학(STEM), 코딩, 역사 지식에 이르기까지 다양한 분야의 데이터셋이 사용됐다. 훈련 규모를 확대하는 것은 물론, 고도화된 ‘지시 미세조정(instruction fine-tuning)’ 과정도 진행했다.

또 라마 3는 라마 2보다 2배 큰 8000토큰의 컨텍스트 길이를 지원한다.

오픈 소스라는 점을 감안, 안전하고 책임감 있는 개발과 사용을 위한 다양한 안전장치도 마련했다고 밝혔다. 전문가와 자동화된 도구를 활용한 레드팀 테스트를 통해 부적절한 답변의 가능성을 최소화했다고 전했다.

메타는 이번에 공개한 두가지 크기의 라마 3 버전이 다양한 벤치마크 테스트에서 구글의 '젬마'나 '제미나이 프로 1.5', 미스트랄 AI의 '미스트랄 7B', 엔트로픽의 '클로드 3 소네트'와 같은 모델들을 능가한다고 주장했다.

7ce8887fb18107f739ee86ec45ee7764f36d212f6add555e0e6b243100cfbe3455de

라마 3는 객관식 문제(MMLU)와 코딩(HumanEval)에는 강하지만, 70B의 경우 수학 단어 문제(MATH) 해결이나 대학원생 수준의 객관식 문제(GPQA)에서는 제미나이 프로 1.5에 떨어졌다.

특히 인간 선호도에서 경쟁 모델을 앞서는 것으로 알려졌다.

조언 요청, 브레인스토밍, 분류, 비공개 질문 답변, 코딩, 창의적인 글쓰기, 추출, 공개 질문 답변, 추론, 재작성 및 요약 등 12가지 주요 사용 사례를 포함한 1800개 프롬프트 구축 데이터셋에 대한 인간 평가에서 오픈AI의 'GPT-3.5', 미스트랄 7B, 클로드 3 소네트보다 높게 평가됐다.

7ce8887fb18107f739ee86ec43ee776413320aeaeeb8c64fb96a10b9c6db32fb44

허깅페이스에 따르면, 라마 3는 공개 후 몇시간만에 LLM 리더보드 1위에 오르며 역대 가장 빠른 1위 달성 기록을 세웠다.

또 이전 라마 1과 2를 기반으로 3만개 이상의 새로운 모델이 출시됐으며, 라마 2 모델은 1700억번 다운로드됐다는 통계치도 공개해 눈길을 모았다.

다만 라마 3는 완전한 오픈 소스가 아니다. 연구용 및 상업용으로 모두 사용할 수 있지만, 개발자가 다른 생성 모델을 훈련하기 위해 모델을 사용하는 것을 금지한다.

7ce8887fb18107f739ee86ec40ee706dcf1e816c1d4a63e26c5b0e7143c28fcafe3cb0

한편 메타는 이날 최신 라마 3로 구동되는 멀티모달 챗봇 ‘메타 AI(Meta AI)’를 페이스북, 인스타그램, 왓츠앱, 메신저 등에 출시한다고 밝혔다.

지난해 9월 미국에서 베타 버전으로 선보인 지 7개월 만이다. 메타는 현재 호주, 캐나다, 가나, 자메이카, 말라위, 뉴질랜드, 나이지리아, 파키스탄, 싱가포르, 남아프리카공화국, 우간다, 잠비아, 짐바브웨 등 12개국 이상에서 챗봇을 확대하고 있다. 한국은 이번 대상에서 빠졌다.

메타 AI는 SNS 플랫폼 앱 검색창에 내장, 이용자가 쉽게 질문하고 답을 구할 수 있다. 예를 들어 이용자들이 레스토랑 추천을 요청하고, 휴가를 계획하거나 새 아파트를 장식하는 데 아이디어를 줄 수 있다.

또 메타 AI는 현재 마이크로소프트(MS)의 '빙'과 구글의 실시간 검색 결과를 통합하는 유일한 챗봇이다.

이미지 생성 기능도 업그레이드했다. 이미지를 애니메이션 GIF로 변환할 수 있으며, 입력 즉시 고해상도 이미지를 빠르게 생성한다.

마크 저커버그 메타 CEO는 "메타 AI는 이용자 질문에 답하고 애니메이션을 만들고 이미지를 생성할 수 있다"라며 "이제 자유롭게 이용할 수 있는 가장 지능적인 AI 어시스턴트라고 믿는다"라고 말했다.

이외에도 메타는 사용자가 SNS를 통하지 않고 독립형 메타 AI 챗봇에 액세스할 수 있도록 새로운 웹사이트도 오픈했다.

7ce8887fb18107f739ee87e74fee74689ba383f0a56214098031df891814787d

한편 일론 머스크 xAI CEO는 이날 얀 르쿤 메타 AI 수석과학자가 X에 공유한 라마 3 출시 소식에 짧은 반응을 남겼다.

이는 라마 3의 성능이 뛰어나다는 것뿐 아니라, 머스크 CEO 역시 오픈 소스를 추구하기 때문이다. 실제로 그는 지난달 '그록-1.0'을 오픈 소스로 공개했다.

고정닉 2

원본 첨부파일 5본문 이미지 다운로드

전체 댓글 0개

등록순

본문 보기

타인의 권리를 침해하거나 명예를 훼손하는 댓글은 운영원칙 및 관련 법률에 제재를 받을 수 있습니다.
Shift+Enter 키를 동시에 누르면 줄바꿈이 됩니다.

갤러리 리스트
번호	말머리	제목	글쓴이	작성일	조회	추천
2856	설문	주위 눈치 안 보고(어쩌면 눈치 없이) MZ식 '직설 화법' 날릴 것 같은 스타는?	운영자	24/04/29	-	-
242613	공지	특갤 통합 공지 / 댓글 신고,문의 / 차단 해제 요청 [2810]	*특갤용*	23.08.06	36379	41
433260	공지	웬만하면 신문고에 문의 해주시면 차단 풀어드립니다 [1]	*부패하는유전자!!!*	24.03.06	1654	2
363220	공지	선형글 삭제 기준 [6]	*특갤용*	23.10.14	6187	24
412470	공지	레이 커즈와일 신간 6월 25일 발매 [15]	모브	24.01.24	5000	29
375493	공지	필독) 유입 특붕이를 위한 AI 정보글 모음 (01/23) [40]	ㅇㅇ(182.230)	23.11.11	11861	121
373402	공지	직업 비하, 조롱 글 30일 차단됩니다. [50]	*특갤용*	23.11.07	7983	79
385147	공지	구글의 AGI 분류 체계 [15]	ㅇㅇ	23.11.22	7045	30
332612	공지	음모론 삭제 기준을 안내드립니다. [23]	*특갤용*	23.08.25	8112	29
259237	공지	특갤 용어 모음집 [6]	*특갤용*	23.08.09	21185	33
462101	일반	OAI한테 기대컨하지마라	ㅇㅇ(112.220)	15:48	2	0
462100	일반	파급력도르의 모순점	ㅇㅇ(116.120)	15:47	7	0
462099	일반	뭐야 그냥 밈으로 까는거 아니었어?	ㅇㅇ	15:46	16	0
462098	일반	claude한테 또 한소리 들었네	엠창인생막장의끝	15:45	12	0
462097	일반	"Don,t die"-roon - 확정이네 끝났네 게임오바 싹다 임신시켜 [1]	ㅇㅇ	15:44	54	1
462096	일반	알트만은 성능 구라 ㅈㄴ잘친다	ㅇㅇ(112.220)	15:43	15	0
462095	일반	오픈AI소속 모두가 아가리 털어대는게 가장 이해안댐 [5]	ㅇㅇ(180.230)	15:38	89	3
462094	정보	바이든, 청정 에너지 허가 가속 위한 새 규정 발표	ㅇㅇ(182.230)	15:30	37	1
462093	일반	오픈ai폐쇄성 가지고 머라하는데 [2]	ㅇㅇ	15:29	83	0
462092	일반	phi3 mini 아이패드에서 잘 돌아가네	ㅇㅇ(118.223)	15:28	35	0
462091	일반	요시노부카나이 이인간은 진짜 같은인간맞냐 ㅋㅋ [2]	ㅇㅇ(59.27)	15:27	92	0
462090	일반	벤치마크딸 모델들이 병신이라고 하기엔 [2]	ㅇㅇ(110.145)	15:24	66	0
462089	일반	인간 근육볼때마다 신기하다 ㅋㅋㅋㅋㅋ	ㅇㅇ(59.27)	15:23	50	0
462088	일반	국제 영화제 포스터에 AI를 쓰네 [2]	®	15:22	97	2
462087	일반	환각에 대해 핀트가 좀 잘못 잡힌거 아니냐 얘들아 [5]	ㅇㅇ(110.34)	15:21	75	0
462086	일반	오픈ai 민심 안좋은거 이해 안됨 [6]	ㅇㅇ	15:19	138	0
462085	일반	웹페이지 요약 가능한 ai있음? [2]	ㅇㅇ(112.172)	15:14	62	1
462084	일반	빙하기	ㅇㅇ(182.218)	15:13	40	1
462083	일반	진짜 생각할수록 공룡새끼들 좆같네 [5]	ㅇㅇ(180.69)	15:12	136	0
462082	일반	노동해방 안해도 좋으니까 [1]	ㅇㅇ(117.20)	15:09	76	0
462081	일반	특갤 문학 다봤다 재밌노 ㅋㅋㅋㅋ [2]	비닌	15:07	97	3
462080	일반	라마4나왔으면좋겠다	ㅇㅇ(118.220)	15:06	28	0
462079	일반	죽은 상태가 잠자는거랑 같다면 [5]	ㅇㅇ(211.228)	14:57	115	0
462078	일반	주세요 [1]	ㅇㅇ(1.239)	14:56	28	0
462077	일반	인간이 환각 더 심각함 [2]	125.191(183.101)	14:56	92	1
462076	일반	아래 수학문제 GPT4로 테스트해봄 [3]	ㅇㅇ(222.110)	14:53	133	0
462075	일반	뜌땨 뜌땨땨!!! 우우....트부이따따ㅇl치고시퍼 [4]	ㅇㅇ	14:51	69	0
462074	일반	소라는 걍 동영상싸..개냐	ㅇㅇ(222.110)	14:50	64	0
462073	일반	챗gpt는 수학문제를 왤케 못푸는거임? [7]	ㅇㅇ(125.130)	14:49	170	0
462072	일반	오늘 국제 인공지능 IT 쇼 코엑스 후기 [4]	ㅇㅇ(121.134)	14:45	115	1
462071	정보	MS, AI 전력 수요 증가로 재생 가능 에너지 프로젝트에 14조 투자 [2]	ㅇㅇ(182.230)	14:44	77	1
462070	일반	나만 우울함? [2]	ㅇㅇ(61.80)	14:42	77	0
462069	일반	클로드 한글성능이 ㅆㅅㅌㅊ네	ㅇㅇ(1.234)	14:39	40	0
462068	일반	앤트로픽이 팀원들 다 끌고 나간 시점부터 오픈AI는 끝났지 [6]	ㅇㅇ	14:37	191	3
462067	일반	님들은 인공지능 공부 뭐부터 했음? [6]	ㅇㅇ(112.146)	14:35	101	1
462066	일반	Gpt3.5가 라마3 70b,제미나이1.5이기네 [6]	ㅇㅇ(61.84)	14:35	138	1
462065	일반	그냥 3년간 [10]	ㅇㅇ(58.224)	14:32	139	0
462064	일반	활성화 함수를 학습시키는게 의미가 있나?	ㅇㅇ(211.228)	14:31	31	0
462063	일반	올해 초만해도 OAI 인식 개좋지 않았냐 [4]	ㅇㅇ(61.40)	14:29	120	0
462062	일반	알트만 좆같은 점	ㅇㅇ(119.77)	14:29	63	0
462061	일반	앤트로픽이 대단하긴하네 [5]	ㅇㅇ(112.186)	14:23	179	1