디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[정보] 메타, '라마 3' 소형 버전 출시...머스크 "나쁘지 않아"

ㅇㅇ(182.230) 2024.04.19 19:57:32
조회 341 추천 2 댓글 3
														

https://www.aitimes.com/news/articleView.html?idxno=158943

 



7ce8887fb18107f739ee86ec44ee776530687cda330f31ae595a75c4649f9c3911dc8f



메타가 오픈 소스 대형언어모델(LLM) ‘라마 3’ 중 소형 버전 2개를 공개했다. 이에 대해 일론 머스크 테슬라 CEO는  X(트위터)에 “나쁘지 않다(Not bad)”라고 평가했다.


메타가 18일(현지시간) 라마 3 시리즈 중 매개변수 80억개(8B)와 700억개(70B)의 소형 버전을 공개했다. 메타는 매개변수 4000억개(400B)의 가장 큰 버전도 개발하고 있다고 밝혔다.


라마 3는 사전 훈련과 미세조정 과정을 고도화, 성능이 대폭 향상됐다. 사전 훈련을 위해 데이터셋의 양을 늘리고, 필터링 과정을 거쳐 고품질 데이터만을 선별했다.


특히 15조개 이상의 토큰을 동원, 학습량이 라마 2 대비 7배 이상 많으며 코드량은 4배 더 많다. 다만 데이터셋은 공개하지 않았다.


이후 미세조정에는 일상적인 질문부터 과학·기술·공학·수학(STEM), 코딩, 역사 지식에 이르기까지 다양한 분야의 데이터셋이 사용됐다. 훈련 규모를 확대하는 것은 물론, 고도화된 ‘지시 미세조정(instruction fine-tuning)’ 과정도 진행했다. 


또 라마 3는 라마 2보다 2배 큰 8000토큰의 컨텍스트 길이를 지원한다.


오픈 소스라는 점을 감안, 안전하고 책임감 있는 개발과 사용을 위한 다양한 안전장치도 마련했다고 밝혔다. 전문가와 자동화된 도구를 활용한 레드팀 테스트를 통해 부적절한 답변의 가능성을 최소화했다고 전했다.


메타는 이번에 공개한 두가지 크기의 라마 3 버전이 다양한 벤치마크 테스트에서 구글의 '젬마'나 '제미나이 프로 1.5', 미스트랄 AI의 '미스트랄 7B', 엔트로픽의 '클로드 3 소네트'와 같은 모델들을 능가한다고 주장했다.



7ce8887fb18107f739ee86ec45ee7764f36d212f6add555e0e6b243100cfbe3455de



라마 3는 객관식 문제(MMLU)와 코딩(HumanEval)에는 강하지만, 70B의 경우 수학 단어 문제(MATH) 해결이나 대학원생 수준의 객관식 문제(GPQA)에서는 제미나이 프로 1.5에 떨어졌다. 


특히 인간 선호도에서 경쟁 모델을 앞서는 것으로 알려졌다.


조언 요청, 브레인스토밍, 분류, 비공개 질문 답변, 코딩, 창의적인 글쓰기, 추출, 공개 질문 답변, 추론, 재작성 및 요약 등 12가지 주요 사용 사례를 포함한 1800개 프롬프트 구축 데이터셋에 대한 인간 평가에서 오픈AI의 'GPT-3.5', 미스트랄 7B, 클로드 3 소네트보다 높게 평가됐다.



7ce8887fb18107f739ee86ec43ee776413320aeaeeb8c64fb96a10b9c6db32fb44



허깅페이스에 따르면, 라마 3는 공개 후 몇시간만에 LLM 리더보드 1위에 오르며 역대 가장 빠른 1위 달성 기록을 세웠다.


또 이전 라마 1과 2를 기반으로 3만개 이상의 새로운 모델이 출시됐으며, 라마 2 모델은 1700억번 다운로드됐다는 통계치도 공개해 눈길을 모았다. 


다만 라마 3는 완전한 오픈 소스가 아니다. 연구용 및 상업용으로 모두 사용할 수 있지만, 개발자가 다른 생성 모델을 훈련하기 위해 모델을 사용하는 것을 금지한다.



7ce8887fb18107f739ee86ec40ee706dcf1e816c1d4a63e26c5b0e7143c28fcafe3cb0



한편 메타는 이날 최신 라마 3로 구동되는 멀티모달 챗봇 ‘메타 AI(Meta AI)’를 페이스북, 인스타그램, 왓츠앱, 메신저 등에 출시한다고 밝혔다. 


지난해 9월 미국에서 베타 버전으로 선보인 지 7개월 만이다. 메타는 현재 호주, 캐나다, 가나, 자메이카, 말라위, 뉴질랜드, 나이지리아, 파키스탄, 싱가포르, 남아프리카공화국, 우간다, 잠비아, 짐바브웨 등 12개국 이상에서 챗봇을 확대하고 있다. 한국은 이번 대상에서 빠졌다.


메타 AI는 SNS 플랫폼 앱 검색창에 내장, 이용자가 쉽게 질문하고 답을 구할 수 있다. 예를 들어 이용자들이 레스토랑 추천을 요청하고, 휴가를 계획하거나 새 아파트를 장식하는 데 아이디어를 줄 수 있다.


또 메타 AI는 현재 마이크로소프트(MS)의 '빙'과 구글의 실시간 검색 결과를 통합하는 유일한 챗봇이다.


이미지 생성 기능도 업그레이드했다. 이미지를 애니메이션 GIF로 변환할 수 있으며, 입력 즉시 고해상도 이미지를 빠르게 생성한다.


마크 저커버그 메타 CEO는 "메타 AI는 이용자 질문에 답하고 애니메이션을 만들고 이미지를 생성할 수 있다"라며 "이제 자유롭게 이용할 수 있는 가장 지능적인 AI 어시스턴트라고 믿는다"라고 말했다.


이외에도 메타는 사용자가 SNS를 통하지 않고 독립형 메타 AI 챗봇에 액세스할 수 있도록 새로운 웹사이트도 오픈했다.



7ce8887fb18107f739ee87e74fee74689ba383f0a56214098031df891814787d



한편 일론 머스크 xAI CEO는 이날 얀 르쿤 메타 AI 수석과학자가 X에 공유한 라마 3 출시 소식에 짧은 반응을 남겼다.


이는 라마 3의 성능이 뛰어나다는 것뿐 아니라, 머스크 CEO 역시 오픈 소스를 추구하기 때문이다. 실제로 그는 지난달  '그록-1.0'을 오픈 소스로 공개했다. 




자동등록방지

추천 비추천

2

고정닉 2

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2856 설문 주위 눈치 안 보고(어쩌면 눈치 없이) MZ식 '직설 화법' 날릴 것 같은 스타는? 운영자 24/04/29 - -
242613 공지 특갤 통합 공지 / 댓글 신고,문의 / 차단 해제 요청 [2810] 특갤용갤로그로 이동합니다. 23.08.06 36379 41
433260 공지 웬만하면 신문고에 문의 해주시면 차단 풀어드립니다 [1] 부패하는유전자!!!갤로그로 이동합니다. 24.03.06 1654 2
363220 공지 선형글 삭제 기준 [6] 특갤용갤로그로 이동합니다. 23.10.14 6187 24
412470 공지 레이 커즈와일 신간 6월 25일 발매 [15] 모브갤로그로 이동합니다. 24.01.24 5000 29
375493 공지 필독) 유입 특붕이를 위한 AI 정보글 모음 (01/23) [40] ㅇㅇ(182.230) 23.11.11 11861 121
373402 공지 직업 비하, 조롱 글 30일 차단됩니다. [50] 특갤용갤로그로 이동합니다. 23.11.07 7983 79
385147 공지 구글의 AGI 분류 체계 [15] ㅇㅇ갤로그로 이동합니다. 23.11.22 7045 30
332612 공지 음모론 삭제 기준을 안내드립니다. [23] 특갤용갤로그로 이동합니다. 23.08.25 8112 29
259237 공지 특갤 용어 모음집 [6] 특갤용갤로그로 이동합니다. 23.08.09 21185 33
462101 일반 OAI한테 기대컨하지마라 ㅇㅇ(112.220) 15:48 2 0
462100 일반 파급력도르의 모순점 ㅇㅇ(116.120) 15:47 7 0
462099 일반 뭐야 그냥 밈으로 까는거 아니었어? ㅇㅇ갤로그로 이동합니다. 15:46 16 0
462098 일반 claude한테 또 한소리 들었네 엠창인생막장의끝갤로그로 이동합니다. 15:45 12 0
462097 일반 "Don,t die"-roon - 확정이네 끝났네 게임오바 싹다 임신시켜 [1] ㅇㅇ갤로그로 이동합니다. 15:44 54 1
462096 일반 알트만은 성능 구라 ㅈㄴ잘친다 ㅇㅇ(112.220) 15:43 15 0
462095 일반 오픈AI소속 모두가 아가리 털어대는게 가장 이해안댐 [5] ㅇㅇ(180.230) 15:38 89 3
462094 정보 바이든, 청정 에너지 허가 가속 위한 새 규정 발표 ㅇㅇ(182.230) 15:30 37 1
462093 일반 오픈ai폐쇄성 가지고 머라하는데 [2] ㅇㅇ갤로그로 이동합니다. 15:29 83 0
462092 일반 phi3 mini 아이패드에서 잘 돌아가네 ㅇㅇ(118.223) 15:28 35 0
462091 일반 요시노부카나이 이인간은 진짜 같은인간맞냐 ㅋㅋ [2] ㅇㅇ(59.27) 15:27 92 0
462090 일반 벤치마크딸 모델들이 병신이라고 하기엔 [2] ㅇㅇ(110.145) 15:24 66 0
462089 일반 인간 근육볼때마다 신기하다 ㅋㅋㅋㅋㅋ ㅇㅇ(59.27) 15:23 50 0
462088 일반 국제 영화제 포스터에 AI를 쓰네 [2] ®갤로그로 이동합니다. 15:22 97 2
462087 일반 환각에 대해 핀트가 좀 잘못 잡힌거 아니냐 얘들아 [5] ㅇㅇ(110.34) 15:21 75 0
462086 일반 오픈ai 민심 안좋은거 이해 안됨 [6] ㅇㅇ갤로그로 이동합니다. 15:19 138 0
462085 일반 웹페이지 요약 가능한 ai있음? [2] ㅇㅇ(112.172) 15:14 62 1
462084 일반 빙하기 ㅇㅇ(182.218) 15:13 40 1
462083 일반 진짜 생각할수록 공룡새끼들 좆같네 [5] ㅇㅇ(180.69) 15:12 136 0
462082 일반 노동해방 안해도 좋으니까 [1] ㅇㅇ(117.20) 15:09 76 0
462081 일반 특갤 문학 다봤다 재밌노 ㅋㅋㅋㅋ [2] 비닌갤로그로 이동합니다. 15:07 97 3
462080 일반 라마4나왔으면좋겠다 ㅇㅇ(118.220) 15:06 28 0
462079 일반 죽은 상태가 잠자는거랑 같다면 [5] ㅇㅇ(211.228) 14:57 115 0
462078 일반 주세요 [1] ㅇㅇ(1.239) 14:56 28 0
462077 일반 인간이 환각 더 심각함 [2] 125.191(183.101) 14:56 92 1
462076 일반 아래 수학문제 GPT4로 테스트해봄 [3] ㅇㅇ(222.110) 14:53 133 0
462075 일반 뜌땨 뜌땨땨!!! 우우....트부이따따ㅇl치고시퍼 [4] ㅇㅇ갤로그로 이동합니다. 14:51 69 0
462074 일반 소라는 걍 동영상싸..개냐 ㅇㅇ(222.110) 14:50 64 0
462073 일반 챗gpt는 수학문제를 왤케 못푸는거임? [7] ㅇㅇ(125.130) 14:49 170 0
462072 일반 오늘 국제 인공지능 IT 쇼 코엑스 후기 [4] ㅇㅇ(121.134) 14:45 115 1
462071 정보 MS, AI 전력 수요 증가로 재생 가능 에너지 프로젝트에 14조 투자 [2] ㅇㅇ(182.230) 14:44 77 1
462070 일반 나만 우울함? [2] ㅇㅇ(61.80) 14:42 77 0
462069 일반 클로드 한글성능이 ㅆㅅㅌㅊ네 ㅇㅇ(1.234) 14:39 40 0
462068 일반 앤트로픽이 팀원들 다 끌고 나간 시점부터 오픈AI는 끝났지 [6] ㅇㅇ갤로그로 이동합니다. 14:37 191 3
462067 일반 님들은 인공지능 공부 뭐부터 했음? [6] ㅇㅇ(112.146) 14:35 101 1
462066 일반 Gpt3.5가 라마3 70b,제미나이1.5이기네 [6] ㅇㅇ(61.84) 14:35 138 1
462065 일반 그냥 3년간 [10] ㅇㅇ(58.224) 14:32 139 0
462064 일반 활성화 함수를 학습시키는게 의미가 있나? ㅇㅇ(211.228) 14:31 31 0
462063 일반 올해 초만해도 OAI 인식 개좋지 않았냐 [4] ㅇㅇ(61.40) 14:29 120 0
462062 일반 알트만 좆같은 점 ㅇㅇ(119.77) 14:29 63 0
462061 일반 앤트로픽이 대단하긴하네 [5] ㅇㅇ(112.186) 14:23 179 1
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2