디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[정보] 오픈 소스 ‘미스트랄 7B v0.2’ 출시..."라마 2 능가"

ㅇㅇ(182.230) 2024.04.02 21:20:46
조회 1205 추천 17 댓글 3
														

https://www.aitimes.com/news/articleView.html?idxno=158435

 



7ce88872b68707f739ef82e044ee7764e0e41c98c8df91c4d05cd9cd9ad2f9e77cac



미스트랄 AI가 새로운 오픈 소스 대형언어모델(LLM) '미스트랄 7B v0.2'를 출시했다. 메타의 ‘라마 2’를 뛰어넘는 성능으로, 더 적은 매개변수에서도 성능과 다양성, 효율성을 보여줬다는 평가다.


마크테크포스트는 31일(현지시간) 미스트랄 AI가 🔼‘미스트랄-7B-베이스-v2.0’ 🔼‘미스트랄-7B-인스트럭트-v2.0’ 등을 공개했다고 전했다.


v0.2에서 가장 눈에 띄는 개선 사항 중 하나는 v0.1의 8000개 토큰에서 3만2000개 토큰으로 컨텍스트 창이 확장된 것이다. 이를 통해 모델은 더 긴 텍스트 시퀀스를 처리하고 이해해 문서 요약, 스토리 생성, 긴 형식의 질문 답변에 더 일관되고 상황에 맞는 출력을 생성할 수 있다.


또 미세 조정된 '로프 세타(Rope Theta)' 매개변수를 도입, 광범위한 작업에서 더 정확하고 일관된 출력을 보장한다. v0.2에서는 v0.1에 있었던 슬라이딩 윈도우 주의 사용을 제거함으로써 추론 시간이 빨라지고 계산 요구 사항이 줄어들었다. 


명령어 조정 버전인 ‘미스트랄-7B-인스트럭트-v0.2’는 특정 작업과 애플리케이션에 맞게 미세조정하고 최적화할 수 있다.


이 외에도 미스트랄 7B v0.2는 추론 속도를 향상하고 메모리 소비를 줄이기 위해 GQA(Grouped-Query Attention)를 도입했으며, 까다롭거나 영역별 어휘가 있는 경우에도 정확하고 일관된 출력을 생성할 수 있도록 '바이트-폴백 BPE 토크나이저(Byte-fallback BPE Tokenizer)'를 활용해 모델이 어휘에 포함되지 않은 토큰을 원활하게 처리할 수 있게 했다. 


특히 미스트랄 7B v0.2는 다양한 벤치마크에서 인상적인 성능을 기록한 것으로 나타났다. 73억 매개변수의 미스트랄 7B v0.2는 평가된 모든 작업에서 130억 매개변수의 ‘라마 2 13B’ 모델보다 성능이 뛰어났으며, 340억 매개변수의 ‘라마 1 34B’모델과 비슷한 성능을 보였다. 코딩 영역에서도 미스트랄 7B v0.2는  프로그래밍 작업을 위해 특별히 설계된 모델인 ‘코드라마 7B’의 성능에 접근하며 모델의 다재다능함을 보였다. 


명령어 조정 변형인 미스트랄-7B-인스트럭트-v0.2는 MT-벤치(MT-Bench) 벤치마크에서 다른 모든 7B 명령어 모델을 능가하는 성능을 기록했다. 이는 챗봇, 가상 비서 및 작업 지향 대화 시스템과 같은 애플리케이션에 이상적인 선택될 수 있다는 의미다.


미스트랄 7B v0.2 모델은 연구원, 개발자 및 기업이 제한 없이 사용할 수 있도록 허용되는 아파치 2.0 라이선스에 따라 출시했다. 모델을 다운로드해 로컬로 사용하거나, 다양한 클라우드 플랫폼에 배포하거나, 널리 사용되는 AI 프레임워크 및 라이브러리를 통해 액세스할 수도 있다.


자동등록방지

추천 비추천

17

고정닉 8

원본 첨부파일 1

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2861 설문 어떤 상황이 닥쳐도 지갑 절대 안 열 것 같은 스타는? 운영자 24/05/20 - -
455335 일반 Mistral AI CEO "나는 AGI를 믿지 않는다" [10] 특술람갤로그로 이동합니다. 04.13 1897 23
455328 일반 특갤말투로 해달라니까 탈옥됐다 [9] ㅇㅇ(14.36) 04.13 2104 40
455315 일반 이새끼 뭐임?? [11] ㅇㅇ갤로그로 이동합니다. 04.13 1513 23
455278 일반 내가 믿고 거르는 기술소식 4가지 [43] ㅇㅇ(183.106) 04.12 3546 109
455200 정보 하이브리드 소듐 전지 개발…"수 초 만에 급속 충전" [29] 니지카엘갤로그로 이동합니다. 04.12 1981 23
455194 일반 커즈와일 : 자신의 예상보다 기술발전이 빠르게 진행중 [59] 부패하는유전자!!!갤로그로 이동합니다. 04.12 3484 48
455183 일반 GPT 신버전이 클로드 벤치 이겼다며 [6] ㅇㅇ(182.211) 04.12 902 14
455064 정보 MS, 5월 컨퍼런스서 '윈도우 AI 기능' 발표에 초점 [8] ㅇㅇ(182.230) 04.11 1713 17
455143 정보 Rho-1: 모든 토큰이 필요한 것은 아닙니다 [10] 특술람갤로그로 이동합니다. 04.12 1342 18
455126 정보 GPT-4 turbo 0409 공식벤치결과 [12] 특술람갤로그로 이동합니다. 04.12 2248 22
455113 정보 OAI 연구원 2명 정보 유출 혐의로 해고됨 [14] ㅇㅇ(211.59) 04.12 2151 18
455084 정보 [사이언스샷] 꿈의 면역항암제, 줄기세포처럼 회춘해 업그레이드 [8] ㅇㅇ갤로그로 이동합니다. 04.12 1340 20
455165 일반 0409 버전 다른건 몰라도 수학은 꽤 상승폭이 크네 [2] ㅇㅇ(218.154) 04.12 401 14
455158 일반 gpt4 0410 ㄷㄷㄷㄷㄷㄷㄷ [7] ㅇㅇ(182.229) 04.12 806 15
455078 일반 앤드류 응, 아마존 이사회에 합류 [9] ㅇㅇ(116.120) 04.12 1637 15
455076 AI창 그냥 존나 아름답네 [20] ㅇㅇ갤로그로 이동합니다. 04.12 4758 33
455063 정보 구글, '생성 AI 사진 편집' 기능 무료로 확대 [10] ㅇㅇ(182.230) 04.11 2103 16
455061 정보 GPU 배송 2~3개월로 단축..."연말쯤 지연 없어질 것" [5] ㅇㅇ(182.230) 04.11 1672 18
454901 정보 구글 무한 컨텍스트 트랜스포머 발표 [11] 특술람갤로그로 이동합니다. 04.11 2437 22
454792 정보 현재까지 인류가 만든 가장 정확하고 큰 뇌지도 [11] ㅇㅇ(220.118) 04.11 3952 31
454778 정보 전례없는 해상도로 뇌를 스캔하는 초강력 MRI [4] ㅇㅇ(182.230) 04.11 916 17
454739 일반 작년에 내년 4월초까지도 GPT5 안나왔을줄 상상도 못했으면 개추ㅋㅋ [9] ㅇㅇ(121.130) 04.11 2799 46
454712 정보 메타, '라마 3' 대형 버전 매개변수는 1400억개 [7] ㅇㅇ(182.230) 04.10 1850 21
454698 정보 달 표면 티타늄, 맨틀까지 가라앉았다가 분출됐다 [3] ㅇㅇ(182.230) 04.10 1706 18
454689 AI창 Suno 킬러 AI 출시기념 [19] ㅇㅇ갤로그로 이동합니다. 04.10 2904 35
454679 일반 udio 미쳤는데? [22] 디시콘발사대갤로그로 이동합니다. 04.10 2479 20
454676 정보 Suno 킬러, Udio 공식 출사표! (무료 제공 ㅎㄷㄷ) [10] ㅇㅇ(123.100) 04.10 2292 23
454664 일반 gpt터보 0409 성능테스트 결과가 죄다 제각각이네 [3] ㅇㅇ(175.213) 04.10 1212 17
454645 정보 미스트랄 새 모델 오픈소스ㄷㄷㄷ [9] ㅇㅇ(123.100) 04.10 1562 18
454548 일반 코딩은 더 성능 떨어진다 ㄷㄷㄷ [3] ㅇㅇ(121.190) 04.10 3334 20
454498 정보 Gpt4 turbo 0409 코딩점수도 올랐음 [7] 특술람갤로그로 이동합니다. 04.10 1968 22
454437 정보 메타 "AGI 도약 방법 발견...'트랜스포머'와 다른 아키텍처 개발 중 [34] ㅇㅇ(211.59) 04.10 2941 31
454397 일반 GPT4 터보 레전드 [14] et갤로그로 이동합니다. 04.10 2705 20
454356 일반 Gpt-4 터보0409 AlpacaEval2.0 벤치결과 [12] 특술람갤로그로 이동합니다. 04.10 2248 19
454328 일반 gpt4 터보 수학 후기.. [5] ㅇㅇ(123.100) 04.10 1928 15
454310 정보 새로운 GPT-4 turbo, 엄청나게 개선(특히 수학) [10] ㅇㅇ(123.100) 04.10 2317 19
454302 정보 OpenAI, GPT-4 Turbo 크게 개선된 모델 배포 [8] ㅇㅇ(123.100) 04.10 2398 18
454269 정보 인텔 새로운 칩 Gaudi3 공개 [10] ㅇㅇ(211.59) 04.10 1790 24
454227 정보 스태빌리티 AI, 120억 매개변수 ‘LM 2’ 출시…"sLM 최강" [4] ㅇㅇ(182.230) 04.09 1300 19
454222 정보 "메타·MS도 인종 편향"...빅테크 생성 AI 잇단 구설수 [7] ㅇㅇ(182.230) 04.09 1290 16
454213 정보 머스크 "그록-2.0 다음달까지 훈련...GPU가 부족해" [5] ㅇㅇ(182.230) 04.09 1632 19
454205 정보 구글도 'AI 에이전트' 개발 중...딥마인드에 전담 조직 구성 [1] ㅇㅇ(182.230) 04.09 1030 16
454196 정보 핵융합 근황 [16] 007빵(175.194) 04.09 2958 35
454171 정보 구글 딥마인드 CEO "오픈AI 소라 따라잡기 어려울 것 [30] 특술람갤로그로 이동합니다. 04.09 2818 28
454156 정보 스팀사장 게이브뉴웰이 새로운 뉴럴링크 경쟁자로? [10] ㅇㅇ갤로그로 이동합니다. 04.09 1363 24
454142 일반 돌고 돌아서 이새끼면 개추 ㅋㅋ [1] ㅇㅇ(210.106) 04.09 1813 22
454135 일반 fsd 근황.. [15] ㅇㅇ(210.106) 04.09 1923 21
454085 정보 클로드를 탈옥해 '하이브 마인드'를 구축한 트위터 유저 [34] ㅇㅇ(218.52) 04.09 3363 38
454031 일반 카이스트 항암 신약 개발 소식.. ㄷㄷ [16] ㅇㅇ(175.125) 04.09 2083 20
454019 일반 클로드<<<gpt4인데??? [10] ㅇㅇ(61.79) 04.09 2126 13
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2