디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[정보] 오픈 소스 ‘미스트랄 7B v0.2’ 출시..."라마 2 능가"

ㅇㅇ(182.230) 2024.04.02 21:20:46
조회 1203 추천 17 댓글 3
														

https://www.aitimes.com/news/articleView.html?idxno=158435

 



7ce88872b68707f739ef82e044ee7764e0e41c98c8df91c4d05cd9cd9ad2f9e77cac



미스트랄 AI가 새로운 오픈 소스 대형언어모델(LLM) '미스트랄 7B v0.2'를 출시했다. 메타의 ‘라마 2’를 뛰어넘는 성능으로, 더 적은 매개변수에서도 성능과 다양성, 효율성을 보여줬다는 평가다.


마크테크포스트는 31일(현지시간) 미스트랄 AI가 🔼‘미스트랄-7B-베이스-v2.0’ 🔼‘미스트랄-7B-인스트럭트-v2.0’ 등을 공개했다고 전했다.


v0.2에서 가장 눈에 띄는 개선 사항 중 하나는 v0.1의 8000개 토큰에서 3만2000개 토큰으로 컨텍스트 창이 확장된 것이다. 이를 통해 모델은 더 긴 텍스트 시퀀스를 처리하고 이해해 문서 요약, 스토리 생성, 긴 형식의 질문 답변에 더 일관되고 상황에 맞는 출력을 생성할 수 있다.


또 미세 조정된 '로프 세타(Rope Theta)' 매개변수를 도입, 광범위한 작업에서 더 정확하고 일관된 출력을 보장한다. v0.2에서는 v0.1에 있었던 슬라이딩 윈도우 주의 사용을 제거함으로써 추론 시간이 빨라지고 계산 요구 사항이 줄어들었다. 


명령어 조정 버전인 ‘미스트랄-7B-인스트럭트-v0.2’는 특정 작업과 애플리케이션에 맞게 미세조정하고 최적화할 수 있다.


이 외에도 미스트랄 7B v0.2는 추론 속도를 향상하고 메모리 소비를 줄이기 위해 GQA(Grouped-Query Attention)를 도입했으며, 까다롭거나 영역별 어휘가 있는 경우에도 정확하고 일관된 출력을 생성할 수 있도록 '바이트-폴백 BPE 토크나이저(Byte-fallback BPE Tokenizer)'를 활용해 모델이 어휘에 포함되지 않은 토큰을 원활하게 처리할 수 있게 했다. 


특히 미스트랄 7B v0.2는 다양한 벤치마크에서 인상적인 성능을 기록한 것으로 나타났다. 73억 매개변수의 미스트랄 7B v0.2는 평가된 모든 작업에서 130억 매개변수의 ‘라마 2 13B’ 모델보다 성능이 뛰어났으며, 340억 매개변수의 ‘라마 1 34B’모델과 비슷한 성능을 보였다. 코딩 영역에서도 미스트랄 7B v0.2는  프로그래밍 작업을 위해 특별히 설계된 모델인 ‘코드라마 7B’의 성능에 접근하며 모델의 다재다능함을 보였다. 


명령어 조정 변형인 미스트랄-7B-인스트럭트-v0.2는 MT-벤치(MT-Bench) 벤치마크에서 다른 모든 7B 명령어 모델을 능가하는 성능을 기록했다. 이는 챗봇, 가상 비서 및 작업 지향 대화 시스템과 같은 애플리케이션에 이상적인 선택될 수 있다는 의미다.


미스트랄 7B v0.2 모델은 연구원, 개발자 및 기업이 제한 없이 사용할 수 있도록 허용되는 아파치 2.0 라이선스에 따라 출시했다. 모델을 다운로드해 로컬로 사용하거나, 다양한 클라우드 플랫폼에 배포하거나, 널리 사용되는 AI 프레임워크 및 라이브러리를 통해 액세스할 수도 있다.


자동등록방지

추천 비추천

17

고정닉 8

원본 첨부파일 1

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2858 설문 SNS로 싸우면 절대 안 질 것 같은 고집 있는 스타는? 운영자 24/05/06 - -
455442 정보 오픈AI, 기업 시장 확장 위해 MS와 경쟁 불사 [2] ㅇㅇ(182.230) 04.13 1290 20
455441 정보 오픈AI, 유출 혐의로 연구원 2명 해고..."효과적인 이타주의 연관" [8] ㅇㅇ(182.230) 04.13 1379 18
455438 정보 메타가 공개한 AGI로 가는 방법, 'V-제파'란 [13] ㅇㅇ(182.230) 04.13 2012 30
455436 정보 메타, AI의 ‘현실 이해' 돕는 오픈 소스 데이터셋 출시 [2] ㅇㅇ(182.230) 04.13 794 13
455435 정보 그록 1.5v 발표 [14] 특술람갤로그로 이동합니다. 04.13 1538 28
455434 정보 "로봇이 일자리를 빼앗는다는 것은 '신화'에 불과" [7] ㅇㅇ(182.230) 04.13 1821 17
455433 정보 아마존 "생성 AI는 인터넷 이후 최고 기술"...앤드류 응 이사회 합류 [4] ㅇㅇ(182.230) 04.13 1054 13
455432 정보 생추어리, 자동차 부품 생산에 AI 로봇 투입 파트너십 [1] ㅇㅇ(182.230) 04.13 461 15
455430 정보 애플, AI 강화 위해 'M4' 칩 조기 업그레이드 [3] ㅇㅇ(182.230) 04.13 1049 18
455428 정보 MS, 군사용 도구로 오픈AI '달리' 판매 시도 [1] ㅇㅇ(182.230) 04.13 180 10
455415 일반 개발자 근들갑보다 특이쭝이들 조울증이 더 꼴보기 실어여 ㅇㅅㅇ [19] ㅇㅇ(122.36) 04.13 1375 41
455397 AI창 샘 알트만 디스곡 만들어 줘 [5] ㅇㅇ갤로그로 이동합니다. 04.13 1314 30
455396 정보 Cognition의 Devin으로 알아보는 AI업계의 과대광고 [17] ㅇㅇ(218.53) 04.13 1559 55
455381 일반 부자들도 역노화 포기한것같다 [10] ㅇㅇ(125.180) 04.13 1893 14
455363 일반 테슬라, 첨단 휴머노이드 로봇 특허 기술 공개 [3] ㅇㅇ(116.120) 04.13 1499 25
455357 일반 와 ㅅㅂ뭐냐 수학성능 ㅈㄴ올랐네 [17] ㅇㅇ(221.160) 04.13 2341 21
455341 일반 오픈ai가 데이터 엄청 긁어 모으고 있네 [3] ㅇㅇ갤로그로 이동합니다. 04.13 1950 26
455340 일반 전 PayPal CEO "gpt5는 정말 놀라운 순간이 될 것" [25] 특술람갤로그로 이동합니다. 04.13 2667 35
455335 일반 Mistral AI CEO "나는 AGI를 믿지 않는다" [10] 특술람갤로그로 이동합니다. 04.13 1890 23
455328 일반 특갤말투로 해달라니까 탈옥됐다 [9] ㅇㅇ(14.36) 04.13 2068 40
455315 일반 이새끼 뭐임?? [11] ㅇㅇ갤로그로 이동합니다. 04.13 1507 23
455278 일반 내가 믿고 거르는 기술소식 4가지 [43] ㅇㅇ(183.106) 04.12 3518 109
455200 정보 하이브리드 소듐 전지 개발…"수 초 만에 급속 충전" [29] 니지카엘갤로그로 이동합니다. 04.12 1977 23
455194 일반 커즈와일 : 자신의 예상보다 기술발전이 빠르게 진행중 [59] 부패하는유전자!!!갤로그로 이동합니다. 04.12 3472 48
455183 일반 GPT 신버전이 클로드 벤치 이겼다며 [6] ㅇㅇ(182.211) 04.12 892 14
455064 정보 MS, 5월 컨퍼런스서 '윈도우 AI 기능' 발표에 초점 [8] ㅇㅇ(182.230) 04.11 1705 17
455143 정보 Rho-1: 모든 토큰이 필요한 것은 아닙니다 [10] 특술람갤로그로 이동합니다. 04.12 1339 18
455126 정보 GPT-4 turbo 0409 공식벤치결과 [12] 특술람갤로그로 이동합니다. 04.12 2236 22
455113 정보 OAI 연구원 2명 정보 유출 혐의로 해고됨 [14] ㅇㅇ(211.59) 04.12 2147 18
455084 정보 [사이언스샷] 꿈의 면역항암제, 줄기세포처럼 회춘해 업그레이드 [8] ㅇㅇ갤로그로 이동합니다. 04.12 1331 20
455165 일반 0409 버전 다른건 몰라도 수학은 꽤 상승폭이 크네 [2] ㅇㅇ(218.154) 04.12 396 14
455158 일반 gpt4 0410 ㄷㄷㄷㄷㄷㄷㄷ [7] ㅇㅇ(182.229) 04.12 800 15
455078 일반 앤드류 응, 아마존 이사회에 합류 [9] ㅇㅇ(116.120) 04.12 1633 15
455076 AI창 그냥 존나 아름답네 [20] ㅇㅇ갤로그로 이동합니다. 04.12 4725 33
455063 정보 구글, '생성 AI 사진 편집' 기능 무료로 확대 [10] ㅇㅇ(182.230) 04.11 2033 16
455061 정보 GPU 배송 2~3개월로 단축..."연말쯤 지연 없어질 것" [5] ㅇㅇ(182.230) 04.11 1659 18
454901 정보 구글 무한 컨텍스트 트랜스포머 발표 [11] 특술람갤로그로 이동합니다. 04.11 2427 22
454792 정보 현재까지 인류가 만든 가장 정확하고 큰 뇌지도 [11] ㅇㅇ(220.118) 04.11 3928 31
454778 정보 전례없는 해상도로 뇌를 스캔하는 초강력 MRI [4] ㅇㅇ(182.230) 04.11 896 17
454739 일반 작년에 내년 4월초까지도 GPT5 안나왔을줄 상상도 못했으면 개추ㅋㅋ [9] ㅇㅇ(121.130) 04.11 2789 46
454712 정보 메타, '라마 3' 대형 버전 매개변수는 1400억개 [7] ㅇㅇ(182.230) 04.10 1842 21
454698 정보 달 표면 티타늄, 맨틀까지 가라앉았다가 분출됐다 [3] ㅇㅇ(182.230) 04.10 1697 18
454689 AI창 Suno 킬러 AI 출시기념 [19] ㅇㅇ갤로그로 이동합니다. 04.10 2875 35
454679 일반 udio 미쳤는데? [22] 디시콘발사대갤로그로 이동합니다. 04.10 2471 20
454676 정보 Suno 킬러, Udio 공식 출사표! (무료 제공 ㅎㄷㄷ) [10] ㅇㅇ(123.100) 04.10 2277 23
454664 일반 gpt터보 0409 성능테스트 결과가 죄다 제각각이네 [3] ㅇㅇ(175.213) 04.10 1204 17
454645 정보 미스트랄 새 모델 오픈소스ㄷㄷㄷ [9] ㅇㅇ(123.100) 04.10 1556 18
454548 일반 코딩은 더 성능 떨어진다 ㄷㄷㄷ [3] ㅇㅇ(121.190) 04.10 3324 20
454498 정보 Gpt4 turbo 0409 코딩점수도 올랐음 [7] 특술람갤로그로 이동합니다. 04.10 1957 22
454437 정보 메타 "AGI 도약 방법 발견...'트랜스포머'와 다른 아키텍처 개발 중 [34] ㅇㅇ(211.59) 04.10 2927 31
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2