디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[정보] Qwen1.5-110B : 알리바바의 오픈소스 LLM Qwen1.5

ㅇㅇ(182.230) 2024.04.29 12:28:41
조회 732 추천 21 댓글 4
														

https://qwenlm.github.io/blog/qwen1.5-110b/



a15714ab041eb360be3335625683746f0053452dd6a4e289d63760f79c17cd6e58757c58203d1c0ca6189e4f59



- 오픈소스 커뮤니티에서 최근 1000억 개 이상의 매개변수를 가진 대규모 모델들이 쏟아져 나오고 있으며, 벤치마크 평가와 챗봇 분야에서 놀라운 성능을 보여주고 있음

- 알리바바도 Qwen1.5 시리즈의 첫 번째 100B+ 모델인 Qwen1.5-110B를 공개

- 기본 모델 평가에서 Meta-Llama3-70B와 견줄 만한 성능을 달성하였고, MT-Bench와 AlpacaEval 2.0을 포함한 채팅 평가에서 뛰어난 성능을 보여줌


Qwen1.5-110B 모델의 특징

- Qwen1.5-110B는 다른 Qwen1.5 모델들과 유사하며 동일한 Transformer 디코더 아키텍처로 구축됨

- 그룹화된 쿼리 어텐션(GQA)으로 구성되어 모델 서빙에 효율적임

- 32K 토큰의 컨텍스트 길이를 지원하며, 영어, 중국어, 프랑스어, 스페인어, 독일어, 러시아어, 한국어, 일본어, 베트남어, 아랍어 등 다수의 언어를 지원하는 다국어 모델


기본 언어 모델 평가 결과

- 기본 언어 모델에 대한 일련의 평가와 최근 SOTA 언어 모델인 Meta-Llama3-70B 및 Mixtral-8x22B와 비교

- 결과에 따르면 새로운 110B 모델은 기본 능력 면에서 Llama-3-70B 모델과 적어도 경쟁력이 있음

- 이 모델의 경우 사전 학습 및 사후 학습 레시피를 급격히 변경하지 않았으므로, 72B 대비 성능 향상은 모델 크기 증가에서 비롯된 것으로 보임


채팅 모델 평가 결과

- MT-Bench와 AlpacaEval 2.0에서 채팅 모델을 테스트함

- 이전에 공개된 72B 모델에 비해 110B는 두 가지 벤치마크 평가에서 현저히 우수한 성능을 보임

- 평가에서의 일관된 개선은 사후 학습 레시피를 크게 변경하지 않더라도 더 강력하고 큰 기본 언어 모델이 더 나은 채팅 모델로 이어질 수 있음을 나타냄


결론

- Qwen1.5-110B는 Qwen1.5 시리즈 중 가장 큰 모델이며, 시리즈 중 첫 번째로 1000억 개 이상의 매개변수를 가진 모델임

- 최근 공개된 SOTA 모델인 Llama-3-70B와 경쟁력 있는 성능을 보여주며, 72B 모델보다 크게 우수함

- 이는 더 나은 성능을 위해 모델 크기 확장에 여전히 많은 가능성이 있음을 나타냄

- Llama-3의 공개는 데이터를 극도로 큰 규모로 확장하는 것의 중요성을 보여주지만, 향후 공개에서 데이터와 모델 크기를 모두 확장하여 두 세계의 장점을 모두 얻을 수 있을 것이라 믿음

자동등록방지

추천 비추천

21

고정닉 6

원본 첨부파일 1

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2861 설문 어떤 상황이 닥쳐도 지갑 절대 안 열 것 같은 스타는? 운영자 24/05/20 - -
477848 일반 밑에 수학문제 [3] ㅇㅇ(118.47) 05.19 159 0
477847 일반 인공지능 자신이 모른다는걸 아는 방법 [9] ㅇㅇ(125.143) 05.19 207 0
477846 일반 gpt 혹시 검열 풀렸음? ㅇㅇ(125.129) 05.19 64 0
477844 일반 gpt4 30만 컨텍스트 확장ㄷㄷ [1] ㅇㅇ(182.209) 05.19 195 0
477843 일반 노화로 인한 죽음은 강제자살 아니냐 ㅇㅇ(182.212) 05.19 78 0
477842 일반 특이점이 온다 특이점이 온다 특이점이 온다 특이점이 온다 특이점이 온다 ㅇㅇ(1.239) 05.19 50 0
477841 일반 아이러니한게 정렬,검열을 좋아할수록 agi가 곧 등장할거라 믿는거임 [41] ㅇㅇ(180.230) 05.19 4077 48
477840 일반 근데 진짜 올해도 agi 안나오면 [4] ㅇㅇ(112.167) 05.19 228 0
477839 일반 여름 GPT5, FIGURE01 휴머노이드 장착 발표할까? [1] ㅇㅇ(183.105) 05.19 202 0
477837 일반 근본적으로 걱정 안 되는 이유 소소하게갤로그로 이동합니다. 05.19 78 1
477836 일반 인간은 왜 모르는걸 모른다고 말할수 있는가? [9] ㅇㅇ(125.143) 05.19 197 0
477835 일반 초정렬 사례는 이미 알파제로쯤에 나왔지 않나? [1] ㅇㅇ(118.47) 05.19 96 0
477834 일반 llm이 모르는걸 모른다고 말하는 순간이 특이점이지 [3] ㅇㅇ(110.145) 05.19 152 0
477833 일반 ms예상 ㅇㅇ갤로그로 이동합니다. 05.19 58 0
477832 일반 GPT4o 얘 무료는 질문 10개정도받는건가 [9] ㅇㅇ(125.176) 05.19 294 0
477831 일반 인공지능 정렬이 중요한이유 [3] ㅇㅇ(125.143) 05.19 150 0
477830 일반 이 영상이 벌써 1년전인데 아직도 비슷한 게임자체가 없다는게 개탄스럽다 [1] ㅇㅇ(14.35) 05.19 185 0
477829 일반 소설 '특이점이 왔다' 오랜만에 씀 [2] 소설리스트갤로그로 이동합니다. 05.19 145 1
477828 일반 얀르쿤은 그냥 "썸띵 인비저블" 을 주장하는 수준임 [1] ㅇㅇ(125.143) 05.19 129 0
477827 일반 그래도 확실히 얀르쿤은 AI가 위험하단 이야긴 안 함 [2] ㅇㅇ갤로그로 이동합니다. 05.19 133 0
477826 일반 무검열 모델이 성능좋고 위해를 가하기도하는건 [3] ㅇㅇ(114.202) 05.19 79 0
477825 일반 이런 용도면 클로드가 나을까 4o가 나을까 [4] ㅇㅇ(59.27) 05.19 131 0
477824 일반 예측이 지능의 본질이라면서 ㅇㅇ(125.143) 05.19 61 0
477823 일반 또 겨울이야 시발 [2] Dall리신(121.157) 05.19 159 0
477822 일반 특갤같은 커뮤니티나 뭐 그런 곳 없나? [12] ㅇㅇ갤로그로 이동합니다. 05.19 219 0
477819 일반 미라무라티 마지막 발언.. [5] 이런내가특특갤로그로 이동합니다. 05.19 366 0
477817 일반 우연히 검색하면서 깜짝 놀란 부분 [32] ㅇㅇ(117.20) 05.19 506 0
477816 일반 gpt 가입했는데 버전물어보니까 그냥 4네.. [10] ㅇㅇ(125.176) 05.19 256 0
477815 일반 이틀뒤 마소행사 별볼일 없으면 [3] ㅇㅇ갤로그로 이동합니다. 05.19 197 0
477814 일반 사과문제 같이 존나 쉬운데 틀리는 문제를 [3] ㅇㅇ(14.35) 05.19 139 0
477813 일반 초정렬팀 성과없으면 짤려야지 [2] ㅇㅇ갤로그로 이동합니다. 05.19 86 1
477812 일반 마소행사랑 애플 갤주신간만 남은건가 [2] ㅇㅇ(112.186) 05.19 98 0
477811 일반 사과문제 시제를 잘고려해보라하니까 맞추는데 ㅇㅇ(14.35) 05.19 57 0
477810 일반 사과문제 답은 모름 아님? ㅇㅇ(211.176) 05.19 50 0
477808 일반 이거 보고 특뽕 주입했다 [1] 이런내가특특갤로그로 이동합니다. 05.19 144 0
477807 일반 지금까지 나온 이야기 종합한다 [3] ㅇㅇ(58.123) 05.19 83 0
477806 일반 agi 2024 5월 렛츠고 ㅋㅋㅋㅋㅋ [1] Samus갤로그로 이동합니다. 05.19 196 0
477805 일반 Gpt5 : 사과? 풋 ㅋㅋ 당연히 [3] ㅇㅇ(114.202) 05.19 333 2
477804 일반 추론 능력만 극에 달해도 그게 완성된 agi 아님? [2] ㅇㅇ(211.184) 05.19 134 0
477803 일반 2025 agi는 물건너간거지? [3] ㅇㅇ갤로그로 이동합니다. 05.19 242 0
477802 일반 일리야가 자기 대우 안해주니 삐져서 나간거네? [2] ㅇㅇ(218.147) 05.19 152 1
477801 일반 커뮤에서 흔히 보이는 경계선 지능 유형 1 [8] ㅇㅇ갤로그로 이동합니다. 05.19 327 5
477800 일반 gpt5 출시하고 떨리는 마음으로 첫 질문했는데 [15] ㅇㅇ(121.172) 05.19 395 1
477799 일반 누구나 딸깍으로 드라마, 영화 만들게 되면 페미 없는 드라마 만들어야지. [12] 내복맨갤로그로 이동합니다. 05.19 173 3
477798 일반 gpt5 추론성능 대폭향상이었으면 좋겠다 [1] 이런내가특특갤로그로 이동합니다. 05.19 112 0
477797 일반 LLM은.... 정답이여야.... 한다고..... [4] Samus갤로그로 이동합니다. 05.19 225 0
477796 일반 알트만이 얀르쿤이 하는 말 고대로 한다 생각해보셈 [4] ㅇㅇ(121.128) 05.19 140 0
477795 일반 제일 좋은 시나리오는 미라가 말한 프론티어 모델이 [8] 이런내가특특갤로그로 이동합니다. 05.19 204 0
477792 일반 싸우지좀 마라 [11] ㅇㅇ(211.176) 05.19 180 0
477791 일반 얀르쿤이 얘기하는 건 트랜스포머잖아 [12] ㅇㅇ(211.214) 05.19 205 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2