Qwen1.5-110B : 알리바바의 오픈소스 LLM Qwen1.5 - 특이점이 온다 마이너 갤러리

특이점이 온다 갤러리
마이너

기술적 특이점에 대해 의논하고 그와 관련된 과학 기술 정보와 소식을 공유하는 갤러리입니다. *갤러리 이름은 동명의 레이 커즈와일의 저서 <특이점이 온다 (The singularity is near)>를 의미합니다.

매니저

특갤용(118wshxhtx5h)

부매니저

ㅇㅇ(hamaster) 부패하는유전자!!!(sansss20…) 은바다(nmra3fmz…)

개설일

2019-08-01

[정보] Qwen1.5-110B : 알리바바의 오픈소스 LLM Qwen1.5

ㅇㅇ(182.230) 2024.04.29 12:28:41

조회 732 추천 21 댓글 4

https://qwenlm.github.io/blog/qwen1.5-110b/

a15714ab041eb360be3335625683746f0053452dd6a4e289d63760f79c17cd6e58757c58203d1c0ca6189e4f59

- 오픈소스 커뮤니티에서 최근 1000억 개 이상의 매개변수를 가진 대규모 모델들이 쏟아져 나오고 있으며, 벤치마크 평가와 챗봇 분야에서 놀라운 성능을 보여주고 있음

- 알리바바도 Qwen1.5 시리즈의 첫 번째 100B+ 모델인 Qwen1.5-110B를 공개

- 기본 모델 평가에서 Meta-Llama3-70B와 견줄 만한 성능을 달성하였고, MT-Bench와 AlpacaEval 2.0을 포함한 채팅 평가에서 뛰어난 성능을 보여줌

Qwen1.5-110B 모델의 특징

- Qwen1.5-110B는 다른 Qwen1.5 모델들과 유사하며 동일한 Transformer 디코더 아키텍처로 구축됨

- 그룹화된 쿼리 어텐션(GQA)으로 구성되어 모델 서빙에 효율적임

- 32K 토큰의 컨텍스트 길이를 지원하며, 영어, 중국어, 프랑스어, 스페인어, 독일어, 러시아어, 한국어, 일본어, 베트남어, 아랍어 등 다수의 언어를 지원하는 다국어 모델

기본 언어 모델 평가 결과

- 기본 언어 모델에 대한 일련의 평가와 최근 SOTA 언어 모델인 Meta-Llama3-70B 및 Mixtral-8x22B와 비교

- 결과에 따르면 새로운 110B 모델은 기본 능력 면에서 Llama-3-70B 모델과 적어도 경쟁력이 있음

- 이 모델의 경우 사전 학습 및 사후 학습 레시피를 급격히 변경하지 않았으므로, 72B 대비 성능 향상은 모델 크기 증가에서 비롯된 것으로 보임

채팅 모델 평가 결과

- MT-Bench와 AlpacaEval 2.0에서 채팅 모델을 테스트함

- 이전에 공개된 72B 모델에 비해 110B는 두 가지 벤치마크 평가에서 현저히 우수한 성능을 보임

- 평가에서의 일관된 개선은 사후 학습 레시피를 크게 변경하지 않더라도 더 강력하고 큰 기본 언어 모델이 더 나은 채팅 모델로 이어질 수 있음을 나타냄

결론

- Qwen1.5-110B는 Qwen1.5 시리즈 중 가장 큰 모델이며, 시리즈 중 첫 번째로 1000억 개 이상의 매개변수를 가진 모델임

- 최근 공개된 SOTA 모델인 Llama-3-70B와 경쟁력 있는 성능을 보여주며, 72B 모델보다 크게 우수함

- 이는 더 나은 성능을 위해 모델 크기 확장에 여전히 많은 가능성이 있음을 나타냄

- Llama-3의 공개는 데이터를 극도로 큰 규모로 확장하는 것의 중요성을 보여주지만, 향후 공개에서 데이터와 모델 크기를 모두 확장하여 두 세계의 장점을 모두 얻을 수 있을 것이라 믿음

고정닉 6

원본 첨부파일 1

스크린샷 2024-04-29 122602.png

전체 댓글 0개

등록순

본문 보기

타인의 권리를 침해하거나 명예를 훼손하는 댓글은 운영원칙 및 관련 법률에 제재를 받을 수 있습니다.
Shift+Enter 키를 동시에 누르면 줄바꿈이 됩니다.

갤러리 리스트
번호	말머리	제목	글쓴이	작성일	조회	추천
2861	설문	어떤 상황이 닥쳐도 지갑 절대 안 열 것 같은 스타는?	운영자	24/05/20	-	-
477848	일반	밑에 수학문제 [3]	ㅇㅇ(118.47)	05.19	159	0
477847	일반	인공지능 자신이 모른다는걸 아는 방법 [9]	ㅇㅇ(125.143)	05.19	207	0
477846	일반	gpt 혹시 검열 풀렸음?	ㅇㅇ(125.129)	05.19	64	0
477844	일반	gpt4 30만 컨텍스트 확장ㄷㄷ [1]	ㅇㅇ(182.209)	05.19	195	0
477843	일반	노화로 인한 죽음은 강제자살 아니냐	ㅇㅇ(182.212)	05.19	78	0
477842	일반	특이점이 온다 특이점이 온다 특이점이 온다 특이점이 온다 특이점이 온다	ㅇㅇ(1.239)	05.19	50	0
477841	일반	아이러니한게 정렬,검열을 좋아할수록 agi가 곧 등장할거라 믿는거임 [41]	ㅇㅇ(180.230)	05.19	4077	48
477840	일반	근데 진짜 올해도 agi 안나오면 [4]	ㅇㅇ(112.167)	05.19	228	0
477839	일반	여름 GPT5, FIGURE01 휴머노이드 장착 발표할까? [1]	ㅇㅇ(183.105)	05.19	202	0
477837	일반	근본적으로 걱정 안 되는 이유	소소하게	05.19	78	1
477836	일반	인간은 왜 모르는걸 모른다고 말할수 있는가? [9]	ㅇㅇ(125.143)	05.19	197	0
477835	일반	초정렬 사례는 이미 알파제로쯤에 나왔지 않나? [1]	ㅇㅇ(118.47)	05.19	96	0
477834	일반	llm이 모르는걸 모른다고 말하는 순간이 특이점이지 [3]	ㅇㅇ(110.145)	05.19	152	0
477833	일반	ms예상	ㅇㅇ	05.19	58	0
477832	일반	GPT4o 얘 무료는 질문 10개정도받는건가 [9]	ㅇㅇ(125.176)	05.19	294	0
477831	일반	인공지능 정렬이 중요한이유 [3]	ㅇㅇ(125.143)	05.19	150	0
477830	일반	이 영상이 벌써 1년전인데 아직도 비슷한 게임자체가 없다는게 개탄스럽다 [1]	ㅇㅇ(14.35)	05.19	185	0
477829	일반	소설 '특이점이 왔다' 오랜만에 씀 [2]	소설리스트	05.19	145	1
477828	일반	얀르쿤은 그냥 "썸띵 인비저블" 을 주장하는 수준임 [1]	ㅇㅇ(125.143)	05.19	129	0
477827	일반	그래도 확실히 얀르쿤은 AI가 위험하단 이야긴 안 함 [2]	ㅇㅇ	05.19	133	0
477826	일반	무검열 모델이 성능좋고 위해를 가하기도하는건 [3]	ㅇㅇ(114.202)	05.19	79	0
477825	일반	이런 용도면 클로드가 나을까 4o가 나을까 [4]	ㅇㅇ(59.27)	05.19	131	0
477824	일반	예측이 지능의 본질이라면서	ㅇㅇ(125.143)	05.19	61	0
477823	일반	또 겨울이야 시발 [2]	Dall리신(121.157)	05.19	159	0
477822	일반	특갤같은 커뮤니티나 뭐 그런 곳 없나? [12]	ㅇㅇ	05.19	219	0
477819	일반	미라무라티 마지막 발언.. [5]	이런내가특특	05.19	366	0
477817	일반	우연히 검색하면서 깜짝 놀란 부분 [32]	ㅇㅇ(117.20)	05.19	506	0
477816	일반	gpt 가입했는데 버전물어보니까 그냥 4네.. [10]	ㅇㅇ(125.176)	05.19	256	0
477815	일반	이틀뒤 마소행사 별볼일 없으면 [3]	ㅇㅇ	05.19	197	0
477814	일반	사과문제 같이 존나 쉬운데 틀리는 문제를 [3]	ㅇㅇ(14.35)	05.19	139	0
477813	일반	초정렬팀 성과없으면 짤려야지 [2]	ㅇㅇ	05.19	86	1
477812	일반	마소행사랑 애플 갤주신간만 남은건가 [2]	ㅇㅇ(112.186)	05.19	98	0
477811	일반	사과문제 시제를 잘고려해보라하니까 맞추는데	ㅇㅇ(14.35)	05.19	57	0
477810	일반	사과문제 답은 모름 아님?	ㅇㅇ(211.176)	05.19	50	0
477808	일반	이거 보고 특뽕 주입했다 [1]	이런내가특특	05.19	144	0
477807	일반	지금까지 나온 이야기 종합한다 [3]	ㅇㅇ(58.123)	05.19	83	0
477806	일반	agi 2024 5월 렛츠고 ㅋㅋㅋㅋㅋ [1]	Samus	05.19	196	0
477805	일반	Gpt5 : 사과? 풋 ㅋㅋ 당연히 [3]	ㅇㅇ(114.202)	05.19	333	2
477804	일반	추론 능력만 극에 달해도 그게 완성된 agi 아님? [2]	ㅇㅇ(211.184)	05.19	134	0
477803	일반	2025 agi는 물건너간거지? [3]	ㅇㅇ	05.19	242	0
477802	일반	일리야가 자기 대우 안해주니 삐져서 나간거네? [2]	ㅇㅇ(218.147)	05.19	152	1
477801	일반	커뮤에서 흔히 보이는 경계선 지능 유형 1 [8]	ㅇㅇ	05.19	327	5
477800	일반	gpt5 출시하고 떨리는 마음으로 첫 질문했는데 [15]	ㅇㅇ(121.172)	05.19	395	1
477799	일반	누구나 딸깍으로 드라마, 영화 만들게 되면 페미 없는 드라마 만들어야지. [12]	내복맨	05.19	173	3
477798	일반	gpt5 추론성능 대폭향상이었으면 좋겠다 [1]	이런내가특특	05.19	112	0
477797	일반	LLM은.... 정답이여야.... 한다고..... [4]	Samus	05.19	225	0
477796	일반	알트만이 얀르쿤이 하는 말 고대로 한다 생각해보셈 [4]	ㅇㅇ(121.128)	05.19	140	0
477795	일반	제일 좋은 시나리오는 미라가 말한 프론티어 모델이 [8]	이런내가특특	05.19	204	0
477792	일반	싸우지좀 마라 [11]	ㅇㅇ(211.176)	05.19	180	0
477791	일반	얀르쿤이 얘기하는 건 트랜스포머잖아 [12]	ㅇㅇ(211.214)	05.19	205	0