엔비디아, 6개월 새 GPU 추론 속도 3배 증가 - 특이점이 온다 마이너 갤러리

특이점이 온다 갤러리
마이너

기술적 특이점에 대해 의논하고 그와 관련된 과학 기술 정보와 소식을 공유하는 갤러리입니다. *갤러리 이름은 동명의 레이 커즈와일의 저서 <특이점이 온다 (The singularity is near)>를 의미합니다.

매니저

특갤용(118wshxhtx5h)

부매니저

ㅇㅇ(hamaster) 부패하는유전자!!!(sansss20…) 은바다(nmra3fmz…)

개설일

2019-08-01

[정보/뉴스] 엔비디아, 6개월 새 GPU 추론 속도 3배 증가

ㅇㅇ(182.230) 2024.03.29 23:41:23

조회 1771 추천 23 댓글 5

https://www.aitimes.com/news/articleView.html?idxno=158372

엔비디아, 6개월 새 GPU 추론 속도 3배 증가…ML퍼프 벤치마크 결과 공개

6개월 사이에 인공지능(AI) 칩의 추론 속도가 무려 3배나 빨라진 것으로 나타났다. 이를 통해 AI 발전이 더 빨라질 것이라는 예상이 가능하게 됐다.벤처비트는 27일(현지시간) ML커먼스가 'ML퍼프(MLPerf) 4.0' 추론 벤치마크 결과를 발표했다고 전했다. 이는 지난해 9월 'ML퍼프 3.1' 결과가 공개된 이후 첫번째 업데이트다. 이번 벤치마크에는 🔼텍스트 요약 벤치마크를 위한 ‘GPT-J 6B’ 🔼LLM에 질문 및 답변(Q&A) 벤치마크를 위해 메타의 오픈 소스 LLM ‘라마 2 70B’ 등이 추가됐다. 또 ML퍼프에는

www.aitimes.com

7ce88875b28007f739ef85e24eee776ac5dd8e49d58e8cb7741503b98f3887e4a2

6개월 사이에 인공지능(AI) 칩의 추론 속도가 무려 3배나 빨라진 것으로 나타났다. 이를 통해 AI 발전이 더 빨라질 것이라는 예상이 가능하게 됐다.

벤처비트는 27일(현지시간) ML커먼스가 'ML퍼프(MLPerf) 4.0' 추론 벤치마크 결과를 발표했다고 전했다.

이는 지난해 9월 'ML퍼프 3.1' 결과가 공개된 이후 첫번째 업데이트다.

이번 벤치마크에는 🔼텍스트 요약 벤치마크를 위한 ‘GPT-J 6B’ 🔼LLM에 질문 및 답변(Q&A) 벤치마크를 위해 메타의 오픈 소스 LLM ‘라마 2 70B’ 등이 추가됐다. 또 ML퍼프에는 처음으로 🔼‘스테이블 디퓨전’을 사용한 이미지 생성 AI에 대한 벤치마크도 포함됐다.

엔비디아는 이번에도 인상적인 결과로 ML퍼프 벤치마크를 장악했다.

‘텐서RT-LLM’ 기술을 사용해 H100 호퍼 GPU의 GPT-J LLM을 통해 텍스트 요약에 대한 추론 성능을 거의 3배 향상한 결과를 만들어 냈다. 텐서RT-LLM은 GPU에서 LLM 추론을 가속화하고 최적화하는 엔비디아의 오픈 소스 소프트웨어다.

7ce88875b28007f739ef85e24fee7765f2e746524f4aed576aca4714a783f7f90350

LLM 추론 벤치마크 테스트 결과 (엔비디아)

데이브 살바토르 엔비디아 가속 컴퓨팅 이사는 “불과 6개월 만에 3배의 성능 향상이 이뤄졌다”라며 “우리 엔지니어링 팀은 호퍼 아키텍처에서 더 많은 성능을 추출할 수 있는 방법을 찾기 위해 계속 노력 중"이라고 강조했다.

지난주 GTC에서 발표한 호퍼 아키텍처의 후속 제품 ‘블랙웰 GPU’에 대한 벤치마크는 수행하지 않았다. 대신 'H200' GPU의 추론 벤치마크 결과를 최초로 공개했다. 추론을 위해 라마 2를 활용할 경우, H200은 H100보다 최대 45% 빨랐다.

한편 인텔은 하바나 AI 가속기 ‘가우디’와 ‘제온’ CPU 기술을 사용해 ML퍼프 4.0 벤치마크에 참여했다.

가우디는 엔비디아 H100의 성능에 미치지 못했다. 하지만 인텔은 "이 정도 성능을 발휘하는 가우디가 엔비디아보다 저렴하기 때문에 충분한 경쟁력을 갖췄다"라고 강조했다.

7ce88875b28007f739ef85ed46ee7765f3efd2d33be8b6fa2cf8bd4f411b7e3807

LLM 추론 벤치마크 테스트 결과 (인텔)

또 5세대 제온 CPU가 이전 4세대 제온 CPU보다 추론 속도가 1.42배 빠른 것으로 나타났다. 구체적으로 GPT-J LLM 텍스트 요약 사용 사례만 보면 5세대 제온이 최대 1.9배 더 빨랐다.

로낙 샤 인텔 제온 AI 제품 이사는 "많은 기업은 AI 전용 인프라는 물론 일반 환경에서도 AI 솔루션을 배포하게 될 것"이라며 "그래서 우리는 AMX 엔진을 통해 강력한 AI 기능과 강력한 범용 기능을 결합하는 CPU를 설계했다"라고 설명했다.

고정닉 6

원본 첨부파일 3본문 이미지 다운로드

전체 댓글 0개

등록순

본문 보기

타인의 권리를 침해하거나 명예를 훼손하는 댓글은 운영원칙 및 관련 법률에 제재를 받을 수 있습니다.
Shift+Enter 키를 동시에 누르면 줄바꿈이 됩니다.

갤러리 리스트
번호	말머리	제목	글쓴이	작성일	조회	추천
2864	설문	비난 여론에도 뻔뻔하게 잘 살 것 같은 스타는?	운영자	24/06/03	-	-
458219	일반	얀르쿤 피셜 "오픈소스 하자고한건 맞는데 라마3 내가 직접만든건 아님" [22]	ㅇㅇ(59.17)	04.21	3341	22
458194	정보/ 정보/뉴스	라마3 챗봇 아레나 근황.. [6]	ㅇㅇ(123.100)	04.21	3512	23
458139	일반	이제 하다하다 야갤 유동 글을 믿네 [8]	Samus	04.20	519	14
458112	정보/ 정보/뉴스	라마3 70b 초당 3000토큰 가능 [7]	noosphere	04.20	2299	23
458089	정보/ 정보/뉴스	(AI겨울)주커버그는 AGI가 멀었다고 생각합니다 [26]	ㅇㅇ(123.100)	04.20	3974	25
458068	일반	403.. 이게 무슨 숫자인지 아시나요? [9]	ㅇㅇ(59.3)	04.20	2783	31
458049	정보/ 정보/뉴스	이너코스모스, 우울증 치료하는 뇌 임플란트 출시...간단한 수술이 장점 [12]	ㅇㅇ(182.230)	04.20	870	23
458019	정보/ 정보/뉴스	젠슨 황: 머지않은 미래 적절가격에 휴머노이드 보급 가능 [41]	noosphere	04.20	3263	26
457991	정보/ 정보/뉴스	한국이 파운데이션 모델 '0'을 기록한 이유는 [15]	ㅇㅇ(182.230)	04.20	2465	25
457974	일반	르쿤햄) 라마3 성능의 비결 [33]	ㅇㅇ(121.133)	04.20	2839	28
457963	정보/ 정보/뉴스	안드레 카파시의 라마3 평가 [11]	ㅇㅇ(182.230)	04.20	2266	26
457932	정보/ 정보/뉴스	OpenAI 포럼 강연 - 민주적 인풋 [11]	ㅁㄴㅇㄹ	04.20	298	14
457928	일반	agi 은근슬쩍 내려치기 하는 놈들이 보이네 [27]	ㅇㅇ(1.237)	04.20	2694	24
457897	일반	AGI가 코앞이 아닌거 같은 이유 [78]	ㅇㅇ(1.234)	04.20	4212	35
457875	일반	르쿤게이도 라마3 기여했다 [8]	ㅇㅇ(123.100)	04.20	1720	23
457850	일반	정치충은 막는게 맞음 [29]	ㅇㅇ(106.101)	04.20	1643	29
457839	일반	르쿤이 메타 LLM팀 아님 [7]	ㅇㅇ(125.191)	04.20	1529	20
457752	일반	한 남자의 어록 모음 [37]	agi2024	04.19	3157	53
457748	일반	???: ㅋㅋ 고작 이딴걸로 좋아하네 [13]	agi2024	04.19	3150	23
457691	일반	이미 로펌에서 GPT-4 로 변론서 작성중이라는데 ㅋㅋㅋㅋㅋ [13]	ㅇㅇ(124.49)	04.19	2723	24
457690	일반	역시 르쿤이형이냐 [12]	ㅇㅇ(59.11)	04.19	1981	56
457641	정보/ 정보/뉴스	(오피셜) 라마3 곧 추가될 기능들 [15]	ㅇㅇ(123.100)	04.19	2624	27
457620	일반	405B 짜리는 GPT-4 터보 걍 좆바르겠노 ㅋㅋ [8]	ㅇㅇ(123.100)	04.19	2137	20
457615	일반	라마3 한국어로 쓰고 실망 ㄴㄴ [4]	ㅇㅇ(123.100)	04.19	2238	19
457613	일반	챗봇아레나 라마3 성능 돌아버렸네 ㅋㅋㅋㅋㅋㅋㅋㅋ [6]	ㅇㅇ(110.145)	04.19	2192	21
457608	정보/ 정보/뉴스	라마3 Chatbot arena 리더보드 순위 미쳤노ㅋㅋㅋ [4]	ㅇㅇ(123.100)	04.19	1251	19
457522	정보/ 정보/뉴스	MS '대화하는 얼굴' VASA-1 작동 영상 [6]	ㅇㅇ	04.19	1203	22
457509	정보/ 정보/뉴스	오늘 있던 Oai 강연 + 앞로 있을 3개 [12]	ㅁㄴㅇㄹ	04.19	1853	23
457496	일반	라마3 400b 성능은 gpt-4보다 훨씬 높을수도 [14]	ㅇㅇ(110.145)	04.19	1669	19
457492	정보/ 정보/뉴스	학계 "딥러닝이 벽에 부딪히고 있습니다" [28]	특술람	04.19	855	13
457481	정보/ 정보/뉴스	chagpt가 특정 단어를 반복하는 이유에 대한 기사가 나왔네 [17]	ㅇㅇ	04.19	2305	24
457455	일반	라마3는 충분히 기뻐할만한 일 아님? [15]	ㅇㅇ(211.44)	04.19	2358	46
457454	일반	라마 매력봐라 ㅅㅂㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ [14]	아디라스	04.19	3405	33
457432	일반	라마3 아이폰에서 구동 성공 [15]	rtOS	04.19	2643	23
457416	일반	라마4 떡밥 [3]	특술람	04.19	1047	22
457400	정보/ 정보/뉴스	스탠포드 피셜)) 분야별 ai발전 속도 인덱스 [19]	lightvector	04.19	2591	27
457399	정보/ 정보/뉴스	메타 실시간 이미지 생성 발표 [9]	특술람	04.19	2737	30
457358	일반	라마3 동양인 혐오하네 ㅇㅇ [19]	ㅇㅇ	04.19	3173	33
457357	일반	솔직히 라마 좃도 안기쁘면 개추 ㅋㅋ [20]	ㅇㅇ(210.205)	04.19	2815	30
457344	AI창 AI창작	수노3) 라마가 부른 노래 만들어봄 [8]	ㅇㅇ	04.19	1242	17
457310	일반	라마3 70b 사용해볼수있게 허깅쳇에 떳다 [7]	ㅇㅇ	04.19	2136	24
457304	정보/ 정보/뉴스	찬양하라ㅡMeta. [4]	ㅇㅇ(123.100)	04.19	1847	28
457303	정보/ 정보/뉴스	라마3에 사용된 인간 주석데이터양 ㄷㄷㄷ [8]	ㅇㅇ(123.100)	04.19	2397	20
457301	정보/ 정보/뉴스	라마2vs3 발전속도 보기.. [7]	ㅇㅇ(123.100)	04.19	1972	21
457300	일반	Meta는 오픈소스 AGI를 위한 데이터센터 구축 중 [12]	모브	04.19	1379	23
457272	정보/ 정보/뉴스	오피셜) GPT4 API 사망 [6]	ㅇㅇ(123.100)	04.19	3206	32
457260	일반	라마3 400b와 4터보 벤치 [8]	ㅇㅇ(175.124)	04.19	1605	16
457254	일반	개념글 빨리 올려라 시발 ㅋㅋ [10]	lightvector	04.19	1860	29
457232	일반	GPT4 초 멸망ㅋㅋㅋㅋ [2]	ㅇㅇ(123.100)	04.19	2611	22
457213	정보/ 정보/뉴스	라마3 벤치마크 [16]	ㅇㅇ(211.59)	04.19	2002	22