엔비디아, 6개월 새 GPU 추론 속도 3배 증가 - 특이점이 온다 마이너 갤러리

특이점이 온다 갤러리
마이너

기술적 특이점에 대해 의논하고 그와 관련된 과학 기술 정보와 소식을 공유하는 갤러리입니다. *갤러리 이름은 동명의 레이 커즈와일의 저서 <특이점이 온다 (The singularity is near)>를 의미합니다.

매니저

특갤용(118wshxhtx5h)

부매니저

ㅇㅇ(hamaster) 부패하는유전자!!!(sansss20…) 은바다(nmra3fmz…)

개설일

2019-08-01

[정보/뉴스] 엔비디아, 6개월 새 GPU 추론 속도 3배 증가

ㅇㅇ(182.230) 2024.03.29 23:41:23

조회 1763 추천 23 댓글 5

https://www.aitimes.com/news/articleView.html?idxno=158372

엔비디아, 6개월 새 GPU 추론 속도 3배 증가…ML퍼프 벤치마크 결과 공개

6개월 사이에 인공지능(AI) 칩의 추론 속도가 무려 3배나 빨라진 것으로 나타났다. 이를 통해 AI 발전이 더 빨라질 것이라는 예상이 가능하게 됐다.벤처비트는 27일(현지시간) ML커먼스가 'ML퍼프(MLPerf) 4.0' 추론 벤치마크 결과를 발표했다고 전했다. 이는 지난해 9월 'ML퍼프 3.1' 결과가 공개된 이후 첫번째 업데이트다. 이번 벤치마크에는 🔼텍스트 요약 벤치마크를 위한 ‘GPT-J 6B’ 🔼LLM에 질문 및 답변(Q&A) 벤치마크를 위해 메타의 오픈 소스 LLM ‘라마 2 70B’ 등이 추가됐다. 또 ML퍼프에는

www.aitimes.com

7ce88875b28007f739ef85e24eee776ac5dd8e49d58e8cb7741503b98f3887e4a2

6개월 사이에 인공지능(AI) 칩의 추론 속도가 무려 3배나 빨라진 것으로 나타났다. 이를 통해 AI 발전이 더 빨라질 것이라는 예상이 가능하게 됐다.

벤처비트는 27일(현지시간) ML커먼스가 'ML퍼프(MLPerf) 4.0' 추론 벤치마크 결과를 발표했다고 전했다.

이는 지난해 9월 'ML퍼프 3.1' 결과가 공개된 이후 첫번째 업데이트다.

이번 벤치마크에는 🔼텍스트 요약 벤치마크를 위한 ‘GPT-J 6B’ 🔼LLM에 질문 및 답변(Q&A) 벤치마크를 위해 메타의 오픈 소스 LLM ‘라마 2 70B’ 등이 추가됐다. 또 ML퍼프에는 처음으로 🔼‘스테이블 디퓨전’을 사용한 이미지 생성 AI에 대한 벤치마크도 포함됐다.

엔비디아는 이번에도 인상적인 결과로 ML퍼프 벤치마크를 장악했다.

‘텐서RT-LLM’ 기술을 사용해 H100 호퍼 GPU의 GPT-J LLM을 통해 텍스트 요약에 대한 추론 성능을 거의 3배 향상한 결과를 만들어 냈다. 텐서RT-LLM은 GPU에서 LLM 추론을 가속화하고 최적화하는 엔비디아의 오픈 소스 소프트웨어다.

7ce88875b28007f739ef85e24fee7765f2e746524f4aed576aca4714a783f7f90350

LLM 추론 벤치마크 테스트 결과 (엔비디아)

데이브 살바토르 엔비디아 가속 컴퓨팅 이사는 “불과 6개월 만에 3배의 성능 향상이 이뤄졌다”라며 “우리 엔지니어링 팀은 호퍼 아키텍처에서 더 많은 성능을 추출할 수 있는 방법을 찾기 위해 계속 노력 중"이라고 강조했다.

지난주 GTC에서 발표한 호퍼 아키텍처의 후속 제품 ‘블랙웰 GPU’에 대한 벤치마크는 수행하지 않았다. 대신 'H200' GPU의 추론 벤치마크 결과를 최초로 공개했다. 추론을 위해 라마 2를 활용할 경우, H200은 H100보다 최대 45% 빨랐다.

한편 인텔은 하바나 AI 가속기 ‘가우디’와 ‘제온’ CPU 기술을 사용해 ML퍼프 4.0 벤치마크에 참여했다.

가우디는 엔비디아 H100의 성능에 미치지 못했다. 하지만 인텔은 "이 정도 성능을 발휘하는 가우디가 엔비디아보다 저렴하기 때문에 충분한 경쟁력을 갖췄다"라고 강조했다.

7ce88875b28007f739ef85ed46ee7765f3efd2d33be8b6fa2cf8bd4f411b7e3807

LLM 추론 벤치마크 테스트 결과 (인텔)

또 5세대 제온 CPU가 이전 4세대 제온 CPU보다 추론 속도가 1.42배 빠른 것으로 나타났다. 구체적으로 GPT-J LLM 텍스트 요약 사용 사례만 보면 5세대 제온이 최대 1.9배 더 빨랐다.

로낙 샤 인텔 제온 AI 제품 이사는 "많은 기업은 AI 전용 인프라는 물론 일반 환경에서도 AI 솔루션을 배포하게 될 것"이라며 "그래서 우리는 AMX 엔진을 통해 강력한 AI 기능과 강력한 범용 기능을 결합하는 CPU를 설계했다"라고 설명했다.

고정닉 6

원본 첨부파일 3본문 이미지 다운로드

전체 댓글 0개

등록순

본문 보기

타인의 권리를 침해하거나 명예를 훼손하는 댓글은 운영원칙 및 관련 법률에 제재를 받을 수 있습니다.
Shift+Enter 키를 동시에 누르면 줄바꿈이 됩니다.

갤러리 리스트
번호	말머리	제목	글쓴이	작성일	조회	추천
2861	설문	어떤 상황이 닥쳐도 지갑 절대 안 열 것 같은 스타는?	운영자	24/05/20	-	-
454031	일반	카이스트 항암 신약 개발 소식.. ㄷㄷ [16]	ㅇㅇ(175.125)	04.09	2083	20
454019	일반	클로드<<<gpt4인데??? [10]	ㅇㅇ(61.79)	04.09	2126	13
453943	정보/ 정보/뉴스	20년 췌장암만 판 美 교수도 놀랐다 “전례 없는 치료 효과” [22]	ㅇㅇ(211.59)	04.09	3526	30
453934	정보/ 정보/뉴스	핀란드 사일로, 북유럽 언어 위한 오픈 소스 LLM '바이킹' 출시 [2]	ㅇㅇ(182.230)	04.08	199	10
453933	정보/ 정보/뉴스	엔비디아, 포춘 '일하기 좋은 기업' 3위 기록 [4]	ㅇㅇ(182.230)	04.08	1346	14
453932	정보/ 정보/뉴스	오픈AI·메타·구글 "협상 대신 소송"...인터넷 데이터 마구잡이로 퍼가 [8]	ㅇㅇ(182.230)	04.08	1641	18
453919	정보/ 정보/뉴스	데미스 허사비스는 팀의 사기를 회복하려고 노력함 [19]	ㅇㅇ(123.100)	04.08	1955	18
453820	일반	특이점이 온다 인스타계정 만들었다 [40]	잇잇잇훈	04.08	2764	23
453779	정보/ 정보/뉴스	과학자 없는 AI 실험실 … 나노소재 직접 개발 [35]	니지카엘	04.08	3426	30
453776	정보/ 정보/뉴스	oai 소라팀 연구원"소라는 비디오의 gpt1" [20]	ㅇㅇ(211.59)	04.08	3002	26
453773	일반	Ai 발전정체가 계속될 가능성이 높은이유 (삭제업) [47]	ㅇㅇ(118.129)	04.08	3886	45
453735	정보/ 정보/뉴스	GPT한계 지적하던 트위터인 1만달러 현상금 결과.. [21]	ㅇㅇ(123.100)	04.08	3234	31
453679	정보/ 정보/뉴스	컴퓨터비전의 GPT 모먼트가 왔다 (VAR) [39]	ㅇㅇ(123.100)	04.08	3156	32
453678	정보/ 정보/뉴스	생각의 시각화는 대규모 언어 모델에서 공간 추론을 이끌어냅니다. [10]	ㅇㅇ(125.191)	04.08	356	10
453653	일반	형님들 suno ai랑 ai휴먼 합성해봤습니다 [21]	레커(125.176)	04.07	3207	19
453643	정보/ 정보/뉴스	MoD: 트랜스포머 기반 언어 모델 최적화를 위한 접근법 [8]	ㅇㅇ(182.230)	04.07	1226	20
453629	정보/ 정보/뉴스	AI 학습 데이터 시장 급속 확대..."단어에 1000개 당 1달러" [5]	ㅇㅇ(182.230)	04.07	2113	17
453625	정보/ 정보/뉴스	MS·퀀티넘 "큐비트 안정화 성공..."양자 컴퓨팅 상용화 진입" [17]	ㅇㅇ(182.230)	04.07	2250	31
453403	정보/ 정보/뉴스	인류의 독특한 지능 수준을 설명하는 데 규모가 필요한 전부 [42]	특술람	04.06	3865	21
453528	일반	알트만 피셜 과도기 기간 2주라네 [41]	ㅇㅇ	04.07	4394	41
453492	일반	역노화 실험 내년부터 시작한다는듯 [27]	ㅇㅇ(112.168)	04.07	4499	39
453485	일반	전 테슬라 연구원"fsd 차기 버전은 인간과 소통할 수 있는 agi 버전 [14]	ㅇㅇ(211.59)	04.07	1778	16
453484	일반	oai 연구원"영상 생성은 모든 것을 시뮬레이션 하여 agi로 이어질것" [28]	ㅇㅇ(211.59)	04.07	3306	32
453475	정보/ 정보/뉴스	"화산지대 암석 균열 속 열 흐름이 생명 기원 물질 생성 촉진" [3]	ㅇㅇ(182.230)	04.07	1622	20
453458	일반	샘알트먼 & 사티나 나텔라 인터뷰 영상 [6]	ㅇㅇ(211.107)	04.07	2159	29
453448	일반	싹다구속시켜.씨발.feel the agi.씹새끼들.꽉잡아라.노동시켜.노동 [34]	약중독고앵이	04.07	4278	93
453434	역노화	알츠하이머 치료제, 집에서 맞으며 관리하는 시대 열린다 [12]	ㅇㅇ	04.07	1471	16
453431	일반	게임오바네 [13]	ㅇㅇ	04.07	3810	60
453409	정보/ 정보/뉴스	알트먼, '챗GPT 전용 기기' 제조 위해 1.4조 모금 중 [15]	ㅇㅇ(182.230)	04.06	2835	36
453377	일반	특이점으로 본 조1선붕당의 이해 [20]	et	04.06	2376	63
453184	정보/ 정보/뉴스	"빅뱅 10억년 후, 우주의 시간은 '5배' 느렸다" [13]	ㅇㅇ(182.230)	04.06	3082	25
453180	정보/ 정보/뉴스	람다, 'H100' GPU 담보로 6500억 대출 받아 [11]	ㅇㅇ(182.230)	04.06	1888	23
453110	일반	아니 시발 이왜진? 작곡가들 쵸--비상!!!!!! [36]	ㅇㅇ(222.118)	04.05	5562	44
452887	정보/ 정보/뉴스	염색체 말단 '텔로미어' 메커니즘 규명…"항암 치료 전략에 도움" [24]	ㅇㅇ(182.230)	04.05	3523	23
452990	일반	인간 중위 데이터과학자를 능가하는 ai [17]	특술람	04.05	3525	28
452935	일반	"어이 샘! 오늘 트위터 근들갑 차례는 너라고!" [27]	ㅇㅇ	04.05	3660	40
452927	일반	AI 일상화에 7100억원 투입···AI 혁명으로 한국 구조적 위기 극복 [32]	Varian■Wrynn	04.05	3085	25
452894	정보/ 정보/뉴스	SKT, OAI 미세조정 서비스 이용해 큰 효과 [10]	ㅇㅇ(123.100)	04.05	1965	17
452889	정보/ 정보/뉴스	인간 뇌 모방한 '뉴로모픽 신경망', 컴퓨팅 난제 해결했다 [9]	ㅇㅇ(182.230)	04.05	2136	22
452884	정보/ 정보/뉴스	욱한 마음 누르는 뇌 원리 찾았다…'감정 조절' 치료 가능할까 [10]	ㅇㅇ(182.230)	04.05	2440	25
452876	정보/ 정보/뉴스	Cohere, 강력한 오픈소스 LLM 공개(한국어 떡상) [8]	ㅇㅇ(118.235)	04.05	2366	24
452868	정보/ 정보/뉴스	KAIST, 소비 전력 15배 줄이는 뉴로모픽 반도체 메모리 소자 개발 [3]	ㅇㅇ(182.230)	04.05	309	10
452855	일반	중력 너머 우주서…인류 구할 ‘신약 개발 상용화’ 첫발 [31]	ㅇㅇ	04.05	2236	25
452754	일반	나 이상한게 보여.. [28]	ㅇㅇ(1.244)	04.04	4767	31
452727	정보/ 정보/뉴스	오픈ai가 투자한 자율주행 개발 회사가 운영을 중단함 [22]	ㅇㅇ(211.59)	04.04	3649	22
452596	일반	美 연구진 “챗GPT4, 임상 추론에서 의사보다 뛰어난 능력 보여” [61]	ㅇㅇ(1.239)	04.04	3584	21
452509	정보/ 정보/뉴스	마소 기록상 가장 신뢰할 수 있는 논리적 큐비트를 시연 [17]	ㅇㅇ	04.03	3420	23
452500	정보/ 정보/뉴스	Stable Audio 2.0 발표 [20]	ㅇㅇ(125.191)	04.03	3233	24
452470	정보/ 정보/뉴스	삼성전자, 오픈AI 진영 합류 결정… AI 반도체 ‘드림팀’ 꾸린다 [54]	ㅇㅇ(211.59)	04.03	4562	45
452260	정보/ 정보/뉴스	로건GPT, 구글 제미니팀 입사 [5]	ㅇㅇ(123.100)	04.03	2995	22