디시인사이드 갤러리

마이너 갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[정보/뉴스] 엔비디아, 6개월 새 GPU 추론 속도 3배 증가

ㅇㅇ(182.230) 2024.03.29 23:41:23
조회 1765 추천 23 댓글 5
														

https://www.aitimes.com/news/articleView.html?idxno=158372

 



7ce88875b28007f739ef85e24eee776ac5dd8e49d58e8cb7741503b98f3887e4a2



6개월 사이에 인공지능(AI) 칩의 추론 속도가 무려 3배나 빨라진 것으로 나타났다. 이를 통해 AI 발전이 더 빨라질 것이라는 예상이 가능하게 됐다.


벤처비트는 27일(현지시간) ML커먼스가 'ML퍼프(MLPerf) 4.0' 추론 벤치마크 결과를 발표했다고 전했다.


이는 지난해 9월 'ML퍼프 3.1' 결과가 공개된 이후 첫번째 업데이트다.


이번 벤치마크에는 🔼텍스트 요약 벤치마크를 위한 ‘GPT-J 6B’ 🔼LLM에 질문 및 답변(Q&A) 벤치마크를 위해 메타의 오픈 소스 LLM ‘라마 2 70B’ 등이 추가됐다. 또 ML퍼프에는 처음으로 🔼‘스테이블 디퓨전’을 사용한 이미지 생성 AI에 대한 벤치마크도 포함됐다.


엔비디아는 이번에도 인상적인 결과로 ML퍼프 벤치마크를 장악했다.


‘텐서RT-LLM’ 기술을 사용해 H100 호퍼 GPU의 GPT-J LLM을 통해 텍스트 요약에 대한 추론 성능을 거의 3배 향상한 결과를 만들어 냈다. 텐서RT-LLM은 GPU에서 LLM 추론을 가속화하고 최적화하는 엔비디아의 오픈 소스 소프트웨어다.



7ce88875b28007f739ef85e24fee7765f2e746524f4aed576aca4714a783f7f90350

LLM 추론 벤치마크 테스트 결과 (엔비디아)



데이브 살바토르 엔비디아 가속 컴퓨팅 이사는 “불과 6개월 만에 3배의 성능 향상이 이뤄졌다”라며 “우리 엔지니어링 팀은 호퍼 아키텍처에서 더 많은 성능을 추출할 수 있는 방법을 찾기 위해 계속 노력 중"이라고 강조했다.

지난주 GTC에서 발표한 호퍼 아키텍처의 후속 제품 ‘블랙웰 GPU’에 대한 벤치마크는 수행하지 않았다. 대신 'H200' GPU의 추론 벤치마크 결과를 최초로 공개했다. 추론을 위해 라마 2를 활용할 경우, H200은 H100보다 최대 45% 빨랐다.

한편 인텔은 하바나 AI 가속기 ‘가우디’와 ‘제온’ CPU 기술을 사용해 ML퍼프 4.0 벤치마크에 참여했다.

가우디는 엔비디아 H100의 성능에 미치지 못했다. 하지만 인텔은 "이 정도 성능을 발휘하는 가우디가 엔비디아보다 저렴하기 때문에 충분한 경쟁력을 갖췄다"라고 강조했다.


7ce88875b28007f739ef85ed46ee7765f3efd2d33be8b6fa2cf8bd4f411b7e3807

LLM 추론 벤치마크 테스트 결과 (인텔)



또 5세대 제온 CPU가 이전 4세대 제온 CPU보다 추론 속도가 1.42배 빠른 것으로 나타났다. 구체적으로 GPT-J LLM 텍스트 요약 사용 사례만 보면 5세대 제온이 최대 1.9배 더 빨랐다.

로낙 샤 인텔 제온 AI 제품 이사는 "많은 기업은 AI 전용 인프라는 물론 일반 환경에서도 AI 솔루션을 배포하게 될 것"이라며 "그래서 우리는 AMX 엔진을 통해 강력한 AI 기능과 강력한 범용 기능을 결합하는 CPU를 설계했다"라고 설명했다.

자동등록방지

추천 비추천

23

고정닉 6

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 말머리 제목 글쓴이 작성일 조회 추천
2863 설문 시세차익 부러워 부동산 보는 눈 배우고 싶은 스타는? 운영자 24/05/27 - -
463751 일반 왔네 ㅇㅇ [2] agi2024갤로그로 이동합니다. 05.07 111 0
463750 일반 진짜그정도임? [3] ㅇㅇ(14.53) 05.07 185 0
463749 일반 진짜 에이전트 도입하면 존나 무섭겠노 ㅋㅋ ㅇㅇ(58.29) 05.07 81 1
463747 일반 GPT2코딩차이 ㅈ된다 gpt3.5→4간만큼 차이나네 ㅇㅇ(59.11) 05.07 102 1
463746 일반 일단 추론문제 문지기는 이거임 ㅇㅇ(122.34) 05.07 57 0
463745 일반 아니 별차이 없다는애들은 도대체 멀 하길래 안느껴지는거냐 ㅇㅇ(175.213) 05.07 78 1
463742 일반 also gpt2 일단 확실한 거는 [7] ㅇㅇ(125.137) 05.07 3912 16
463741 일반 특들갑떨지마 이새끼들아!! ㅇㅇ(180.228) 05.07 48 0
463740 일반 특갤만 봐도 전유물 확실한 거 보이지? ㅋㅋㅋ [5] ㅇㅇ(121.134) 05.07 212 0
463738 일반 뭐임 엊그제만해도 겨울이라더니 ㅇㅇ(14.7) 05.07 52 0
463737 일반 gpt2 코딩 존나 잘함 개고수임 ㅇㅇ(1.239) 05.07 104 0
463736 일반 걍 이거 코딩 부분에서 답변 비교 자체가 안됨 [2] ㅇㅇ(125.137) 05.07 167 0
463735 일반 완장!!! also가 뭔데 이거 정보 올라온거부터 념글 보내봐 [1] ㅇㅇ갤로그로 이동합니다. 05.07 116 0
463734 일반 gpt-4 와 also gpt2 비교. 진짜 지리긴 함 ㅇㅇ ㅇㅇ(125.137) 05.07 225 2
463733 일반 오 레전드 매치 떤냐? [4] ㅇㅋ갤로그로 이동합니다. 05.07 215 0
463732 일반 나도 also테스트 해봤는데 [2] ㅇㅇ(122.34) 05.07 145 0
463731 일반 아레나 이거 사용량 제한 없나? [2] ㅇㅇ(175.214) 05.07 124 0
463730 일반 gpt-5 부터 진정한 AI시대 개막 같다. [1] 00(112.153) 05.07 132 0
463729 일반 gpt2 써보려고 한건데 한국인 인터넷말투는 제미니프로가 걍 압도적이네 [1] ㅇㅇ(59.17) 05.07 125 0
463728 일반 역노화 관련 궁금한 점 ㅇㅇ갤로그로 이동합니다. 05.07 94 0
463726 일반 아니 챗봇 아레나 개꿀 이였네 [3] ㅇㅇ(211.210) 05.07 169 0
463725 일반 지금 also가 더 좋은거 맞지? ㅇㅇ(119.77) 05.07 92 0
463724 일반 얘가 챗gpt라는거 보니까 일단 4가 맞는듯 [2] ㅇㅋ갤로그로 이동합니다. 05.07 135 0
463723 일반 gpt2정체알아냈다 ㅇㅇ(14.53) 05.07 107 0
463721 일반 also gpt2 여친컨셉 미쳤음ㅋㅋ [1] ㅇㅋ갤로그로 이동합니다. 05.07 316 0
463719 일반 also gpt2 쓰는 법 알려준다 [2] ㅇㅇ(121.131) 05.07 346 3
463718 일반 그래서 결론이 뭐냐 [1] ㅇㅇ(211.228) 05.07 111 0
463716 일반 Ai야 빨리 나좀 먹여살려줘 스가돈갤로그로 이동합니다. 05.07 26 0
463715 일반 전유물시작하겠습니다 [3] ㅇㅋ갤로그로 이동합니다. 05.07 103 1
463713 일반 와 씨발 gpt2 개 좋음 섹스 ㅇㅇ(1.239) 05.07 115 0
463712 일반 지금 절대 gpt2 링크 알려주지마라 우리끼리만쓰자 ㅇㅇ [4] ㅇㅇ(60.150) 05.07 372 1
463709 일반 아무리 봐도 2025 agi는 아닌것 같다 ㅇㅇ(14.37) 05.07 119 0
463708 일반 안 알려주는 이유 뭔데 도대체 나도 좀 써보자 dd(106.247) 05.07 51 1
463707 일반 한국같은 나라는 역노화 나오면 전유물화 눈뜨고보지 않을듯... [1] ㅇㅇ갤로그로 이동합니다. 05.07 140 0
463705 일반 좋아봤자 결국 토큰 문제가 관건 아니냐 ㅇㅇ(180.228) 05.07 55 0
463704 일반 어디서 쓰는지 좀 알려주면 안 되냐 [1] dd(106.247) 05.07 134 0
463703 일반 gpt2 also 진짜 개쩐다 사실상 agi 달성 아니냐?? [5] ㅇㅇ(221.142) 05.07 432 0
463702 일반 니들만 알지말고 gpt2 질문답변 좀 많이 올려봐 [1] ㅇㅇ(218.147) 05.07 119 0
463701 일반 also gpt2 링크 [6] Dall리신(121.157) 05.07 392 0
463700 일반 속보) also gpt2 복숭아 테스트 통과 [10] ㅇㅇ(49.143) 05.07 385 0
463698 일반 역노화는 전유물 맞을 수 밖에 없다 ㅇㅇ갤로그로 이동합니다. 05.07 78 0
463697 일반 시발 다 식었다 겨울이다… ㅇㅇ(58.29) 05.07 67 0
463696 역노화 근데 역노화 전유물론 주장하는 사람들 보면... [4] ㅇㅇ갤로그로 이동합니다. 05.07 275 0
463695 일반 also gpt2 어캐씀? 초코냥갤로그로 이동합니다. 05.07 203 0
463694 일반 gpt2갸 뭐임? [7] noosphere갤로그로 이동합니다. 05.07 231 0
463693 일반 ㅅㅂ 네자리수 곱셈 <- 이거 뚫는 llm 없음? [3] ㅇㅇ(58.232) 05.07 128 0
463691 일반 gpt2 걍 4보다 살짝 좋을뿐인데 [8] ㅇㅇ(58.235) 05.07 308 1
463690 일반 모든것의 이론(ToE)이 뭔지아냐? [1] ㅇㅇ(221.164) 05.07 85 0
463689 일반 GPT2 어디서 쓰는 거냐 ㅅㅂ? 카탁프락T갤로그로 이동합니다. 05.07 88 0
463688 일반 also gpt 쓰고 왔다... 좋다 진짜 [6] ㅇㅇ(122.34) 05.07 349 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2