디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

주요 클라우드 기업들이 생성형 인공지능(AI) 시대를 위해 엔비디아와..모바일에서 작성

%%%%(211.36) 2024.03.23 19:50:45
조회 119 추천 0 댓글 0
														
7fed8275b58b6af73fed85e246ee776a216d95672fd3de6f72dd9d48ec728b7ef9888f3ff82b8174


엔비디아와 협력 강화 나선 클라우드 기업들…‘블랙웰 GPU’ 품는다

권용만 기자

권용만 기자



입력 2024.03.23 08:00

다른 공유 찾기기사스크랩하기글씨크기인쇄하기

AWS, ‘블랙웰’ 기반 인스턴스와 슈퍼컴 ‘프로젝트 세이바’ 발표
구글·마이크로소프트, 생성형 AI 환경 확장 위해 파트너십 강화
오라클, 엔비디아와 ‘소버린 AI’ 솔루션 위한 협력 확대

아마존 웹 서비스(AWS), 구글 클라우드, 마이크로소프트, 오라클 등 주요 클라우드 기업들이 생성형 인공지능(AI) 시대를 위해 엔비디아와 협력을 강화한다. 이들 클라우드 기업들은 엔비디아의 ‘블랙웰(Blackwell)’ 그래픽처리장치(GPU) 인프라를 활용한 다양한 서비스를 고객에 제공한다는 계획이다.
엔비디아가 18일(현지시각) 역대 최대 규모로 진행한 AI콘퍼런스 'GTC 2024'에서 선보인 블랙웰은 생성형 AI 시대에 최적화한 차세대 GPU다. 이 제품은 이전 세대 대비 최대 25배 적은 비용과 에너지로 조 단위의 대규모 언어 모델(LLM)에서 실시간 생성형 AI를 구축하고 실행할 수 있도록 지원한다.



대규모 생성형 AI 환경 위한 엔비디아 블랙웰 기반 DGX 슈퍼팟 / 엔비디아

AWS, ‘블랙웰’ 기반 인스턴스와 슈퍼컴퓨터 ‘프로젝트 세이바’ 발표

AWS는 5세대 엔비디아 NV링크로 상호 연결된 72개의 블랙웰 GPU와 36개의 그레이스 CPU로 구성된 ‘GB200 NVL72’ 기반 엔비디아 블랙웰 플랫폼을 제공할 예정이다. 고객은 고급 가상화와 하이퍼스케일 클러스터링의 지원을 받으면 수천 개의 GB200 슈퍼칩까지도 확장 가능하다.
또한 AWS는 EC2(Elastic Compute Cloud) 울트라클러스터에 배치된 새로운 B100 GPU를 탑재한 EC2 인스턴스를 제공할 계획이다. 엔비디아 DGX 클라우드에서도 GB200을 사용할 수 있다. AWS상에서의 블랙웰 기반 DGX 클라우드 인스턴스는 1조 개 이상의 파라미터를 처리할 수 있는 최첨단 생성형 AI와 LLM의 개발을 가속화할 것으로 기대된다.
아마존 EC2의 GB200을 통해 AWS는 고객이 AWS 니트로 엔클레이브와  AWS KMS(키 관리 서비스)를 사용해 EC2 인스턴스와 함께 신뢰할 수 있는 실행 환경을 구축하도록 지원한다. 니트로 엔클레이브를 통해 고객은 자신의 통제 하에 있는 키 재료(key material)를 사용해 KMS로 훈련 데이터와 가중치를 암호화할 수 있다. AWS 내부 운영자조차도 키에 액세스하거나 훈련 데이터 또는 모델 가중치를 복호화할 수 없도록 보장해 고객이 자신의 데이터를 통제할 수 있게 한다.
한편, AWS 리인벤트 2023에서 발표된 프로젝트 세이바는 세계에서 가장 빠른 AI 슈퍼컴퓨터를 구축하기 위해 엔비디아와 AWS가 협력하는 프로젝트이다. AWS에서 독점적으로 호스팅되는 이 슈퍼컴퓨터는 엔비디아의 자체 연구 개발에 사용된다. 엔비디아 GB200 NVL72시스템을 기반으로 구축된 세이바는 이전 세대 GPU 기반이었던 초기 계획에 비해 6배나 향상된 성능을 제공한다.  
2만736개의 B200 GPU를 사용하는 이 시스템은 새로운 엔비디아 GB200 NVL72시스템을 기반으로 구축되며, 엔비디아 GB200 NVL72시스템은 5세대 NV링크 기술로 2만736개의 B200 GPU와 1만368개의 엔비디아 그레이스 CPU를 연결한다. 이 슈퍼컴퓨터는 4세대 EFA 네트워킹을 통해 확장되고, 슈퍼칩당 최대 800Gbps의 저지연, 고대역폭 네트워킹 처리량을 제공해 414엑사플롭(EFlops)의 대규모 AI를 처리할 수 있다.

구글 클라우드·마이크로소프트, 생성형 AI 환경 확장 '엔비디아와 파트너십 강화'

구글은 새로운 엔비디아 그레이스 블랙웰 AI 컴퓨팅 플랫폼을 도입하고, 구글 클라우드에 엔비디아 DGX 클라우드 서비스를 적용한다고 발표했다. 아울러 엔비디아 H100 기반 DGX 클라우드 플랫폼은 이제 구글 클라우드에서 정식으로 사용할 수 있다.
또한 구글은 구글 쿠버네티스 엔진에 NIM 추론 마이크로서비스가 통합된다고 밝혔다. NIM은 기업에서 생성형 AI 배포 속도를 높이고, 원활하고 확장 가능한 AI 추론을 지원한다. 이와 함께, 양사는 엔비디아 GPU와 엔비디아 H100 그리고 L4 텐서 코어 GPU 기반의 버텍스 AI 인스턴스에서 고성능의 머신러닝 프레임워크인 JAX를 지원한다고 발표했다.

마이크로소프트는 엔비디아 ‘그레이스 블랙웰 GB200’과 ‘퀀텀-X800 인피니밴드’ 네트워킹 구성을 애저에 도입할 계획이라고 밝혔다. 또한 마이크로소프트는 엔비디아 H100 NVL 플랫폼에 기반한 애저 NC H100 v5 VM(virtual machine)의 정식 출시를 발표했다.
NC 시리즈 VM은 미드레인지 훈련과 추론을 위해 설계됐고, 고객들에게 1개에서 2개의 엔비디아 H100 94GB PCIe 텐서 코어 GPU로 구성된 두 등급의 VM을 제공한다. 또한 엔비디아 멀티 인스턴스 GPU(MIG) 기술을 지원해, 각 GPU를 최대 7개 인스턴스로 분할할 수 있어 다양한 AI 워크로드를 위한 유연성을 제공한다.
이와 함께, 마이크로소프트는 의료와 생명 과학 분야를 위해 애저의 강력한 성능을 엔비디아 DGX 클라우드와 엔비디아 클라라 마이크로서비스 제품군과 함께 활용할 수 있게 제공한다고 밝혔다. 또한 마이크로소프트는 엔비디아의 ‘옴니버스 클라우드’ API를 올해 말 애저에서 제공할 예정이며, 엔비디아 GPU와 엔비디아 트리톤 추론 서버(Triton Inference Server)는 마이크로소프트 365용 코파일럿에서 AI 추론 예측을 지원한다고 소개했다. NIM 추론 마이크로서비스도 애저 AI에 도입돼, AI 배포 가속화를 지원할 예정이다.

오라클, 엔비디아와 ‘소버린 AI’ 솔루션 위한 협력 확대

엔비디아와 오라클은 고객들에 소버린 AI 솔루션을 제공하기 위해 협력을 확대한다고 발표했다. 오라클의 분산형 클라우드, AI 인프라와 생성형 AI 서비스는 엔비디아의 가속 컴퓨팅과 생성형 AI 소프트웨어와 결합해 정부와 기업이 국가 또는 조직의 안전한 시설 안에서 클라우드 서비스를 실행할 수 있는 ‘AI 팩토리’를 구축할 수 있도록 지원한다.
오라클 엔터프라이즈 AI는 OCI(오라클 클라우드 인프라스트럭처) 전용 리전, 오라클 알로이, 오라클 EU 소버린 클라우드, 오라클 정부 클라우드에 배포 가능하다. 26개국 66개 클라우드 리전에서 고객들은 100개 이상의 클라우드와 AI 서비스에 액세스할 수 있다. 양사의 통합 솔루션은 퍼블릭 클라우드 또는 특정 위치의 고객 데이터센터에 유연한 운영 제어를 통해 배포할 수 있다.
또한 오라클은 최신 엔비디아 그레이스 블랙웰 컴퓨팅 플랫폼을 OCI 슈퍼클러스터와 OCI 컴퓨트에 활용할 계획이다. OCI 컴퓨트에는 엔비디아 GB200 그레이스 블랙웰 슈퍼칩과 엔비디아 블랙웰 B200 텐서 코어 GPU가 모두 탑재될 예정이다. 또한 검색 증강 생성(RAG) 추론 배포를 위한 엔비디아 네모 리트리버를 포함한 엔비디아 NIM과 쿠다-X 마이크로서비스도 활용된다.
‘엔비디아 DGX 클라우드 온 OCI’에도 엔비디아 그레이스 블랙웰이 추가돼, 고객들에 ‘GB200 NVL72’ 기반 인스턴스를 제공한다. 전체 DGX 클라우드 클러스터 구축에는 2만개 이상의 GB200 가속기와 엔비디아 CX8 인피니밴드 네트워킹이 포함돼 확장성과 성능이 뛰어난 클라우드 인프라를 제공한다는 계획이다.
권용만 기자 yongman.kwon@chosunbiz.com

기자의 다른기사

저작권자 © IT조선 무단전재 및 재배포 금지

관련기사

SK하이닉스, 엔비디아 'GTC'서 최신 AI 메모리 솔루션 선봬

엔비디아, 비주얼 콘텐츠 제공업체 위한 ‘3D 생성형 AI’ 출시

SK하이닉스, 엔비디아 GTC에서 AI PC용 최고 성능 SSD 신제품 공개

델, 엔비디아 기반 생성형 AI 지원 포트폴리오 강화

레노버, 맞춤형 ‘하이브리드 AI’ 솔루션 공개…“최신 GPU 탑재”

엔비디아, 생성형 AI 최적화 ‘블랙웰’ GPU 발표…“이전 대비 성능 5배 향상”

뉴스이슈






추천 비추천

0

고정닉 0

0

원본 첨부파일 1

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 제목 글쓴이 작성일 조회 추천
설문 연인과 헤어지고 뒤끝 작렬할 것 같은 스타는? 운영자 24/04/22 - -
AD 해커스로스쿨 기초인강 전강좌 100% 무료! 운영자 24/02/24 - -
AD 메가로스쿨 1타의 차원이 다른 퀄리티를 경험하라! 운영자 24/04/28 - -
공지 광운대 갤러리 이용 안내 [10] 운영자 21.02.25 3451 1
공지 광운대 캠퍼스 궁금한 늅늅이들을 위해서 잉여력 발산 -1 [41] 티모갤로그로 이동합니다. 12.01.10 38480 49
공지 광운대 캠퍼스 궁금한 늅늅이들을 위해서 잉여력 발산 -2 [41] 티모갤로그로 이동합니다. 12.01.11 22765 28
공지 ★☆ 광운대 주변 음식점 & 카페 정리 (11.01.25) ☆★ [100] ;ㅅ;(128.134) 11.01.25 35761 125
150280 LG전자 텔레매틱스는 지난 2022년 기준 글로벌 점유율 1위(23.3% %%%%(211.36) 04.27 28 0
150279 각 계열사에 흩어져 있던 우주 사업을 합해 ‘스페이스 허브 조직’을.. %%%%(211.36) 04.27 11 0
150278 [DX 넘어 AX 빅뱅] 모든 업무에 AI 연결… 생산성 폭발 %%%%(211.36) 04.27 17 0
150277 조선 빅3, 13년 만에 다같이 웃은 이유는? %%%%(211.36) 04.27 16 0
150276 일본 라피더스 2나노 파운드리에 자신감, AI 반도체 '틈새시장' 집중 %%%%(211.36) 04.27 29 0
150275 AI 시대에 ‘제2의 석유’된 구리...세계 최대 구리 공룡 기업 탄생하 %%%%(211.36) 04.27 31 0
150274 서울잡대 광운대 문과 수준 광갤러(122.35) 04.27 54 4
150273 실적 발표 대부분의 시간을 인공지능(AI)과 메타버스 투자에 대해.. %%%%(211.36) 04.26 94 0
150272 드디어 만나는 尹-李… %%%%(211.36) 04.26 19 0
150271 브런치북, 이직의 기술? [2] %%%%(211.36) 04.26 19 0
150270 방중 블링컨 “美·中, 몇주 내로 AI 관련 첫 회담 열 것” [1] %%%%(211.36) 04.26 44 0
150269 ■■■광명상가에 당당하게 들어선 가천대 [2] 가갤러(223.38) 04.25 63 3
150268 노베가 올해 사탐공대 광운대공대 가능함?? ㅇㅇ(210.205) 04.25 37 0
150267 자꾸 작아지는 빈살만 '네옴시티'…'차이나머니' 힘 빌릴 수 있을까? %%%%(117.111) 04.25 27 0
150266 <2023년 한국위성정보통신 발전 Workshop & Conference %%%%(117.111) 04.25 28 0
150265 "관측 넘어 통신 위성 경쟁력 확보 중요" 양산형 초소형 군집위성 %%%%(117.111) 04.25 40 0
150264 아이피 같다라고 하여 4년제 갤러리의 글 작성자들과 동일인이라 생각하거나 %%%%(117.111) 04.25 25 0
150263 “인권·환경 의무” 유럽의회 ‘공급망실사지침’ 가결… 韓 기업도 영향 %%%%(117.111) 04.25 25 0
150262 238단 SK하이닉스 따돌린 삼성...적층 경쟁 치열 %%%%(106.102) 04.24 43 0
150261 인텔 1.8나노 파운드리 수주에 미국정부 도움 받는다, 군사용 반도체 생 %%%%(106.102) 04.24 33 0
150260 SK하이닉스, 5조 추가 투자해 D램공장 신설...총 20조 규모 [1] %%%%(106.102) 04.24 67 0
150259 '전략 특허' 1000건 중 절반 털렸다…분노한 LG엔솔 '초강수' %%%%(106.102) 04.24 18 0
150258 [충북] 수소버스 고장 누구 책임?.. 네 탓 공방 %%%%(106.102) 04.24 50 0
150257 미국 CSX, 화물용 수소연료전지 기관차 첫 공개 %%%%(106.102) 04.24 41 0
150255 가스안전公, 독일 NOW와 '수소 모빌리티 활성화' 모색 %%%%(106.102) 04.24 23 0
150254 2009년생부터는 성인이 되더라도 평생 담배 못 산다? 영국의 금연법! [1] %%%%(106.102) 04.24 37 0
150253 인텔은 델, 휴렛 패커드, 레노보, 슈퍼마이크로 등 주요 OEM 생산자들 %%%%(106.102) 04.24 53 0
150252 KT 용인지사, 대전지사..현대차가 KT 최대주주(?)…기대반 우려반 %%%%(211.36) 04.24 58 0
150251 용접사? 체결사? [2] %%%%(211.36) 04.24 35 0
150250 [광운 Hot Issue] 광운대, 인문사회기반 융합인재양성사업 선정을 [1] %%%%(211.36) 04.24 63 0
150249 이란산 원유 제재 부활에 국제 유가 상승 %%%%(211.36) 04.24 26 0
150248 2천조원 넘게 필요…사우디도 자금 부족, "말이 되나"? [2] %%%%(211.36) 04.24 64 0
150247 광운대 김남영 교수연구팀, 전자 피부 개발.2024. %%%%(211.36) 04.24 27 0
150246 광운대 뉴로컴퓨팅 센터, 인간 신경계 모방한 뉴로플랫폼 구축 원천기술, %%%%(211.36) 04.24 32 0
150245 차세대 초고주파 무선통신기기에 필수적인 첨단 반도체,1999. %%%%(211.36) 04.24 26 0
150244 AI전투기가 온다…美 “개발 속도 예상보다 빨라”2024 %%%%(211.36) 04.24 26 0
150243 한국위성정보통신학회, SINCE 1991. [6] %%%%(211.36) 04.24 38 0
150242 한국HP, 200억원 상당 계측SW 4개 대학에 기증,1998. %%%%(211.36) 04.24 36 0
150241 위성지구국용 SSPA 개발 발행일 : 1995-02-02 19:22 %%%%(211.36) 04.24 36 0
150240 인공위성의 핵심적 부품인 「위성중계기」가 국내에서 처음으로, 1994. %%%%(211.36) 04.24 39 0
150239 美 제재가 되레 기술력 키워···통신장비 이어 'OS 굴기' 속도전 진 %%%%(211.36) 04.24 53 1
150238 경찰서 가서도 112에 범죄발생으로 또다시 신고해야하는지? [1] %%%%(211.36) 04.24 32 0
150237 출퇴근도 화웨이가 신경 쓰는 대목이다. 베이징 상하이 우한 등 중국 명문 %%%%(211.36) 04.24 45 0
150236 물류산업에 대한 현 정부의 규제 완화 정책이 한순간에 바뀌면서 일선 사업 [2] %%%%(211.36) 04.24 49 0
150235 “아직 만남의 날짜, 형식 등은 정해지지 않았다”고 부인했다. %%%%(211.36) 04.24 26 0
150234 “경제에 대한 가벼운 인식 때문에 대선에서 석패? %%%%(211.36) 04.24 26 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2