디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

주요 클라우드 기업들이 생성형 인공지능(AI) 시대를 위해 엔비디아와..모바일에서 작성

%%%%(211.36) 2024.03.23 19:50:45
조회 131 추천 0 댓글 0
														
7fed8275b58b6af73fed85e246ee776a216d95672fd3de6f72dd9d48ec728b7ef9888f3ff82b8174


엔비디아와 협력 강화 나선 클라우드 기업들…‘블랙웰 GPU’ 품는다

권용만 기자

권용만 기자



입력 2024.03.23 08:00

다른 공유 찾기기사스크랩하기글씨크기인쇄하기

AWS, ‘블랙웰’ 기반 인스턴스와 슈퍼컴 ‘프로젝트 세이바’ 발표
구글·마이크로소프트, 생성형 AI 환경 확장 위해 파트너십 강화
오라클, 엔비디아와 ‘소버린 AI’ 솔루션 위한 협력 확대

아마존 웹 서비스(AWS), 구글 클라우드, 마이크로소프트, 오라클 등 주요 클라우드 기업들이 생성형 인공지능(AI) 시대를 위해 엔비디아와 협력을 강화한다. 이들 클라우드 기업들은 엔비디아의 ‘블랙웰(Blackwell)’ 그래픽처리장치(GPU) 인프라를 활용한 다양한 서비스를 고객에 제공한다는 계획이다.
엔비디아가 18일(현지시각) 역대 최대 규모로 진행한 AI콘퍼런스 'GTC 2024'에서 선보인 블랙웰은 생성형 AI 시대에 최적화한 차세대 GPU다. 이 제품은 이전 세대 대비 최대 25배 적은 비용과 에너지로 조 단위의 대규모 언어 모델(LLM)에서 실시간 생성형 AI를 구축하고 실행할 수 있도록 지원한다.



대규모 생성형 AI 환경 위한 엔비디아 블랙웰 기반 DGX 슈퍼팟 / 엔비디아

AWS, ‘블랙웰’ 기반 인스턴스와 슈퍼컴퓨터 ‘프로젝트 세이바’ 발표

AWS는 5세대 엔비디아 NV링크로 상호 연결된 72개의 블랙웰 GPU와 36개의 그레이스 CPU로 구성된 ‘GB200 NVL72’ 기반 엔비디아 블랙웰 플랫폼을 제공할 예정이다. 고객은 고급 가상화와 하이퍼스케일 클러스터링의 지원을 받으면 수천 개의 GB200 슈퍼칩까지도 확장 가능하다.
또한 AWS는 EC2(Elastic Compute Cloud) 울트라클러스터에 배치된 새로운 B100 GPU를 탑재한 EC2 인스턴스를 제공할 계획이다. 엔비디아 DGX 클라우드에서도 GB200을 사용할 수 있다. AWS상에서의 블랙웰 기반 DGX 클라우드 인스턴스는 1조 개 이상의 파라미터를 처리할 수 있는 최첨단 생성형 AI와 LLM의 개발을 가속화할 것으로 기대된다.
아마존 EC2의 GB200을 통해 AWS는 고객이 AWS 니트로 엔클레이브와  AWS KMS(키 관리 서비스)를 사용해 EC2 인스턴스와 함께 신뢰할 수 있는 실행 환경을 구축하도록 지원한다. 니트로 엔클레이브를 통해 고객은 자신의 통제 하에 있는 키 재료(key material)를 사용해 KMS로 훈련 데이터와 가중치를 암호화할 수 있다. AWS 내부 운영자조차도 키에 액세스하거나 훈련 데이터 또는 모델 가중치를 복호화할 수 없도록 보장해 고객이 자신의 데이터를 통제할 수 있게 한다.
한편, AWS 리인벤트 2023에서 발표된 프로젝트 세이바는 세계에서 가장 빠른 AI 슈퍼컴퓨터를 구축하기 위해 엔비디아와 AWS가 협력하는 프로젝트이다. AWS에서 독점적으로 호스팅되는 이 슈퍼컴퓨터는 엔비디아의 자체 연구 개발에 사용된다. 엔비디아 GB200 NVL72시스템을 기반으로 구축된 세이바는 이전 세대 GPU 기반이었던 초기 계획에 비해 6배나 향상된 성능을 제공한다.  
2만736개의 B200 GPU를 사용하는 이 시스템은 새로운 엔비디아 GB200 NVL72시스템을 기반으로 구축되며, 엔비디아 GB200 NVL72시스템은 5세대 NV링크 기술로 2만736개의 B200 GPU와 1만368개의 엔비디아 그레이스 CPU를 연결한다. 이 슈퍼컴퓨터는 4세대 EFA 네트워킹을 통해 확장되고, 슈퍼칩당 최대 800Gbps의 저지연, 고대역폭 네트워킹 처리량을 제공해 414엑사플롭(EFlops)의 대규모 AI를 처리할 수 있다.

구글 클라우드·마이크로소프트, 생성형 AI 환경 확장 '엔비디아와 파트너십 강화'

구글은 새로운 엔비디아 그레이스 블랙웰 AI 컴퓨팅 플랫폼을 도입하고, 구글 클라우드에 엔비디아 DGX 클라우드 서비스를 적용한다고 발표했다. 아울러 엔비디아 H100 기반 DGX 클라우드 플랫폼은 이제 구글 클라우드에서 정식으로 사용할 수 있다.
또한 구글은 구글 쿠버네티스 엔진에 NIM 추론 마이크로서비스가 통합된다고 밝혔다. NIM은 기업에서 생성형 AI 배포 속도를 높이고, 원활하고 확장 가능한 AI 추론을 지원한다. 이와 함께, 양사는 엔비디아 GPU와 엔비디아 H100 그리고 L4 텐서 코어 GPU 기반의 버텍스 AI 인스턴스에서 고성능의 머신러닝 프레임워크인 JAX를 지원한다고 발표했다.

마이크로소프트는 엔비디아 ‘그레이스 블랙웰 GB200’과 ‘퀀텀-X800 인피니밴드’ 네트워킹 구성을 애저에 도입할 계획이라고 밝혔다. 또한 마이크로소프트는 엔비디아 H100 NVL 플랫폼에 기반한 애저 NC H100 v5 VM(virtual machine)의 정식 출시를 발표했다.
NC 시리즈 VM은 미드레인지 훈련과 추론을 위해 설계됐고, 고객들에게 1개에서 2개의 엔비디아 H100 94GB PCIe 텐서 코어 GPU로 구성된 두 등급의 VM을 제공한다. 또한 엔비디아 멀티 인스턴스 GPU(MIG) 기술을 지원해, 각 GPU를 최대 7개 인스턴스로 분할할 수 있어 다양한 AI 워크로드를 위한 유연성을 제공한다.
이와 함께, 마이크로소프트는 의료와 생명 과학 분야를 위해 애저의 강력한 성능을 엔비디아 DGX 클라우드와 엔비디아 클라라 마이크로서비스 제품군과 함께 활용할 수 있게 제공한다고 밝혔다. 또한 마이크로소프트는 엔비디아의 ‘옴니버스 클라우드’ API를 올해 말 애저에서 제공할 예정이며, 엔비디아 GPU와 엔비디아 트리톤 추론 서버(Triton Inference Server)는 마이크로소프트 365용 코파일럿에서 AI 추론 예측을 지원한다고 소개했다. NIM 추론 마이크로서비스도 애저 AI에 도입돼, AI 배포 가속화를 지원할 예정이다.

오라클, 엔비디아와 ‘소버린 AI’ 솔루션 위한 협력 확대

엔비디아와 오라클은 고객들에 소버린 AI 솔루션을 제공하기 위해 협력을 확대한다고 발표했다. 오라클의 분산형 클라우드, AI 인프라와 생성형 AI 서비스는 엔비디아의 가속 컴퓨팅과 생성형 AI 소프트웨어와 결합해 정부와 기업이 국가 또는 조직의 안전한 시설 안에서 클라우드 서비스를 실행할 수 있는 ‘AI 팩토리’를 구축할 수 있도록 지원한다.
오라클 엔터프라이즈 AI는 OCI(오라클 클라우드 인프라스트럭처) 전용 리전, 오라클 알로이, 오라클 EU 소버린 클라우드, 오라클 정부 클라우드에 배포 가능하다. 26개국 66개 클라우드 리전에서 고객들은 100개 이상의 클라우드와 AI 서비스에 액세스할 수 있다. 양사의 통합 솔루션은 퍼블릭 클라우드 또는 특정 위치의 고객 데이터센터에 유연한 운영 제어를 통해 배포할 수 있다.
또한 오라클은 최신 엔비디아 그레이스 블랙웰 컴퓨팅 플랫폼을 OCI 슈퍼클러스터와 OCI 컴퓨트에 활용할 계획이다. OCI 컴퓨트에는 엔비디아 GB200 그레이스 블랙웰 슈퍼칩과 엔비디아 블랙웰 B200 텐서 코어 GPU가 모두 탑재될 예정이다. 또한 검색 증강 생성(RAG) 추론 배포를 위한 엔비디아 네모 리트리버를 포함한 엔비디아 NIM과 쿠다-X 마이크로서비스도 활용된다.
‘엔비디아 DGX 클라우드 온 OCI’에도 엔비디아 그레이스 블랙웰이 추가돼, 고객들에 ‘GB200 NVL72’ 기반 인스턴스를 제공한다. 전체 DGX 클라우드 클러스터 구축에는 2만개 이상의 GB200 가속기와 엔비디아 CX8 인피니밴드 네트워킹이 포함돼 확장성과 성능이 뛰어난 클라우드 인프라를 제공한다는 계획이다.
권용만 기자 yongman.kwon@chosunbiz.com

기자의 다른기사

저작권자 © IT조선 무단전재 및 재배포 금지

관련기사

SK하이닉스, 엔비디아 'GTC'서 최신 AI 메모리 솔루션 선봬

엔비디아, 비주얼 콘텐츠 제공업체 위한 ‘3D 생성형 AI’ 출시

SK하이닉스, 엔비디아 GTC에서 AI PC용 최고 성능 SSD 신제품 공개

델, 엔비디아 기반 생성형 AI 지원 포트폴리오 강화

레노버, 맞춤형 ‘하이브리드 AI’ 솔루션 공개…“최신 GPU 탑재”

엔비디아, 생성형 AI 최적화 ‘블랙웰’ GPU 발표…“이전 대비 성능 5배 향상”

뉴스이슈






추천 비추천

0

고정닉 0

0

원본 첨부파일 1

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 제목 글쓴이 작성일 조회 추천
설문 경제관념 부족해서 돈 막 쓸 것 같은 스타는? 운영자 24/05/13 - -
AD 해커스로스쿨 기초인강 전강좌 100% 무료! 운영자 24/02/24 - -
AD 내일 마감! LEET 1타 연합 현장모의고사 신청하기 운영자 24/04/28 - -
공지 광운대 갤러리 이용 안내 [10] 운영자 21.02.25 3528 1
공지 광운대 캠퍼스 궁금한 늅늅이들을 위해서 잉여력 발산 -1 [41] 티모갤로그로 이동합니다. 12.01.10 38566 49
공지 광운대 캠퍼스 궁금한 늅늅이들을 위해서 잉여력 발산 -2 [41] 티모갤로그로 이동합니다. 12.01.11 22846 29
공지 ★☆ 광운대 주변 음식점 & 카페 정리 (11.01.25) ☆★ [100] ;ㅅ;(128.134) 11.01.25 35871 125
150467 인공지능(AI)와 관련해선 버블이 아니라고 생각한다고 잘라 말했다. [1] %(211.36) 05.16 34 0
150466 반도체 수요 회복이 임박했고, %(211.36) 05.16 40 0
150465 [일반] 글로벌 ICT 기업(시스코/AWS)과 함께하는 특별강좌 %(211.36) 05.16 23 0
150464 내년 3월에는 원삼면 일대 SK하이닉스 반도체클러스터가 착공되면서 도시의 %(211.36) 05.16 18 0
150463 삼성전자 갤럭시 5G 스마트폰, 美 소비자 만족도 1위 선정,2024. %(211.36) 05.16 28 0
150462 현대엘리베이터, UAM 상용화 위한 도심형 버티포트 만든다.2024. %(117.111) 05.16 18 0
150461 신규 설비를 구매할지, 기존 장비를 개조할지 선택해야 했다. [3] %(117.111) 05.15 35 0
150460 중국 화이트칼라(사무직).. 노랗게 익어가는 바나나를 지켜보며 업무상.. [3] %(117.111) 05.15 27 0
150459 피로 회복에 도움을 주는 L-아스파르트산-L-아르기닌 5000㎎을 함유, %(117.111) 05.15 43 0
150458 지구 어디서나 끊기지 않는 통신 서비스가 역사상 처음 시작될 전망이다. %(117.111) 05.15 49 0
150457 메릴랜드대는 1988년 ‘초전도성 연구 센터’가 들어선 것을 시작으로 %(117.111) 05.15 44 0
150456 사업 재편용 M&A에 나서는 기업에 양도세와 취득세 등을 감면해주는 방안 %(117.111) 05.15 22 0
150455 영국의 대학 평가기관인 ‘타임스 고등교육(THE)’ %(117.111) 05.15 36 0
150454 한국 기업 70% "AI 기술 미보유자, 채용 않겠다" 황국상 기자202 %(117.111) 05.15 25 0
150453 삼성·SK "HBM 완판…2026년까지 7세대 개발" %(117.111) 05.15 32 0
150452 [일반] [모집] 광운대-시스코 이노베이션 센터 안내 및 시스코 네트워킹 %(117.111) 05.15 21 0
150450 30년을 더 놓칠 수 없다. 구글과 MS.. [1] %(211.36) 05.13 67 0
150449 LG화학이 황산니켈 제조사 켐코와 손을 잡은 이유다. [4] %(211.36) 05.13 83 0
150448 AI와 무인기 기술이 대폭 접목된 6세대 전투기의.. %(211.36) 05.13 84 1
150447 애플이 공급망 다변화 정책을 유지하기 위해 삼성디스플레이뿐만 아니라 LG %(211.36) 05.13 45 0
150446 "허위 사실 낱낱이 밝힐 것" %(211.36) 05.13 33 0
150445 4만82명...역 주변에 건설된 대규모 공동주택단지.. %(211.36) 05.13 28 0
150444 후회하는 아리스토텔레스? 상처받은 토마스 홉스? %(211.36) 05.13 28 0
150443 한반도 상공 위성 8000개 '24時 감시'…北로켓 우주서 '철통 방어' [1] %(211.36) 05.13 40 0
150442 ‘삼성 HBM3E 8단’ ..“SK하이닉스, 엔비디아? %(211.36) 05.13 42 0
150441 '주거'(HBM)와 '업무·상가'(CPU·GPU) 등이 하나로 합쳐진다 %(211.36) 05.13 36 0
150440 고려 우왕? 홍길동? 고길동????????? 유배갔다왔다는 이인겸? %(211.36) 05.13 23 0
150439 18개 대학, 2개 연구소, 53개 SoC 및 플랫폼 기업..2011. [5] %(211.36) 05.13 39 0
150438 광운대 IDEC 플랫폼 센터장, 광운대 스마트TV IPC 개소식.2011 %(211.36) 05.13 35 0
150437 타이젠은 2015년 삼성 스마트TV에 처음 적용됐으며.. %(211.36) 05.13 61 0
150436 고양, 남양주, 포천, 파주, 가평, 양주.. %(211.36) 05.13 35 0
150435 퀄컴 이노베이션 펠로우십 코리아 2021,연구 성과만 보고 장학금 지원. %(211.36) 05.13 42 0
150434 2014년에 개소한 광운대학교 전파연구센터(센터장 신현철·사진) %(211.36) 05.13 44 0
150433 서강대서 '퀄컴 이노베이션 어워드' 개최…3년간 100명..2016 %(211.36) 05.13 28 0
150432 삼성메디슨이 사실상 첫 인수합병(M&A)..프랑스 소재, Sonio.. %(211.36) 05.13 78 0
150431 애플과 포항공대(포스텍)가 손을 잡고 대학 안에 세웠다. %(211.36) 05.13 57 0
150430 “미국의 송전 인프라 대부분은 1950~1960년대에 건설됐다” [1] %(211.36) 05.13 39 0
150429 간단 검색으로 부품 식별이 어렵거나, 희망하는 차종 정보가 없을 경우.. %(211.36) 05.13 40 0
150428 중견련 부회장이 직무대행, 부회장? 부해장??????????? [1] %(211.36) 05.13 36 0
150427 신제품 개발 단계부터 부품 원가를 사전에 예측하고 시뮬레이션할 수 있으며 %(211.36) 05.13 44 0
150426 김박사넷, [2] %(211.36) 05.13 44 0
150425 소프트뱅크는 TSMC와 생산 계약 체결을 위한 협상을 진행 중이다. [1] %(211.36) 05.13 61 0
150424 최면 관련 범죄, 또는 관련 피해.... 언론기사를 접해보시는것이.... [2] %(211.36) 05.13 36 0
150423 이 때문에 미국은 한국과 일본 등 아시아 동맹의 자본과 기술을 끌어들여 [7] %(211.36) 05.13 46 0
150422 ‘약 7만5340㎡ 면적 처리시설 설치…’매립 처리 계획’........ %(211.36) 05.13 33 0
150421 [차세대 유니콘](31) 글로벌 생성형 AI 4위 오른 ‘라이너’.. %(211.36) 05.13 33 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2