디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

주요 클라우드 기업들이 생성형 인공지능(AI) 시대를 위해 엔비디아와..모바일에서 작성

%%%%(211.36) 2024.03.23 19:50:45
조회 149 추천 0 댓글 0
														
7fed8275b58b6af73fed85e246ee776a216d95672fd3de6f72dd9d48ec728b7ef9888f3ff82b8174


엔비디아와 협력 강화 나선 클라우드 기업들…‘블랙웰 GPU’ 품는다

권용만 기자

권용만 기자



입력 2024.03.23 08:00

다른 공유 찾기기사스크랩하기글씨크기인쇄하기

AWS, ‘블랙웰’ 기반 인스턴스와 슈퍼컴 ‘프로젝트 세이바’ 발표
구글·마이크로소프트, 생성형 AI 환경 확장 위해 파트너십 강화
오라클, 엔비디아와 ‘소버린 AI’ 솔루션 위한 협력 확대

아마존 웹 서비스(AWS), 구글 클라우드, 마이크로소프트, 오라클 등 주요 클라우드 기업들이 생성형 인공지능(AI) 시대를 위해 엔비디아와 협력을 강화한다. 이들 클라우드 기업들은 엔비디아의 ‘블랙웰(Blackwell)’ 그래픽처리장치(GPU) 인프라를 활용한 다양한 서비스를 고객에 제공한다는 계획이다.
엔비디아가 18일(현지시각) 역대 최대 규모로 진행한 AI콘퍼런스 'GTC 2024'에서 선보인 블랙웰은 생성형 AI 시대에 최적화한 차세대 GPU다. 이 제품은 이전 세대 대비 최대 25배 적은 비용과 에너지로 조 단위의 대규모 언어 모델(LLM)에서 실시간 생성형 AI를 구축하고 실행할 수 있도록 지원한다.



대규모 생성형 AI 환경 위한 엔비디아 블랙웰 기반 DGX 슈퍼팟 / 엔비디아

AWS, ‘블랙웰’ 기반 인스턴스와 슈퍼컴퓨터 ‘프로젝트 세이바’ 발표

AWS는 5세대 엔비디아 NV링크로 상호 연결된 72개의 블랙웰 GPU와 36개의 그레이스 CPU로 구성된 ‘GB200 NVL72’ 기반 엔비디아 블랙웰 플랫폼을 제공할 예정이다. 고객은 고급 가상화와 하이퍼스케일 클러스터링의 지원을 받으면 수천 개의 GB200 슈퍼칩까지도 확장 가능하다.
또한 AWS는 EC2(Elastic Compute Cloud) 울트라클러스터에 배치된 새로운 B100 GPU를 탑재한 EC2 인스턴스를 제공할 계획이다. 엔비디아 DGX 클라우드에서도 GB200을 사용할 수 있다. AWS상에서의 블랙웰 기반 DGX 클라우드 인스턴스는 1조 개 이상의 파라미터를 처리할 수 있는 최첨단 생성형 AI와 LLM의 개발을 가속화할 것으로 기대된다.
아마존 EC2의 GB200을 통해 AWS는 고객이 AWS 니트로 엔클레이브와  AWS KMS(키 관리 서비스)를 사용해 EC2 인스턴스와 함께 신뢰할 수 있는 실행 환경을 구축하도록 지원한다. 니트로 엔클레이브를 통해 고객은 자신의 통제 하에 있는 키 재료(key material)를 사용해 KMS로 훈련 데이터와 가중치를 암호화할 수 있다. AWS 내부 운영자조차도 키에 액세스하거나 훈련 데이터 또는 모델 가중치를 복호화할 수 없도록 보장해 고객이 자신의 데이터를 통제할 수 있게 한다.
한편, AWS 리인벤트 2023에서 발표된 프로젝트 세이바는 세계에서 가장 빠른 AI 슈퍼컴퓨터를 구축하기 위해 엔비디아와 AWS가 협력하는 프로젝트이다. AWS에서 독점적으로 호스팅되는 이 슈퍼컴퓨터는 엔비디아의 자체 연구 개발에 사용된다. 엔비디아 GB200 NVL72시스템을 기반으로 구축된 세이바는 이전 세대 GPU 기반이었던 초기 계획에 비해 6배나 향상된 성능을 제공한다.  
2만736개의 B200 GPU를 사용하는 이 시스템은 새로운 엔비디아 GB200 NVL72시스템을 기반으로 구축되며, 엔비디아 GB200 NVL72시스템은 5세대 NV링크 기술로 2만736개의 B200 GPU와 1만368개의 엔비디아 그레이스 CPU를 연결한다. 이 슈퍼컴퓨터는 4세대 EFA 네트워킹을 통해 확장되고, 슈퍼칩당 최대 800Gbps의 저지연, 고대역폭 네트워킹 처리량을 제공해 414엑사플롭(EFlops)의 대규모 AI를 처리할 수 있다.

구글 클라우드·마이크로소프트, 생성형 AI 환경 확장 '엔비디아와 파트너십 강화'

구글은 새로운 엔비디아 그레이스 블랙웰 AI 컴퓨팅 플랫폼을 도입하고, 구글 클라우드에 엔비디아 DGX 클라우드 서비스를 적용한다고 발표했다. 아울러 엔비디아 H100 기반 DGX 클라우드 플랫폼은 이제 구글 클라우드에서 정식으로 사용할 수 있다.
또한 구글은 구글 쿠버네티스 엔진에 NIM 추론 마이크로서비스가 통합된다고 밝혔다. NIM은 기업에서 생성형 AI 배포 속도를 높이고, 원활하고 확장 가능한 AI 추론을 지원한다. 이와 함께, 양사는 엔비디아 GPU와 엔비디아 H100 그리고 L4 텐서 코어 GPU 기반의 버텍스 AI 인스턴스에서 고성능의 머신러닝 프레임워크인 JAX를 지원한다고 발표했다.

마이크로소프트는 엔비디아 ‘그레이스 블랙웰 GB200’과 ‘퀀텀-X800 인피니밴드’ 네트워킹 구성을 애저에 도입할 계획이라고 밝혔다. 또한 마이크로소프트는 엔비디아 H100 NVL 플랫폼에 기반한 애저 NC H100 v5 VM(virtual machine)의 정식 출시를 발표했다.
NC 시리즈 VM은 미드레인지 훈련과 추론을 위해 설계됐고, 고객들에게 1개에서 2개의 엔비디아 H100 94GB PCIe 텐서 코어 GPU로 구성된 두 등급의 VM을 제공한다. 또한 엔비디아 멀티 인스턴스 GPU(MIG) 기술을 지원해, 각 GPU를 최대 7개 인스턴스로 분할할 수 있어 다양한 AI 워크로드를 위한 유연성을 제공한다.
이와 함께, 마이크로소프트는 의료와 생명 과학 분야를 위해 애저의 강력한 성능을 엔비디아 DGX 클라우드와 엔비디아 클라라 마이크로서비스 제품군과 함께 활용할 수 있게 제공한다고 밝혔다. 또한 마이크로소프트는 엔비디아의 ‘옴니버스 클라우드’ API를 올해 말 애저에서 제공할 예정이며, 엔비디아 GPU와 엔비디아 트리톤 추론 서버(Triton Inference Server)는 마이크로소프트 365용 코파일럿에서 AI 추론 예측을 지원한다고 소개했다. NIM 추론 마이크로서비스도 애저 AI에 도입돼, AI 배포 가속화를 지원할 예정이다.

오라클, 엔비디아와 ‘소버린 AI’ 솔루션 위한 협력 확대

엔비디아와 오라클은 고객들에 소버린 AI 솔루션을 제공하기 위해 협력을 확대한다고 발표했다. 오라클의 분산형 클라우드, AI 인프라와 생성형 AI 서비스는 엔비디아의 가속 컴퓨팅과 생성형 AI 소프트웨어와 결합해 정부와 기업이 국가 또는 조직의 안전한 시설 안에서 클라우드 서비스를 실행할 수 있는 ‘AI 팩토리’를 구축할 수 있도록 지원한다.
오라클 엔터프라이즈 AI는 OCI(오라클 클라우드 인프라스트럭처) 전용 리전, 오라클 알로이, 오라클 EU 소버린 클라우드, 오라클 정부 클라우드에 배포 가능하다. 26개국 66개 클라우드 리전에서 고객들은 100개 이상의 클라우드와 AI 서비스에 액세스할 수 있다. 양사의 통합 솔루션은 퍼블릭 클라우드 또는 특정 위치의 고객 데이터센터에 유연한 운영 제어를 통해 배포할 수 있다.
또한 오라클은 최신 엔비디아 그레이스 블랙웰 컴퓨팅 플랫폼을 OCI 슈퍼클러스터와 OCI 컴퓨트에 활용할 계획이다. OCI 컴퓨트에는 엔비디아 GB200 그레이스 블랙웰 슈퍼칩과 엔비디아 블랙웰 B200 텐서 코어 GPU가 모두 탑재될 예정이다. 또한 검색 증강 생성(RAG) 추론 배포를 위한 엔비디아 네모 리트리버를 포함한 엔비디아 NIM과 쿠다-X 마이크로서비스도 활용된다.
‘엔비디아 DGX 클라우드 온 OCI’에도 엔비디아 그레이스 블랙웰이 추가돼, 고객들에 ‘GB200 NVL72’ 기반 인스턴스를 제공한다. 전체 DGX 클라우드 클러스터 구축에는 2만개 이상의 GB200 가속기와 엔비디아 CX8 인피니밴드 네트워킹이 포함돼 확장성과 성능이 뛰어난 클라우드 인프라를 제공한다는 계획이다.
권용만 기자 yongman.kwon@chosunbiz.com

기자의 다른기사

저작권자 © IT조선 무단전재 및 재배포 금지

관련기사

SK하이닉스, 엔비디아 'GTC'서 최신 AI 메모리 솔루션 선봬

엔비디아, 비주얼 콘텐츠 제공업체 위한 ‘3D 생성형 AI’ 출시

SK하이닉스, 엔비디아 GTC에서 AI PC용 최고 성능 SSD 신제품 공개

델, 엔비디아 기반 생성형 AI 지원 포트폴리오 강화

레노버, 맞춤형 ‘하이브리드 AI’ 솔루션 공개…“최신 GPU 탑재”

엔비디아, 생성형 AI 최적화 ‘블랙웰’ GPU 발표…“이전 대비 성능 5배 향상”

뉴스이슈






추천 비추천

0

고정닉 0

0

원본 첨부파일 1

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 제목 글쓴이 작성일 조회 추천
설문 비난 여론에도 뻔뻔하게 잘 살 것 같은 스타는? 운영자 24/06/03 - -
AD 로스쿨 합격을 위한 반전, 논술에서 찾다! 사전예약▶ 운영자 24/05/29 - -
AD 해커스로스쿨 기초인강 전강좌 100% 무료! 운영자 24/02/24 - -
공지 광운대 갤러리 이용 안내 [10] 운영자 21.02.25 3595 1
공지 광운대 캠퍼스 궁금한 늅늅이들을 위해서 잉여력 발산 -1 [41] 티모갤로그로 이동합니다. 12.01.10 38652 49
공지 광운대 캠퍼스 궁금한 늅늅이들을 위해서 잉여력 발산 -2 [41] 티모갤로그로 이동합니다. 12.01.11 22917 29
공지 ★☆ 광운대 주변 음식점 & 카페 정리 (11.01.25) ☆★ [100] ;ㅅ;(128.134) 11.01.25 35990 125
150531 건대 이하, 동시합격자 순위 ㅇㅇ(118.235) 06.04 47 4
150530 Wow 젓문대가 엄청 발전한거였노 광갤러(223.38) 06.03 37 2
150528 서울시, 인공지능 분야 기술창업 육성을 위한 ‘서울 AI 허브’ 핵심 앵 %(211.36) 06.01 38 0
150527 - 백년시장 상인회와 지역 내 고립·은둔·니트 청년의 사회적응 지원키로 %%%%(211.36) 06.01 42 0
150526 시간이 지날수록 현장의 혼란만.."세월호가 '과적'으로 사고 났듯이 %(211.36) 06.01 39 0
150525 학회는 디지털문화 속 고착된 갈등과 불평등을 해결하고 미디어 기술과 시장 %(211.36) 06.01 53 0
150524 GPS 교란이 있다 보니까 0으로 찍힌 거예요. %(211.36) 06.01 42 0
150522 기기 도입과 공정 투입의 간극을 줄이는 연구에 돌입하는 것”이라고 했다. %(211.36) 05.29 43 0
150521 中企들 소송시간-비용 감당 힘들어… “특허리스크 관리-독자 R&D 필요” %(211.36) 05.29 51 0
150520 주요 팹리스(반도체 설계) 업체들은 파운드리 이원화가 절실한 상황이다. [5] %(211.36) 05.29 97 1
150517 2013년 업계 최초로 HBM을 개발한 SK하이닉스는 투자를 이어갔다. %(117.111) 05.27 69 0
150516 [취업] 생성형AI개발 교육 후 기업연수, 채용연계 교육생 모집중! 광갤러(128.134) 05.27 58 0
150515 우리학교 에타 1계정 2기기 로그인 가능함? 광갤러(211.235) 05.27 50 0
150514 “실측 정확성이 높아 실제 정비 비용을 정산할 때도 유용하게 활용된다” [1] %(117.111) 05.26 79 0
150513 올해 스마트플랜트 2.0 추진…연간 100억 비용?개선 효과 기대 [1] %(117.111) 05.26 88 0
150511 AI 사업 생태계를 데이터센터와 로봇 및 전력까지 확대한다는 계획이다. %(211.36) 05.26 52 0
150510 장비기업들의 실적 개선 %(211.36) 05.26 63 0
150509 미국 테일러와 용인 클러스터 등 대규모 투자, 수율과 성능. %(211.36) 05.26 59 0
150508 지속적으로 성장이 예상이 되고 삼성의 메모리 기술력을 봤을 때는 [1] %(211.36) 05.26 83 0
150507 2024 광운대 입결 대광운갤로그로 이동합니다. 05.26 162 2
150506 건설 경기가 고용에 미치는 영향에 더 섬세한 관찰과 관리가 필요합니다. [1] %(211.36) 05.26 73 0
150505 24일 경기도 용인시 처인구 원삼면 용인반도체클러스터 용지 %(211.36) 05.26 80 0
150504 광운대학교 입학처 홈페이지, 입시결과. %(211.36) 05.26 86 0
150503 노동운동 내부였던 것 같다? 포획? %(211.36) 05.26 77 0
150502 생태계펀드로 확대 개편하고 지원액과 대상도 늘릴 계획이다. %(211.36) 05.26 44 0
150501 삼성 "5세대 HBM 순조롭다"… SK하이닉스는 해외생산 저울질 %(211.36) 05.26 91 0
150500 광운대입결근황 [3] ㅇㅇ(211.234) 05.25 257 15
150499 “인재 채용은 투자라고 인식해왔기 때문에.. %(211.36) 05.23 77 0
150498 울산에 9조3000억원을 투입해 초대형 NCC 단지를 짓는 사업이다. %(211.36) 05.23 98 0
150497 시스템반도체, AP.. %(211.36) 05.23 98 0
150496 병렬 계산이 가능한 양자컴퓨터는 이론상 슈퍼컴퓨터보다 30조 배 이상, %(211.36) 05.23 85 0
150495 고성능 컴퓨팅(HPC) %(211.36) 05.23 45 0
150494 6G 표준이 완성(2028년 예상)되면 저궤도 위성통신 시장도.. %(211.36) 05.23 62 0
150493 예상 수요량 대비 SK하이닉스 생산량은 60%를 점유할 것으로 예상된다" %(211.36) 05.23 69 0
150492 도전적 과제 수행을 위해 새로운 실험을 해보는 데 할애해 보자. %(211.36) 05.23 46 0
150491 자체 차량용 칩 개발 외에도 차량용 반도체 국산화율을 높인다는 방침이다. %(211.36) 05.23 84 0
150487 송은이·황현희 호소에 막히자 이번엔…증권사 '발칵' [5] %(211.36) 05.22 126 0
150486 팀원들을 사내 여러 팀으로 재배치하기 시작했다. [3] %(211.36) 05.21 135 0
150485 이 계좌번호가 무슨뜻인지 알고 있으신지.. %(117.111) 05.21 57 0
150483 KT, 이통3사 중 유일하게 가입자 감소…3위와 격차 좁혀져 %(117.111) 05.21 81 0
150482 균일한 물질을 쌓아 올리기 위해 필요 없는 것을 깎고 필요한 부분에 물질 [1] %(117.111) 05.21 83 0
150481 "파업 발생했네요, 이 대안 어때요" 삼성SDS, AI로 공급망 리스크 %(117.111) 05.21 81 0
150480 후공정 외 전공정 단계에서부터 경쟁사 대비 성능 요구치를 충족하지 못하는 %(117.111) 05.21 74 0
150479 이전에도 TSMC 경영진과 여러 차례 반도체 생산 논의를 진행한 것으로 %(117.111) 05.21 62 0
150478 “(HBM 부문에서) 경쟁사가 삼성을 이겼다”고 인정하며 “체질 개선을 %(117.111) 05.21 113 0
150477 55년 임무 끝 퇴역 ‘F-4’, 독자 개발 ‘KF-21’… 공군력 세계 %(117.111) 05.21 132 1
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2