엔비디아, 기업용 AI 팩토리 구축용으로 즉시 사용 가능한 AI 슈퍼컴퓨터 '블랙웰 울트라 DGX SuperPOD' 공개

등록일 2025년03월19일 10시16분 트위터로 보내기

 

엔비디아(CEO 젠슨 황)는 미국 새너제이에서 열린 GTC에서 엔비디아 블랙웰 울트라(NVIDIA Blackwell Ultra) GPU로 구축된 엔비디아 DGX SuperPOD™을 발표했다. 이는 세계에서 가장 발전된 형태의 기업용 AI 인프라로, 산업 전반에 최첨단 에이전틱 AI(Agentic AI) 추론을 위한 AI 팩토리 슈퍼컴퓨팅을 제공한다.

 

기업들은 이제 엔비디아 네트워킹과 통합된 새로운 엔비디아 DGX™ GB300과 DGX B300 시스템을 활용해 즉시 사용 가능한 DGX SuperPOD AI 슈퍼컴퓨터를 구축할 수 있게 됐다. 이 시스템들은 FP4 정밀도를 지원하고, AI 애플리케이션의 토큰 생성을 향상시키기 위한 더 빠른 AI 추론을 제공한다.

 

AI 팩토리는 에이전틱 AI와 생성형 AI, 물리 AI 워크로드에 필요한 목적 기반 인프라를 제공한다. 이때 AI의 사전 훈련과 사후 훈련, 프로덕션용 애플리케이션으로의 테스트 타임 스케일링(test-time scaling, TTS)을 진행하려면 상당한 수준의 컴퓨팅 리소스가 필요하다.

 

엔비디아 창립자 겸 CEO인 젠슨 황(Jensen Huang)은 “AI가 빛의 속도로 발전하고 있으며, 기업들은 추론형 AI와 추론 시간 스케일링의 처리 요건을 충족할 수 있도록 확장이 가능한 AI 팩토리를 구축하고자 경쟁하고 있다. 엔비디아 블랙웰 울트라 DGX SuperPOD은 에이전틱 AI와 물리 AI의 시대에 걸맞게 독보적인 AI 슈퍼컴퓨팅을 제공한다”고 말했다.

 

DGX GB300 시스템은 엔비디아 그레이스™(Grace™) CPU 36개와 블랙웰 울트라 GPU 72개가 포함된 엔비디아 그레이스 블랙웰 울트라 슈퍼칩(Grace Blackwell Ultra Superchip)을 탑재했다. 또한, 고급 추론형 모델에서 실시간 에이전트 응답이 가능하도록 설계된 랙 스케일의 수랭식 아키텍처를 갖췄다.

 

공랭식 DGX B300 시스템의 경우, 엔비디아 B300 NVL16 아키텍처를 활용해 데이터센터가 어디에서나 생성형 AI와 에이전틱 AI 애플리케이션의 컴퓨팅 요구 사항을 충족할 수 있도록 돕는다.

 

엔비디아는 고도화된 가속 인프라에 대한 증가하는 수요를 충족하기 위해, 블랙웰 울트라 기반 엔비디아 DGX SuperPOD을 활용한 관리형 서비스인 엔비디아 인스턴트 AI 팩토리(Instant AI Factory)도 공개했다. 또한, 에퀴닉스(Equinix)는 전세계 45개 시장에 위치한 자사의 수랭식 또는 공랭식 AI 전용 데이터센터에서 새로운 DGX GB300과 DGX B300 시스템을 최초로 제공할 예정이다.

 

AI 추론 시대를 견인하는 엔비디아 DGX GB300과 DGX SuperPOD

DGX GB300 시스템을 탑재한 DGX SuperPOD은 수만 개의 엔비디아 그레이스 블랙웰 울트라 슈퍼칩으로 확장이 가능하다. 이들은 엔비디아 NV링크™(NVLink™)와 퀀텀-X800 인피니밴드(Quantum-X800 InfiniBand), 스펙트럼-X 이더넷(Spectrum-X™ Ethernet) 네트워킹으로 연결돼 고도로 계산 집약적인 워크로드의 훈련과 추론을 강화한다.

 

엔비디아 DGX GB300 시스템은 엔비디아 호퍼(Hopper™) 시스템으로 구축된 AI 팩토리 대비 70배 높은 AI 성능과 38TB에 달하는 빠른 메모리를 제공해 에이전틱 AI와 추론 애플리케이션의 다단식 추론에서 탁월한 성능과 확장성을 보여준다.

 

DGX GB300 시스템 각각에 있는 72개의 그레이스 블랙웰 울트라 GPU는 5세대 NV링크 기술로 연결되고 NV링크 스위치(Switch) 시스템을 거쳐 하나의 거대한 공유 메모리 공간이 된다.

 

DGX GB300 시스템은 엔비디아 커넥트X-8(ConnectX®-8) 슈퍼NIC(SuperNIC)를 72개씩 탑재하고 최대 800Gb/s의 가속 네트워킹 속도를 제공해 이전 세대보다 두 배 빠른 성능을 보여준다. 엔비디아 블루필드-3(BlueField®-3) DPU 18개는 엔비디아 퀀텀-X800 인피니밴드 또는 엔비디아 스펙트럼-X 이더넷과 짝을 이뤄 거대 규모 AI 데이터센터의 성능과 효율, 보안을 강화한다.

 

모든 데이터센터의 AI를 가속하는 DGX B300 시스템

엔비디아 DGX B300 시스템은 에너지 효율적인 생성형 AI와 AI 추론을 모든 데이터센터에 제공하기 위해 설계된 AI 인프라 플랫폼이다.

 

엔비디아 블랙웰 울트라 GPU로 가속하는 DGX B300 시스템은 호퍼 세대 대비 추론에서 11배, 훈련에서 4배에 달하는 AI 성능 향상을 제공한다.

 

각 시스템은 2.3TB의 HBM3e 메모리를 제공하며, 엔비디아 커넥트X-8 슈퍼NIC 8개와 블루필드-3 DPU 2개를 갖춘 고급 네트워킹을 포함한다.

 

AI 개발과 배포 가속하는 엔비디아 소프트웨어

엔비디아는 기업의 인프라 유지관리와 운영 자동화를 위한 엔비디아 미션 컨트롤(NVIDIA Mission Control™)도 발표했다. 이는 블랙웰 기반 DGX 시스템을 AI 데이터센터가 운영, 조율하게 해주는 소프트웨어다.

 

엔비디아 DGX 시스템은 엔터프라이즈급 AI 에이전트를 구축, 배포하기 위한 엔비디아 AI 엔터프라이즈(AI Enterprise) 소프트웨어 플랫폼을 지원한다. 여기에는 오늘 발표된 엔비디아 라마 네모트론(Llama Nemotron) 개방형 추론 모델 제품군을 비롯한 엔비디아 NIM™ 마이크로서비스가 포함된다. 또한, AI 에이전트의 성능을 조율하고 최적화하는 데 사용되는 엔비디아 AI 블루프린트(AI Blueprints), 프레임워크, 라이브러리, 도구 등도 제공된다.

 

인프라 수요를 충족시키는 엔비디아 인스턴트 AI 팩토리

엔비디아 인스턴트 AI 팩토리는 블랙웰 울트라 기반 엔비디아 DGX SuperPOD과 엔비디아 미션 컨트롤 소프트웨어를 활용한 에퀴닉스 관리형 서비스를 제공한다.

 

전 세계에 위치한 에퀴닉스 시설을 통해 이 서비스는 최첨단 모델 훈련과 실시간 추론 워크로드에 최적화된 완전 구축형 AI 팩토리를 기업에 제공한다. 이를 통해 수개월씩 걸리곤 하던 사전 인프라 계획 기간을 없앨 수 있다.

 

이용 정보

엔비디아 DGX GB300 또는 DGX B300 시스템이 탑재된 DGX SuperPOD은 올해 하반기에 파트너사들을 통해 출시될 것으로 예상된다.

 

엔비디아 인스턴트 AI 팩토리는 올해 하반기부터 출시 예정이다.

 

여기에서 엔비디아 GTC 기조연설을 시청하고 더 자세한 내용을 확인할 수 있다.

 


관련뉴스 - 관련뉴스가 없습니다.
 

가장 많이 본 뉴스

취재기사 기획/특집 게임정보

화제의동영상