엔비디아(CEO 젠슨 황)가 미국 새너제이에서 열린 GTC에서 엔비디아 그레이스 블랙웰(NVIDIA Grace Blackwell) 플랫폼을 기반으로 한 엔비디아 DGX™ 개인용 AI 슈퍼컴퓨터 ‘DGX 스파크(DGX Spark)’와 ‘DGX 스테이션™(DGX Station™)’을 발표했다.
DGX 스파크(구 프로젝트 디지츠(Project DIGITS))와 DGX 스테이션™은 블랙웰 울트라(Blackwell Ultra) 플랫폼을 기반으로 한 고성능 그레이스 블랙웰 데스크톱 슈퍼컴퓨터이다. 이들은 AI 개발자, 연구자, 데이터 과학자, 학생이 데스크톱에서 대규모 모델을 프로토타입 제작, 미세 조정, 추론할 수 있도록 지원한다. 사용자는 이러한 모델을 로컬에서 실행하거나, 엔비디아 DGX 클라우드(DGX Cloud), 기타 가속 클라우드, 데이터센터 인프라에 배포할 수 있다.
DGX 스파크와 DGX 스테이션은 기존에 데이터센터에서만 사용할 수 있었던 그레이스 블랙웰 아키텍처의 강력한 성능을 데스크톱으로 가져온다. DGX 스파크와 DGX 스테이션을 개발하는 글로벌 시스템 빌더로는 에이수스(ASUS), 델 테크놀로지스(Dell Technologies), HP(HP Inc), 레노버(Lenovo) 등이 있다.
엔비디아 창립자 겸 CEO인 젠슨 황(Jensen Huang)은 “AI는 컴퓨팅 스택의 모든 계층을 변화시키고 있다. AI 네이티브 개발자와 AI 네이티브 애플리케이션을 위해 설계된 새로운 유형의 컴퓨터가 등장하는 것은 필연적인 일이다. 새로운 DGX 개인용 AI 컴퓨터를 통해 AI가 클라우드 서비스부터 데스크톱, 엣지 애플리케이션까지 확장될 것”이라고 말했다.
DGX 스파크로 혁신 가속
DGX 스파크는 세계에서 가장 작은 AI 슈퍼컴퓨터로, 수백만 명의 연구자, 데이터 과학자, 로봇 개발자, 학생에게 엄청난 성능과 기능을 제공한다. 이를 통해 생성형 AI와 물리 AI의 한계를 뛰어넘을 수 있도록 지원한다.
DGX 스파크의 핵심은 데스크톱 폼 팩터에 최적화된 엔비디아 GB10 그레이스 블랙웰 슈퍼칩(Grace Blackwell Superchip)이다. GB10은 5세대 텐서 코어(Tensor Core)와 FP4를 지원하는 강력한 엔비디아 블랙웰 GPU를 탑재해 초당 최대 1,000조 회의 연산을 수행할 수 있다. 또한, 엔비디아 코스모스 추론(Cosmos Reason) 월드 파운데이션 모델과 엔비디아 GR00T N1 로봇 파운데이션 모델 비롯한 최신 AI 추론 모델을 통해 미세 조정과 추론을 수행할 수 있다.
GB10 슈퍼칩은 엔비디아 NV링크(NVLink™)-C2C 상호 연결 기술을 사용해 5세대 PCIe 대비 5배 높은 대역폭을 지원하는 CPU+GPU 코히어런트 메모리 모델을 구현한다. 이를 통해 GPU와 CPU 간 데이터에 액세스해 메모리 집약형 AI 개발자 워크로드 성능을 최적화할 수 있다.
DGX 스파크 사용자는 엔비디아의 풀스택 AI 플랫폼을 사용해 코드를 거의 변경하지 않고도 모델을 데스크톱에서 DGX 클라우드 또는 기타 가속화된 클라우드나 데이터센터 인프라로 원활하게 이동할 수 있다. 이를 통해 그 어느 때보다도 쉽게 워크플로우의 프로토타이핑, 미세 조정, 반복 작업을 수행할 수 있다.
DGX 스테이션으로 빨라지는 AI 개발
엔비디아 DGX 스테이션은 데스크톱에 AI 개발을 위한 데이터센터 수준의 성능을 구현한다. 이는 엔비디아 GB300 그레이스 블랙웰 울트라 데스크톱 슈퍼칩이 탑재된 최초의 데스크톱 시스템으로, 대규모 훈련과 추론 워크로드 가속화를 위한 784GB의 대용량 코히어런트 메모리 공간을 갖추고 있다. GB300 데스크톱 슈퍼칩은 최신 세대 텐서 코어와 FP4 정밀도를 갖춘 엔비디아 블랙웰 울트라 GPU를 탑재하고 있다. 또한 NV링크-C2C를 통해 고성능 엔비디아 그레이스™ CPU에 연결돼 동급 최고의 시스템 통신과 성능을 지원한다.
DGX 스테이션은 또한 하이퍼스케일 AI 컴퓨팅 워크로드를 강화하도록 최적화된 엔비디아 커넥트X(ConnectX®)-8 슈퍼NIC(SuperNIC)를 갖추고 있다. 초당 최대 800기가비트(Gb/s)의 네트워킹을 지원하는 커넥트X-8 슈퍼NIC는 매우 빠르고 효율적인 네트워크 연결을 제공한다. 이를 통해 보다 큰 워크로드에서도 다수의 DGX 스테이션을 고속 연결하고, AI 워크로드를 위한 네트워크 가속 데이터 전송을 구현한다.
이러한 최첨단 DGX 스테이션 기능과 엔비디아 쿠다(CUDA)-X™ AI 플랫폼을 결합하면 탁월한 데스크톱 AI 개발 성능을 확보할 수 있다.
또한 사용자는 엔비디아 AI 엔터프라이즈(AI Enterprise) 소프트웨어 플랫폼을 사용해 엔비디아 NIM™ 마이크로서비스에 액세스할 수 있다. 이를 통해 엔터프라이즈 지원이 포함된 고도로 최적화되고 배포하기 쉬운 추론 마이크로서비스를 사용할 수 있다.
이용 정보
DGX 스파크 시스템 사전 예약은 3월 19일 시작하며 자세한 내용은 엔비디아 공식 홈페이지에서 확인 가능하다.
DGX 스테이션은 올해 하반기에 에이수스, BOXX, 델, HP, 람다 랩스(Lambda Labs), 슈퍼마이크로(Supermicro)와 같은 제조 파트너를 통해 출시될 예정이다.
여기에서 엔비디아 GTC 기조연설을 시청해 DGX 스테이션에 대해 자세히 알아볼 수 있다.
| |||
| |||
| |||
| |||
|
|
|||
|