엔비디아(CEO 젠슨 황)가 '엔비디아(NVIDIA) DGX H100' 시스템 상용화를 시작했다고 밝혔다.
전세계의 다양한 고객들이 인텔리전스 제조를 위해 AI 팩토리와 같은 엔비디아 DGX H100 시스템을 사용하고 있다. 이들은 금융, 의료, 법률, IT 및 통신 분야에서 AI 기반 인사이트를 제공하는 서비스를 만들고, 그 과정에서 산업을 혁신하기 위해 노력하고 있다.
수십 가지 사용 사례 중 하나는 공장 장비의 노후화를 예측해 미래의 공장을 더 효율적으로 운영할 수 있도록 하는 것을 목표로 한다.
그린 피직스 AI(Green Physics AI)라고 불리는 이 솔루션은 물체의 CO2 발자국, 수명, 에너지 소비량과 같은 정보를 제조 분야에서 가장 큰 합성 데이터세트라고 주장하는 솔디.ai(SORDI.ai)에 추가한다.
이 데이터 세트를 통해 제조업체는 강력한 AI 모델을 개발하고 공장과 물류창고의 효율성을 최적화하는 디지털 트윈을 만들 수 있다. 또한 그린 피직스 AI를 통해 공장의 제품 및 제품에 들어가는 구성 요소의 에너지와 CO2 절감을 최적화할 수 있다.
스마트 발렛파킹
로봇 공학 분야의 선구자인 보스턴 다이내믹스(Boston Dynamics)에 뿌리를 둔 연구 기관인 보스턴 다이내믹스 AI 인스티튜트(Boston Dynamics AI Institute)는 DGX H100을 사용한다. 이를 통해 연구원들은 공장, 창고, 재난 현장, 궁극적으로는 가정에서 사람들을 돕는 민첩한 모바일 로봇을 상상한다. 예를 들어, 설거지하는 모습을 지켜보거나 자동차의 오일을 갈아주는 것을 로봇이 대신해준다고 상상할 수 있다.
AI 연구소(The AI Institute) CTO 알 리지(Al Rizzi)는 "대학원 시절부터 꿈꿔온 것 중 하나는 나를 따라다니며 유용한 작업을 수행하는 로봇 발렛파킹이었다. 누구나 로봇 발렛파킹을 가질 수 있어야 한다"고 말했다.
이를 위해서는 AI와 로봇공학의 획기적인 발전이 필요하며, 리지는 이를 직접 경험했다. 이는 리지가 보스턴 다이내믹스의 수석 과학자로서 계단을 탐색하고 스스로 문을 열 수 있는 네 발 달린 로봇 스팟(Spot)과 같은 로봇을 개발하는 데 도움을 주었다.
처음에는 DGX H100이 로봇 공학의 핵심 기술인 강화 학습의 작업을 처리할 것이다. 이후에는 실험실의 프로토타입 봇에 직접 연결해 AI 추론 작업을 실행할 예정이다.
리지는 "비교적 컴팩트한 공간에 고성능 컴퓨터가 탑재돼 있어, AI 모델을 쉽게 개발하고 배포할 수 있다"라고 덧붙였다.
차세대 AI를 실행하기 위해 탄생
세계적인 연구 기관이나 포춘 500대 기업이 아니어도 DGX H100을 사용할 수 있다. 스타트업은 생성형 AI의 물결을 타기 위한 최초의 시스템 중 일부를 개봉하고 있다.
예를 들어 런던과 뉴욕에 지사를 두고 있는 시세로(Scissero)는 법률 프로세스를 보다 효율적으로 처리하기 위해 GPT 기반 챗봇을 사용한다. 시세로 GPT는 법률 문서 초안을 작성하고 보고서를 생성하며 법률 조사를 수행할 수 있다.
독일에서는 딥엘(DeepL)이 일본 최대 출판사인 니케이(Nikkei)를 비롯한 고객에게 제공하는 수십 개 언어 간 번역과 같은 서비스를 확장하기 위해 여러 대의 DGX H100 시스템을 사용할 예정이다. 딥엘는 최근 AI 글쓰기 도우미인 딥엘 라이트(DeepL Write)를 출시했다.
헬스케어
DGX H100 시스템 중 다수는 의료 서비스를 발전시키고 환자 치료 결과를 개선할 것이다.
도쿄에서는 도쿄-1 슈퍼컴퓨터의 일부로 신약 개발 프로세스를 가속화하기 위해 시뮬레이션과 AI를 실행할 예정이다. 일본 미쓰이(Mitsui & Co.)가 2021년 11월에 설립한 스타트업인 제우레카(Xeureka)가 이 시스템을 관리한다.
이와는 별도로 독일, 이스라엘, 미국의 병원 및 학술 의료 기관이 DGX H100 시스템의 첫 번째 사용자가 될 것이다.
대학 및 고등연구기관
싱가포르에서 스웨덴에 이르는 대학들이 다양한 분야의 연구를 위해 DGX H100 시스템을 도입하고 있다.
존스 홉킨스 대학교 응용 물리학 연구소(Johns Hopkins University Applied Physics Laboratory)에서는 DGX H100을 사용해 대규모 언어 모델을 훈련한다. 스웨덴 KTH 왕립 연구소는 슈퍼컴퓨팅 역량을 확장하는 데 사용할 예정이다.
다른 사용 사례 중 일본의 인터넷 서비스 회사인 사이버에이전트(CyberAgent)는 스마트 디지털 광고와 유명인 아바타를 제작하고 있다. 또한 에콰도르의 선도적인 통신 서비스 제공업체인 텔코넷(Telconet)은 안전한 도시를 위한 지능형 비디오 분석과 스페인어를 사용하는 고객을 지원하기 위한 언어 서비스를 구축하고 있다.
AI 혁신의 엔진
DGX H100 시스템의 각 엔비디아 H100 텐서 코어 GPU는 이전 GPU보다 평균 약 6배 더 뛰어난 성능을 제공한다. 여기에는 DGX H100가 8개가 탑재돼 있으며, 각 GPU에는 생성형 AI 모델을 가속화하도록 설계된 트랜스포머 엔진(Transformer Engine)이 탑재돼 있다.
8개의 H100 GPU는 엔비디아 NVLink를 통해 연결돼 하나의 거대한 GPU를 생성한다. 확장은 여기서 멈추지 않는다. 조직들은 이전 네트워크보다 두 배 빠른 400Gbps 초저지연 엔비디아 퀀텀 인피니밴드(Quantum InfiniBand)를 사용해 수백 개의 DGX H100 노드를 AI 슈퍼컴퓨터에 연결할 수 있다.
전체 소프트웨어 스택으로 구동
DGX H100 시스템은 컴퓨팅, 스토리지 및 네트워크 인프라를 가속화하고 AI 워크로드를 최적화하기 위한 제품군인 엔비디아 베이스 커멘드(NVIDIA Base Command)에서 실행된다.
또한 데이터 사이언스 파이프라인을 가속화하고 생성형 AI, 컴퓨터 비전 등의 개발 및 배포를 간소화하는 소프트웨어인 엔비디아 AI 엔터프라이즈(NVIDIA AI Enterprise)도 포함돼 있다.
DGX 플랫폼은 고성능과 효율성을 모두 제공한다. DGX H100은 DGX A100 세대보다 페타플롭당 킬로와트 수가 2배 향상됐다.
엔비디아 DGX H100 시스템, DGX POD 및 DGX SuperPOD는 엔비디아의 글로벌 파트너사에서 구매할 수 있다.
엔비디아 엔터프라이즈 컴퓨팅 담당 부사장인 마누비르 다스(Manuvir Das)는 MIT 테크놀로지 리뷰의 퓨처 컴퓨트(Technology Review's Future Compute) 행사에서 강연을 통해 DGX H100 시스템의 상용화를 발표했다.
| |
| |
| |
| |
|
관련뉴스 | - 관련뉴스가 없습니다. |