엔비디아( CEO 젠슨 황)가 '엔비디아 L40S GPU'를 탑재한 엔비디아 OVX 서버를 공개했다고 밝혔다. 이 새로운 서버는 엔비디아 옴니버스(NVIDIA Omniverse) 플랫폼을 통해 AI 트레이닝과 추론, 3D 디자인과 시각화, 비디오 처리, 산업 디지털화 등 가장 컴퓨팅 집약적이고 복잡한 애플리케이션을 가속화하도록 설계된 강력하고 범용적인 데이터센터 프로세서이다.
엔비디아 L40S GPU는 텍스트, 이미지, 동영상 생성, 챗봇, 게임 개발, 제품 디자인, 의료 등 산업 전반의 워크플로우와 서비스를 혁신하는 생성형 AI를 위한 가속화된 컴퓨팅 워크로드를 지원한다.
엔비디아의 프로페셔널 비주얼라이제이션(professional visualization) 부문 부사장인 밥 피트(Bob Pette)는 "생성형 AI가 모든 산업을 혁신함에 따라 기업들은 데이터센터에 대규모 컴퓨팅 리소스를 점점 더 많이 찾고 있다. 엔비디아 L40S GPU가 탑재된 OVX 시스템은 AI, 그래픽과 영상 처리 워크로드를 가속화하고 계속해서 더 복잡하고 다양해지는 애플리케이션의 까다로운 성능 요구 사항을 충족한다"고 말했다.
AI, 그래픽을 위한 강력한 성능
엔비디아 OVX 시스템은 서버당 최대 8개의 엔비디아 L40S GPU를 지원하며, 각각 48GB의 메모리가 장착돼 있다. L40S는 엔비디아 에이다 러브레이스(Ada Lovelace) GPU 아키텍처를 기반으로 한다. 여기에는 4세대 텐서 코어(Tensor Cores)와 FP8 트랜스포머 엔진(Transformer Engine)이 포함돼 있어 1.45페타플롭스 이상의 텐서 처리 성능을 제공한다. 수십억 개의 매개변수와 텍스트, 영상과 같은 여러 데이터 양식이 포함된 복잡한 AI 워크로드의 경우, L40S는 엔비디아 A100 텐서 코어 GPU에 비해 최대 1.2배의 생성 AI 추론 성능과 최대 1.7배의 트레이닝 성능을 제공한다.
엔비디아 L40S GPU에는 212테라플롭의 레이 트레이싱 성능을 제공하는 142개의 3세대 RT 코어가 포함돼 있다. 실시간 렌더링, 제품 디자인, 3D 콘텐츠 제작과 같은 고충실도 전문 시각화 워크플로우를 지원하기 위함이다. 이를 통해 크리에이티브 전문가들은 몰입감 넘치는 시각적 경험과 사실적인 콘텐츠를 제작할 수 있다.
더불어 엔지니어링, 과학 시뮬레이션과 같이 계산이 까다로운 워크플로우를 위해 엔비디아 L40S에는 18,176개의 쿠다(CUDA)® 코어가 포함됐다. 이는 복잡한 계산과 데이터 집약적인 분석을 가속화할 수 있도록 엔비디아 A100 GPU보다 약 5배 높은 단정밀도 부동소수점(FP32) 성능을 제공한다.
조기 채택
대규모 GPU 가속 워크로드에 특화된 코어위브(CoreWeave)는 L40S 인스턴스를 제공한 최초의 클라우드 서비스 제공업체 중 하나이다.
코어위브 최고기술책임자(CTO)인 브라이언 벤투로(Brian Venturo)는 "생성형 AI가 폭발적으로 증가함에 따라 업계 전반의 고객들은 인터랙티브 영상부터 AI 설계와 자동화에 이르기까지 모든 워크로드의 복잡성에 맞는 강력한 컴퓨팅 제품과 규모를 찾고 있다. 엔비디아 L40S GPU는 우리의 광범위한 엔비디아 솔루션 포트폴리오를 더욱 확장할 것이다. 코어위브는 차세대 셍성형 AI 애플리케이션을 지원하는 빠르고 효율적이며 비용 효율적인 가속 컴퓨팅을 위해 새로운 리소스를 제공하는 최초의 전문 클라우드 제공업체가 될 것"이라고 말했다.
AI를 강화하는 소프트웨어
L40S GPU를 사용하는 기업은 엔비디아 AI 엔터프라이즈(AI Enterprise) 소프트웨어의 주요 업데이트 이점을 누릴 수 있다. 이 소프트웨어는 시뮬레이션을 위한 엔비디아 모듈러스(Modulus), 데이터 사이언스를 위한 엔비디아 래피즈(RAPIDS), 프로덕션 AI를 위한 엔비디아 트리톤 추론 서버(Triton Inference Server) 등 100개 이상의 프레임워크, 사전 훈련된 모델, 툴킷, 소프트웨어에 대한 프로덕션 지원과 보안을 제공한다.
옴니버스 확장
더불어 엔비디아는 옴니버스 플랫폼의 주요 업데이트를 발표했다. 여기에는 개발자가 생성형 AI의 강력한 성능으로 오픈USD 파이프라인과 산업 디지털화 애플리케이션을 가속화하고 발전시킬 수 있는 기능과 플랫폼 개선 사항이 포함된다. 옴니버스 클라우드를 구동하는 차세대 엔비디아 OVX 시스템에는 L40S GPU가 탑재돼 생성형 AI 파이프라인과 옴니버스 워크로드를 강화하는 데 필요한 AI와 그래픽 성능을 제공할 예정이다.
가용성
엔비디아 L40S는 올가을부터 출시될 예정이다. 에이수스(ASUS), 델 테크놀로지스(Dell Technologies), 기가바이트(GIGABYTE), HPE, 레노버(Lenovo), QCT, 슈퍼마이크로(Supermicro)로 등 글로벌 시스템 제조업체들이 엔비디아 L40S GPU가 포함된 OVX 시스템을 제공할 예정이다. 이러한 서버는 전 세계 전문가들이 AI를 발전시키고 지능형 챗봇, 검색, 요약 도구와 같은 생성형 AI 애플리케이션을 산업 전반의 사용자에게 제공할 수 있도록 지원할 것이다.
| |
| |
| |
| |
|
관련뉴스 | - 관련뉴스가 없습니다. |