엔비디아(CEO 젠슨 황)가 간편한 통합 툴킷인 엔비디아 AI 워크벤치(NVIDIA AI Workbench)를 발표했다. 이를 통해 개발자는 PC 또는 워크스테이션에서 사전 학습된 생성형 AI 모델을 빠르게 생성, 테스트, 맞춤화한 후 거의 모든 데이터센터, 공용 클라우드, 엔비디아 DGX 클라우드 등으로 확장할 수 있다.
AI 워크벤치는 기업이 AI 프로젝트를 시작할 때 겪는 복잡성을 최소화한다. 로컬 시스템에서 실행되는 간소화된 인터페이스를 통해 액세스할 수 있으며, 개발자는 맞춤형 데이터를 사용해 허깅페이스(Hugging Face), 깃허브(GitHub), 엔비디아 NGC와 같은 인기 리포지토리에서 모델을 맞춤화한 다음 여러 플랫폼에서 쉽게 공유할 수 있다.
엔비디아의 엔터프라이즈(Enterprise) 컴퓨팅 부문 부사장인 마누비르 다스(Manuvir Das)는 “전 세계 기업들은 최적의 인프라를 찾아 생성형 AI 모델과 애플리케이션을 구축하기 위해 경쟁하고 있다. 엔비디아 AI 워크벤치는 교차조직팀에 간소화된 경로를 제공함으로써 현대 사업에서 점점 더 필수적인 요소로 떠오르고 있는 AI 기반 애플리케이션을 개발할 수 있도록 지원한다”고 말했다.
AI 개발자를 위한 새로운 시대
현재 수십만 개의 사전 훈련된 모델이 출시돼 있지만, 수많은 오픈 소스 도구를 사용해 모델을 맞춤화하려면 여러 온라인 리포지토리에서 적합한 프레임워크, 도구, 컨테이너를 찾고, 적합한 기술을 사용해 특정 사용 사례에 맞게 모델을 맞춤화해야 한다.
엔비디아 AI 워크벤치를 사용하면 몇 번의 클릭만으로 생성형 AI를 맞춤화하고 실행할 수 있다. 이를 통해 오픈 소스 리포지토리와 엔비디아 AI 플랫폼에서 필요한 모든 엔터프라이즈급 모델, 프레임워크, 소프트웨어 개발 키트, 라이브러리를 통합된 개발자 툴킷으로 가져올 수 있다.
AI 워크벤치는 최신 멀티 GPU 지원 데스크톱 워크스테이션, 하이엔드 모바일 워크스테이션, 가상 워크스테이션을 보강할 수 있으며, 델 테크놀로지스(Dell Technologies), 휴렛팩커드 엔터프라이즈(Hewlett Packard Enterprise), HP 주식회사(HP Inc.), 람다(Lambda), 레노버(Lenovo), 슈퍼마이크로(Supermicro)를 비롯한 여러 선도적인 AI 인프라 제공업체에서 이를 채택하고 있다. 이제 윈도우, 리눅스 기반 엔비디아 RTX PC, 워크스테이션을 사용하는 개발자는 로컬 RTX 시스템에서 엔터프라이즈급 생성형 AI 프로젝트를 시작하고, 데이터센터와 클라우드 컴퓨팅 리소스에 쉽게 액세스해 필요에 따라 확장할 수 있다.
AI 배포를 앞당기는 신규 엔비디아 AI 엔터프라이즈 4.0 소프트웨어
엔비디아는 생성형 AI의 도입을 더욱 가속화하기 위해 엔터프라이즈 소프트웨어 플랫폼의 최신 버전인 엔비디아 AI 엔터프라이즈 4.0을 발표했다. 이 플랫폼은 기업이 생성형 AI를 도입하는 데 필요한 도구를지원하며, 안정적인 프로덕션 배포에 필요한 보안과 API 안정성을 제공한다.
엔비디아 AI 엔터프라이즈는 생성형 AI 배포 간소화를 지원하며, 다음과 같은 도구를 새롭게 제공한다.
엔비디아 네모(NeMo)는 LLM을 구축, 맞춤화, 배포하기 위한 클라우드 네이티브 프레임워크이며, 엔비디아 AI 엔터프라이즈는 네모를 통해 대규모 언어 모델 애플리케이션 제작과 맞춤화를 위한 엔드투엔드 지원을 제공한다.
엔비디아 트리톤 매니지먼트 서비스(Triton Management Service)는 프로덕션 배포의 자동화와 최적화를 지원한다. 기업은 확장 가능한 AI를 효율적으로 운영하기 위해 모델 오케스트레이션을 통해 여러 개의 엔비디아 트리톤 추론 서버(Triton Inference Server)를 쿠버네티스(Kubernetes)에 자동으로 배포할 수 있다.
엔비디아 베이스 커맨드 매니저 에센셜(Base Command Manager Essentials)은 기업이 데이터센터, 멀티클라우드, 하이브리드 클라우드 환경 전반에서 AI 서버의 성능과 활용도를 극대화할 수 있도록 지원하는 클러스터 관리 소프트웨어다.
엔비디아 AI 엔터프라이즈 소프트웨어는 사용자가 클라우드, 데이터센터, 엣지 전반에서 엔비디아 AI 지원 솔루션을 구축하고 실행할 수 있도록 지원한다. 엔비디아 AI 엔터프라이즈 소프트웨어는 메인스트림 엔비디아 인증 시스템(Certified Systems™), 엔비디아 DGX™ 시스템, 모든 주요 클라우드 플랫폼, 새로 발표된 엔비디아 RTX 워크스테이션에서 실행 가능하도록 검증됐다.
선도적인 소프트웨어 기업인 서비스나우(ServiceNow), 스노우플레이크(Snowflake), 더불어 델 생성형 AI 솔루션(Dell Generative AI Solutions)을 제공하는 델 테크놀로지스가 최근 엔비디아와 협업해자사 플랫폼에서 생성형 AI 솔루션과 서비스를 지원한다고 발표했다. 엔비디아 AI 엔터프라이즈 4.0과 엔비디아 네모의 통합을 통해 고객을 위한 프로덕션 지원 생성형 AI의 토대를 제공한다.
엔비디아 AI 엔터프라이즈 4.0은 구글 클라우드(Google Cloud), 마이크로소프트 애저(Microsoft Azure)를포함한 파트너 마켓플레이스와 엔비디아 클라우드 파트너인 오라클 클라우드 인프라스트럭처(Oracle Cloud Infrastructure) 등에 통합될 예정이다.
또한, 애저 머신 러닝(Azure Machine Learning), 클리어ML(ClearML), 도미노 데이터 랩(Domino Data Lab), 런:AI(Run:AI), 웨이츠 앤드 바이어시스(Weights & Biases) 등의 MLOps 제공업체는 프로덕션급 생성형 AI 모델 개발을 간소화하기 위해 엔비디아 AI 플랫폼과의 원활한 통합을 강화하고 있다.
광범위한 파트너 지원
파트너사들은 엔비디아 AI 워크벤치를 다음과 같이 언급했다.
델 테크놀로지스의 커머셜 클라이언트 제품 부문 부사장인 메그하나 팟와르드한(Meghana Patwardhan)은 "델 테크놀로지스와 엔비디아는 기업이 특수 목적의 AI 모델을 구축해 생성형 AI의 막대한 기회를 활용할 수 있도록 최선을 다해 지원하고 있다. 개발자는 엔비디아 AI 워크벤치를 기반으로 전체 델 생성형 AI 솔루션 포트폴리오를 활용해 PC, 워크스테이션, 데이터센터 인프라에서 모델을 맞춤화할 수 있다”고 말했다.
HPE의 AI 최고 제품 책임자인 에반 스팍스(Evan Sparks)는 "대부분의 기업에는 고도로 복잡한 AI 소프트웨어와 시스템을 관리할 수 있는 전문 지식, 예산, 데이터센터 리소스가 없다. HPE 그린레이크(GreenLake) 엣지-투-클라우드 플랫폼에서 원클릭 훈련과 배포를 통해 생성형 AI 프로젝트 생성을 간소화할 수 있는 엔비디아 AI 워크벤치의 잠재력을 기대한다"고 밝혔다.
HP의 첨단 컴퓨팅 솔루션 부문 수석 부사장인 짐 노팅엄(Jim Nottingham)은 "가장 까다로운 데이터 사이언스와 AI 모델에 필요한 성능과 효율성을 제공하는 워크스테이션 시장의 선두주자인 HP는 오랜 기간 동안 엔비디아와 협력해 왔다. HP는 차세대 고성능 시스템, 엔비디아 RTX 에이다 제너레이션(Ada Generation) GPU, 엔비디아 AI 워크벤치를 결합해 기업에 생성형 AI의 강력한 성능을 제공하고 클라우드와 로컬 간에 AI 워크로드를 이동하도록 지원하고 있다"고 말했다.
레노버의 워크스테이션 및 클라이언트 AI 부문 총괄 매니저 겸 부사장인 롭 허먼(Rob Herman)은 "레노버와 엔비디아는 고객이 배포의 복잡성을 극복하고 생성형 AI를 보다 쉽게 구현해 혁신적인 서비스와 제품을 시장에 출시할 수 있도록 지원하고 있다. 개발자는 엔비디아 AI 워크벤치와 레노버 AI 지원 포트폴리오를 통해 스마트 디바이스의 성능을 활용하고 엣지-투-클라우드 인프라 전반으로 확장할 수 있다"고 전했다.
VM웨어의 AI 랩 부사장인 크리스 울프(Chris Wolf)는 "오랜 기간 지속되어 온 VM웨어(VMware)와 엔비디아의 파트너십은 AI 워크로드에 최적화된 엔드 투 엔드 엔터프라이즈 플랫폼을 제공함으로써 모든 비즈니스에서 AI의 잠재력을 실현하는 데 기여해 왔다. 양사는 기업이 생성형 AI에 더 쉽게 접근하고 구현할 수 있도록 지원하고 있다. 엔비디아는 AI 워크벤치를 통해 개발자에게 강력한 도구를 제공해 기업이 차세대 AI 채택을 가속화할 수 있도록 돕고 있다. 개발팀은 새로운 엔비디아 AI 워크벤치를 통해 AI 워크로드를 데스크톱에서 생산으로 원활하게 이동시킬 수 있다"고 말했다.
여기에서 엔비디아 창립자 겸 CEO인 젠슨 황(Jensen Huang)의 시그래프(SIGGRAPH) 기조연설을 온디맨드로 시청하고 엔비디아 AI 워크벤치와 엔비디아 AI 엔터프라이즈 4.0에 대해 자세히 알아볼 수 있다.
여기에서 등록하면 얼리 액세스로 출시되는 AI 워크벤치의 출시 알람을 받아볼 수 있다.
| |
| |
| |
| |
|
관련뉴스 | - 관련뉴스가 없습니다. |