|
엔비디아(CEO 젠슨 황)는 미국 새너제이에서 열린 GTC에서 추론 기능을 갖춘 개방형 엔비디아 라마 네모트론(NVIDIA Llama Nemotron) 모델 제품군을 발표했다. 이는 개발자와 기업이 비즈니스에 즉시 활용할 수 있는 기반을 제공해 개인 또는 팀으로 복잡한 작업을 해결할 수 있는 고급 AI 에이전트를 구축하도록 지원한다.
라마 모델을 기반으로 구축된 엔비디아 라마 네모트론 추론 제품군은 온디맨드 AI 추론 기능을 제공한다. 엔비디아는 사후 훈련(Post-Training) 과정을 통해 이들 제품군을 개선하며 다단계 수학, 코딩, 추론, 복잡한 의사 결정 능력 등을 향상시켰다.
이 개선된 프로세스는 기본 모델에 비해 모델의 정확도를 최대 20%까지 높이고, 다른 주요 개방형 추론 모델에 비해 추론 속도를 5배 최적화한다. 추론 성능 향상은 모델이 더 복잡한 추론 작업을 처리하고, 의사 결정 능력을 향상시키며, 기업의 운영 비용을 절감할 수 있음을 의미한다.
액센츄어(Accenture), 암독스(Amdocs), 아틀라시안(Atlassian), 박스(Box), 케이던스(Cadence), 크라우드스트라이크(Crowdstrike), 딜로이트(Deloitte), 아이큐비아(IQVIA), 마이크로소프트(Microsoft), SAP, 서비스나우(ServiceNow) 등 에이전트 AI 플랫폼 선구 기업들이 새로운 추론 모델과 소프트웨어를 위해 엔비디아와 협력하고 있다.
엔비디아 창립자 겸 CEO인 젠슨 황(Jensen Huang)은 “추론과 에이전틱 AI의 도입은 매우 놀라운 일이다. 엔비디아의 개방형 추론 모델, 소프트웨어, 도구는 개발자와 기업들이 가속화된 에이전틱 AI 인력을 구축할 수 있는 기초 자료를 제공한다”고 말했다.
엔터프라이즈 추론의 정확성과 신뢰성을 향상시키는 엔비디아 사후 훈련
라마 네모트론 모델 제품군은 실제 운영 환경에서 바로 사용할 수 있는 AI 추론을 제공하도록 구축됐다. 이는 나노(Nano), 슈퍼(Super), 울트라(Ultra) 크기의 엔비디아 NIM™ 마이크로서비스로 제공되며, 다양한 배포 요구사항에 각각 최적화돼 있다.
나노 모델은 PC와 엣지 디바이스에서 최고의 정확도를 제공하고, 슈퍼 모델은 단일 GPU에서 최고의 정확도와 최고의 처리량을 제공한다. 울트라 모델은 다중 GPU 서버에서 작업을 수행할 때 최상의 정확도를 제공할 예정이다.
엔비디아는 네모트론과 다른 개방형 모델에서 생성된 고품질 큐레이션 합성 데이터와 엔비디아가 공동 제작한 추가 큐레이션 데이터 세트를 사용해 엔비디아 DGX™ 클라우드(DGX™ Cloud)에서 광범위한 사후 훈련을 수행했다.
모델 개발에 사용된 도구, 데이터 세트, 사후 훈련 최적화 기술은 누구나 사용 가능하므로 기업은 자체 맞춤형 추론 모델을 자유롭게 구축할 수 있다.
에이전틱 플랫폼, 엔비디아와 협력해 산업 추론 능력 강화
에이전틱 AI(Agentic AI) 플랫폼 업계 선두 주자들은 라마 네모트론 추론 모델을 이용해 기업에 고급 추론을 제공하고 있다.
마이크로소프트는 라마 네모트론 추론 모델과 NIM 마이크로서비스를 마이크로소프트 애저 AI 파운드리(Azure AI Foundry) 플랫폼에 추가하고 있다. 이는 애저 AI 파운드리 모델 카탈로그를 확장해 고객이 마이크로소프트 365용 애저 AI 에이전트 서비스(Azure AI Agent Service) 등과 같은 서비스를 강화할 수 있는 선택지를 제공한다.
SAP는 라마 네모트론 모델을 활용해 SAP 비즈니스 AI 솔루션(SAP Business AI solutions) 과 SAP의 AI 코파일럿 줄(Joule)을 발전시키고 있다. 또한, SAP ABAP 프로그래밍 언어 모델의 코드 완성 정확도를 높이기 위해 엔비디아 NIM과 엔비디아 네모 마이크로서비스를 사용하고 있다.
SAP의 AI 글로벌 책임자인 월터 선(Walter Sun)은 “우리는 엔비디아와 협력해 라마 네모트론 추론 모델을 줄에 통합해 AI 에이전트를 개선하고, 이를 통해 보다 직관적이고 정확하며 비용 효율적인 AI를 만들고 있다. 이러한 고급 추론 모델은 사용자 쿼리를 정제하고 재작성해 AI가 문의를 더 잘 이해하고, 비즈니스 혁신을 이끄는 더 스마트하고 효율적인 AI 기반 경험을 제공할 수 있도록 한다”고 말했다.
서비스나우는 라마 네모트론 모델을 활용해 더 뛰어난 성능과 정확성을 제공하는 AI 에이전트를 구축하면서 산업 전반의 엔터프라이즈 생산성을 향상시키고 있다.
액센츄어는 오늘 발표된 새로운 산업 에이전트 솔루션을 포함한 AI 리파이너리(AI Refinery) 플랫폼에 엔비디아 라마 네모트론 추론 모델을 제공한다. 이를 통해 고객이 산업별 과제에 맞는 맞춤형 AI 에이전트를 신속하게 개발하고 배포해 비즈니스 혁신을 가속화할 수 있도록 지원하고 있다.
딜로이트는 최근 발표한 조라(Zora) AI 에이전트 AI 플랫폼에 라마 네모트론 추론 모델을 통합할 계획이다. 이 플랫폼은 깊이 있는 기능과 특정 산업에 맞는 비즈니스 지식, 그리고 투명성을 갖춘 AI 에이전트를 통해 사용자의 의사 결정과 행동을 돕고 모방하도록 설계됐다.
에이전틱 AI를 위한 필수 도구를 제공하는 엔비디아 AI 엔터프라이즈
개발자는 새로운 엔비디아 에이전틱 AI 도구와 소프트웨어를 사용해 엔비디아 라마 네모트론 추론 모델을 배포함으로써 협업 AI 시스템에서 고급 추론 기능을 쉽게 활용할 수 있게 된다.
엔비디아 AI 엔터프라이즈(AI Enterprise) 소프트웨어 플랫폼에서 최신 에이전틱 AI 구축을 지원하는 도구와 기술은 다음과 같다:
- 엔비디아 AI-Q 블루프린트(NVIDIA AI-Q Blueprint)는 기업이 자율적으로 인지, 추론, 행동할 수 있는 AI 에이전트에 지식을 연결하도록 지원한다. 엔비디아 NIM 마이크로서비스로 구축된 블루프린트는 멀티모달 정보 검색을 위해 엔비디아 네모 리트리버(NeMo Retriever)를 통합하고 오픈 소스 엔비디아 에이전트IQ(AgentIQ) 툴킷을 사용해 에이전트와 데이터 연결, 최적화, 투명성을 구현한다.
- 엔비디아 AI 데이터 플랫폼(AI Data Platform)은 AI-Q 블루프린트로 구축된 AI 쿼리 에이전트가 포함된 새로운 유형의 기업 인프라를 위한 맞춤형 참조 설계이다.
- 새로운 엔비디아 NIM 마이크로서비스는 복잡한 에이전틱 AI 애플리케이션을 위한 추론을 최적화해 모든 환경에서 지속적인 학습과 실시간 적응을 가능하게 한다. 이 마이크로서비스는 메타(Meta), 마이크로소프트, 미스트랄 AI(Mistral AI)와 같은 주요 모델 제작 업체들이 최신 모델을 안정적으로 배포할 수 있도록 지원한다.
- 엔비디아 네모 마이크로서비스는 AI 에이전트가 인간과 AI가 생성한 피드백을 통해 지속적으로 학습할 수 있는 강력한 데이터 플라이휠(flywheel)을 빠르게 구축, 유지할 수 있는 효율적인 엔터프라이즈급 솔루션을 제공한다. 데이터 플라이휠 구축을 위한 엔비디아 AI 블루프린트는 개발자가 마이크로서비스를 사용해 이 플라이휠을 쉽게 구축하고 최적화할 수 있는 참조 아키텍처를 제공한다.
이용 정보
엔비디아 라마 네모트론 슈퍼 모델과 NIM 마이크로서비스는 build.nvidia.com과 허깅 페이스(Hugging Face)에서 다운로드할 수 있는 호스트형 애플리케이션 프로그래밍 인터페이스로 제공될 예정이다. 엔비디아 개발자 프로그램(Developer Program) 회원은 개발, 테스트, 연구를 위한 목적으로 무료로 이용할 수 있다.
기업들은 가속화된 데이터센터와 클라우드 인프라에서 엔비디아 AI 엔터프라이즈 소프트웨어 플랫폼을 사용해 라마 네모트론 NIM 마이크로서비스를 운영할 수 있다. 개발자는 엔비디아 네모 마이크로서비스가 출시될 때 알림을 받을 수 있도록 등록이 가능하다.
엔비디아 AI-Q 블루프린트는 올해 4월 출시될 예정이며 엔비디아 에이전트IQ 툴킷은 현재 깃허브(GitHub)에서 사용이 가능하다.
| |
| |
| |
| |
|
관련뉴스 | - 관련뉴스가 없습니다. |