엔비디아가 '지포스 RTX(GeForce RTX) 50' 시리즈 GPU의 AI 워크로드를 가속화하는 엔비디아(NVIDIA) NIM과 AI 블루프린트(AI Blueprint)를 공개했다. NIM과 AI 블루프린트는 개발자와 애호가들이 AI를 로컬에서 구축, 반복, 배포할 수 있도록 도와 AI 접근성을 확대한다.
엔비디아 지포스 RTX 5090, 5080 GPU는 획기적인 엔비디아 블랙웰(Blackwell) 아키텍처를 기반으로 설계됐다. 블랙웰 아키텍처는 새로운 DLSS 멀티 프레임 생성(Multi Frame Generation)을 지원해 렌더링된 프레임당 최대 3개의 프레임을 생성하는 AI를 사용해 FPS를 향상시킨다. 이들 GPU는 엔비디아 DLSS 4 기술로 최대 8배 빠른 프레임 속도, 엔비디아 리플렉스 2(Reflex 2)로 낮은 지연 시간, 엔비디아 RTX 뉴럴 셰이더로 향상된 그래픽 충실도를 제공한다.
또한, 이들은 최신 생성형 AI 워크로드를 가속화하기 위해 제작됐다. 초당 최대 3,352조 개의 AI 연산(TOPS)을 처리하는 한편, 5세대 텐서 코어와 FP4 정밀도 지원 기능을 갖춰 고급 AI 모델의 실행 속도를 높이고 효율성을 증가시킨다. 이에 따라 AI 애호가, 게이머, 크리에이터, 개발자들에게 놀라운 경험을 선보인다.
엔비디아는 지난달 CES 전시회에서 AI 개발자와 애호가들이 이러한 기능을 활용할 수 있도록 RTX용 엔비디아 NIM과 AI 블루프린트를 공개했다. 엔비디아 NIM 마이크로서비스는 사전 패키지 생성형 AI 모델이다. 이는 개발자와 애호가들이 생성형 AI를 쉽게 시작하고, 빠르게 반복하며, RTX의 성능을 활용해 윈도우(Windows) PC에서 AI를 가속화할 수 있도록 한다. 엔비디아 AI 블루프린트는 개발자들에게 NIM 마이크로서비스를 사용해 차세대 AI 경험을 구축하는 방법을 보여주는 참조 프로젝트이다.
NIM과 AI 블루프린트는 지포스 RTX 50 시리즈 GPU에 최적화돼 있다. 이 두 가지 기술은 원활하게 연동돼 개발자와 애호가들이 AI PC에서 최첨단 AI 경험을 구축, 반복, 제공할 수 있도록 지원한다.
엔비디아 NIM, PC에서 생성형 AI 가속화
AI 모델 개발이 빠르게 발전하고 있지만, 이러한 혁신을 PC에 적용하는 것은 많은 사람들에게 여전히 어려운 과제이다. 허깅페이스(Hugging Face)와 같은 플랫폼에 게시된 모델은 PC에서 실행하기 위해 선별, 조정, 정량화돼야 한다. 아울러 기존 도구와의 호환성을 보장하기 위해 새로운 AI 애플리케이션 프로그래밍 인터페이스(application programming interface, API)에 통합돼야 한다. 또한, 최고의 성능을 발휘할 수 있도록 최적화된 추론 백엔드로 변환돼야 한다.
RTX AI PC와 워크스테이션을 위한 엔비디아 NIM 마이크로서비스는 커뮤니티 기반과 엔비디아가 개발한 AI 모델에 대한 접근을 제공함으로써 이러한 과정의 복잡성을 완화할 수 있다. 이 마이크로서비스는 업계 표준 API를 통해 쉽게 다운로드하고 연결할 수 있으며, AI PC에 필수적인 주요 양식을 포괄한다. 나아가 다양한 AI 도구와 호환되며, PC, 데이터센터, 클라우드 등 어디에서나 유연한 배포 옵션을 제공한다.
NIM 마이크로서비스는 RTX GPU가 탑재된 PC에서 최적화된 모델을 실행하는 데 필요한 모든 것이 포함한다. 이는 특정 GPU용 사전 구축 엔진, 엔비디아 텐서RT(TensorRT) 소프트웨어 개발 키트(software development kit, SDK), 텐서 코어(Tensor Core)를 사용한 가속 추론용 오픈 소스 엔비디아 텐서RT-LLM 라이브러리 등을 포함한다.
마이크로소프트(Microsoft)와 엔비디아는 리눅스용 윈도우 서브시스템(Windows Subsystem for Linux, WSL2)에서 RTX용 NIM 마이크로서비스와 AI 블루프린트를 활성화하기 위해 협력했다. WSL2를 사용하면 데이터센터 GPU에서 실행되는 것과 동일한 AI 컨테이너를 RTX PC에서 효율적으로 실행할 수 있다. 덕분에 개발자는 플랫폼 전반에 걸쳐 보다 쉽게 AI 모델을 구축, 테스트, 배포할 수 있다.
추가적으로 NIM과 AI 블루프린트는 5세대 텐서 코어와 FP4 정밀도 지원 등, 지포스 RTX 50 시리즈의 기반이 되는 블랙웰 아키텍처의 주요 혁신을 활용한다.
차세대 AI 성능을 이끄는 텐서 코어
AI 계산은 매우 까다롭고 막대한 처리 능력을 필요로 한다. 이미지나 비디오 생성, 언어 이해, 실시간 의사 결정 등 AI 모델은 매초마다 수백 조의 수학적 연산을 수행해야 한다. 이를 따라잡기 위해 컴퓨터는 AI 전용으로 제작된 특수 하드웨어가 필요하다.
AI 기반 워크플로우에서 최고의 속도와 효율성을 위해 최대 3,352 AI TOPS를 제공하는 엔비디아 지포스 RTX 데스크톱 GPU
지난 2018년 엔비디아 지포스 RTX GPU는 이러한 집중적인 워크로드를 처리하도록 설계된 전용 AI 프로세서인 텐서 코어를 도입함으로써 게임의 판도를 바꿨다. 기존의 컴퓨팅 코어와 달리, 텐서 코어는 더 빠르고 효율적으로 계산을 수행함으로써 AI를 가속화하도록 설계됐다. 이 혁신적인 기술 덕분에 AI 기반 게임, 창작 도구, 생산성 애플리케이션이 주류로 자리 잡을 수 있었다.
블랙웰 아키텍처는 AI 가속을 한 차원 더 발전시킨다. 블랙웰 GPU의 5세대 텐서 코어는 최대 3,352 AI TOPS를 제공해 더욱 까다로운 AI 작업을 처리하고 동시에 여러 AI 모델을 실행할 수 있다. 즉, 실시간 렌더링에서 지능형 어시스턴트에 이르기까지 더 빠른 AI 기반 경험을 제공해 게이밍, 콘텐츠 제작과 그 밖의 분야에서 더 큰 혁신을 이룰 수 있는 길을 열어준다.
더 작은 모델에서 더 큰 성능을 실현하는 FP4
AI 성능을 최적화하는 또 다른 방법은 양자화이다. 양자화는 모델 크기를 줄여 모델이 더 빠르게 실행되도록 하며, 메모리 요구 사항을 줄이는 기술이다.
여기서 FP4가 등장한다. 이는 AI 모델이 출력 품질을 저하시키지 않으면서 더 빠르고 경량으로 실행될 수 있도록 해주는 고급 양자화 포맷이다. FP16에 비해 모델 크기를 최대 60%까지 줄일 수 있고, 성능은 2배 이상 향상시키면서 성능 저하를 최소화할 수 있다.
예를 들어, 블랙 포레스트 랩스(Black Forest Labs)의 플럭스.1(FLUX.1) [dev] 모델은 FP16에서 23GB 이상의 VRAM을 필요로 한다. 즉, 지포스 RTX 4090과 전문가용 GPU에서만 지원될 수 있다. 반면 FP4를 사용하면 플럭스.1 [dev]는 10GB 미만의 VRAM만 필요로 해, 더 많은 지포스 RTX GPU에서 로컬로 실행할 수 있다.
FP16를 사용하는 지포스 RTX 4090에서 플럭스.1 [dev] 모델은 30단계로 이미지를 생성하는 데 15초가 소요된다. 그러나, FP4를 사용하는 지포스 RTX 5090의 경우, 약 5초만에 이미지를 생성할 수 있다.
FP4는 블랙웰 아키텍처에 기본적으로 지원돼, 로컬 PC에 고성능 AI를 배포하는 것이 그 어느 때보다 쉬워졌다. 아울러 NIM 마이크로서비스에 통합돼 이전에는 양자화가 어려웠던 모델을 효과적으로 최적화한다. FP4는 보다 효율적인 AI 처리를 가능하게 함으로써 콘텐츠 제작을 위한 더 빠르고 스마트한 AI 경험을 제공한다.
AI 블루프린트, RTX PC에서 고급 AI 워크플로우 지원
NIM 마이크로서비스에 기반한 엔비디아 AI 블루프린트는 사전 패키지화되고, 최적화된 참조 구현을 제공한다. 이를 통해 디지털 휴먼, 팟캐스트 생성기 또는 애플리케이션 어시스턴트 등 고급 AI 기반 프로젝트를 보다 쉽게 개발할 수 있도록 해준다.
지난 달 CES에서 엔비디아는 사용자가 PDF를 재미있는 팟캐스트로 변환하고, 이후 AI 팟캐스트 호스트와의 Q&A를 만들 수 있는 블루프린트인 PDF 투 팟캐스트(PDF to Podcast)를 시연했다. 이 워크플로우는 모두 동기화된 7가지 다른 AI 모델을 통합해 역동적이고 상호작용적인 경험을 제공한다.
PDF 투 팟캐스트는 여러 AI 모델을 활용해 PDF를 흥미로운 팟캐스트로 매끄럽게 변환하는 AI 블루프린트이다. AI 기반 팟캐스트 호스트가 진행하는 대화형 Q&A 기능도 포함한다.
AI 블루프린트를 사용하면 RTX PC와 워크스테이션에서 AI를 실험하는 것에서 개발하는 단계로 빠르게 넘어갈 수 있다.
RTX PC와 워크스테이션에 곧 탑재될 NIM과 AI 블루프린트
생성형 AI는 게이밍, 콘텐츠 제작 등 다양한 분야에서 가능성의 한계를 넓혀가고 있다. NIM 마이크로서비스와 AI 블루프린트를 사용하면 최신 AI의 발전이 더 이상 클라우드에만 국한되지 않고, RTX PC에 최적화돼 제공된다. RTX GPU를 사용하면 개발자와 애호가들은 PC와 워크스테이션에서 바로 AI를 실험하고 구축하고 배포할 수 있다.
NIM 마이크로서비스와 AI 블루프린트는 곧 출시될 예정이다. 지포스 RTX 50 시리즈, 지포스 RTX 4090과 4080, 엔비디아 RTX 6000과 5000 전문가용 GPU에 대한 초기 하드웨어 지원이 함께 제공될 예정이며, 향후 추가 GPU도 지원될 계획이다.
RTX AI 개러지(RTX AI Garage)에서 블랙웰 아키텍처 기반 새로운 지포스 RTX 50 시리즈 GPU가 어떻게 생성형 AI 시대를 위해 만들어졌는지에 대해 자세히 살펴볼 수 있다.
| |
| |
| |
| |
|
관련뉴스 | - 관련뉴스가 없습니다. |