엔비디아, 모델 양자화로 '스테이블 디퓨전 3.5' 성능 대폭 향상 : Global No.1 Game Media 게임포커스

뉴스홈 > 뉴스센터 > IT

엔비디아, 모델 양자화로 '스테이블 디퓨전 3.5' 성능 대폭 향상

등록일 2025년06월18일 10시08분

게임포커스 박종민 기자 (jjong@gamefocus.co.kr)

엔비디아가 양자화를 통해 '스테이블 디퓨전 3.5(Stable Diffusion 3.5)' 모델의 성능을 대폭 향상시켰다고 발표했다.

생성형 AI는 사람들이 디지털 콘텐츠를 만들고, 상상하며, 상호작용하는 방식을 혁신적으로 바꾸고 있다.

그러나 지속적으로 AI 모델의 기능이 향상되고 복잡성이 증가면서 더 많은 VRAM이 요구되고 있다. 예를 들어 기본 스테이블 디퓨전 3.5 라지(Large) 모델은 18GB 이상의 VRAM을 사용하므로 고성능 시스템이 아니면 실행이 어렵다.

하지만 이 모델에 양자화를 적용하면 중요하지 않은 레이어를 제거하거나 더 낮은 정밀도로도 실행할 수 있다. 엔비디아 지포스(GeForce) RTX 40 시리즈와 에이다 러브레이스(Ada Lovelace) 세대 엔비디아 RTX PRO GPU는 FP8 양자화를 지원해 이러한 경량화된 모델을 실행할 수 있다. 또한 최신 엔비디아 블랙웰(Blackwell) GPU는 FP4도 지원한다.

엔비디아는 스태빌리티 AI(Stability AI)와 협력해 최신 모델인 스테이블 디퓨전 3.5 라지를 FP8로 양자화해 VRAM 사용량을 40%까지 줄였다. 여기에 엔비디아 텐서RT(TensorRT) 소프트웨어 개발 키트(SDK)를 통한 최적화로 스테이블 디퓨전 3.5 라지와 미디엄 모델의 성능을 2배로 끌어올렸다.

또한, 텐서RT가 RTX AI PC 환경을 위해 새롭게 설계됐다. 업계 최고 수준의 성능과 JIT(Just-In-Time), 온디바이스 엔진 구축 기능을 더하고 패키지 크기를 8배 줄여 1억 대 이상의 RTX AI PC에 AI를 원활하게 배포할 수 있게 됐다. RTX용 텐서RT는 이제 개발자를 위한 독립형 SDK로 제공된다.

RTX 기반 AI 가속

엔비디아와 스태빌리티 AI는 세계에서 가장 인기 있는 AI 이미지 생성 모델 중 하나인 스테이블 디퓨전 3.5의 성능을 높이고 VRAM 요구 사항을 낮췄다. 엔비디아 텐서RT 가속과 양자화 기술을 통해, 사용자는 엔비디아 RTX GPU에서 이미지를 더 빠르고 효율적으로 생성하고 편집할 수 있다.

프롬프트: 해 뜨는 고요한 산속 호수, 눈 덮인 봉우리를 반사하는 맑은 물, 호수를 따라 펼쳐진 울창한 소나무 숲, 부드러운 아침 안개, 사진처럼 사실적인 고화질의 생생한 색감

스테이블 디퓨전 3.5 라지의 VRAM 한계를 해결하기 위해 이 모델은 텐서RT를 활용해 FP8로 양자화됐다. 그 결과, VRAM 요구량이 40% 줄어 11GB면 충분해졌다. 즉, 단 한 대의 GPU가 아닌 다섯 대의 지포스 RTX 50 시리즈 GPU가 메모리에서 모델을 동시에 실행할 수 있게 됐다.

또한 스테이블 디퓨전 3.5 라지와 미디엄 모델은 텐서RT를 통해 최적화됐다. 텐서RT는 텐서 코어를 최대한 활용할 수 있도록 설계된 AI 백엔드로, 모델의 가중치와 모델 실행을 위한 명령 체계인 그래프를 RTX GPU에 맞게 최적화한다.

FP8 텐서RT는 스테이블 디퓨전 3.5 라지의 성능을 BF16 파이토치 대비 2.3배 향상시키면서 메모리 사용량은 40% 줄여준다. 스테이블 디퓨전 3.5 미디엄의 경우, BF16 텐서RT는 BF16 파이토치 대비 1.7배 더 빠르다.

FP8 텐서RT를 적용한 결과, 스테이블 디퓨전 3.5 라지 모델은 BF16 파이토치(PyTorch)에서 실행했을 때보다 성능이 2.3배 향상됐고, 메모리 사용량은 40% 감소했다. 스테이블 디퓨전 3.5 미디엄 모델도 BF16 텐서RT를 통해 BF16 파이토치 대비 1.7배 더 높은 성능을 발휘했다.

이처럼 최적화된 모델은 현재 스태빌리티 AI의 허깅페이스(Hugging Face) 페이지에서 이용할 수 있다.

또한 엔비디아와 스태빌리티 AI는 스테이블 디퓨전 3.5 모델을 엔비디아 NIM 마이크로서비스 형태로도 출시할 계획이다. 이를 통해 크리에이터와 개발자는 다양한 애플리케이션에서 보다 쉽게 모델을 접근하고 배포할 수 있게 된다. 해당 NIM 마이크로서비스는 오는 7월 출시될 예정이다.

RTX용 텐서RT SDK 출시

엔비디아 RTX용 텐서RT가 독립형 SDK로 새롭게 제공된다. RTX용 텐서RT는 지난 마이크로소프트 빌드(Microsoft Build)에서 발표됐으며, 이미 새로운 윈도우 ML(Windows ML) 프레임워크의 일부로 프리뷰 버전으로 제공되고 있다.

기존에는 개발자가 각 GPU 클래스에 맞는 텐서RT 엔진을 미리 생성하고 패키징해야 했다. 이 과정은 GPU별 최적화가 가능하지만, 시간이 많이 소요되는 단점이 있었다.

그러나 새로운 버전의 텐서RT를 사용하면 개발자는 단 몇 초 만에 디바이스에 최적화되는 범용 텐서RT 엔진을 생성할 수 있다. 이 JIT 컴파일 방식은 소프트웨어 설치 시 또는 기능을 처음 사용할 때 백그라운드에서 실행된다.

새로운 SDK는 통합이 간편해지고, 이전 대비 8배 더 작아졌다. 이는 마이크로소프트의 새로운 AI 추론 백엔드인 윈도우 ML을 통해 쉽게 호출할 수 있다. 새로운 독립형 SDK는 엔비디아 개발자(NVIDIA Developer) 페이지에서 다운로드하거나, 윈도우 ML 프리뷰를 통해 테스트해볼 수 있다.

자세한 내용은 엔비디아 기술 블로그와 마이크로소프트 빌드 관련 블로그 게시글을 통해 확인할 수 있다.

엔비디아 GTC 파리

엔비디아는 지난 6월 10일(화)부터 12일(목)(현지 시간)까지 프랑스 파리에서 열린 유럽 최대 규모의 스타트업, 기술 행사인 비바테크(VivaTech) 기간 중 자체 행사인 엔비디아 GTC 파리(GTC Paris)를 개최했다. 특히 지난 11일(수), 엔비디아 창립자 겸 CEO인 젠슨 황(Jensen Huang)은 클라우드 AI 인프라, 에이전틱 AI, 물리 AI의 최신 혁신을 주제로 기조연설을 진행했다.

이번 GTC 파리에서는 업계 리더들이 이끄는 실습 데모와 기술 세션이 다양하게 마련됐으며, 온라인과 오프라인으로 동시에 진행돼 많은 참가자들의 관심을 끌었다.

매주 RTX AI 개러지(RTX AI Garage) 블로그 시리즈에서는 커뮤니티가 주도하는 AI 혁신과 콘텐츠를 통해, NIM 마이크로서비스와 AI 블루프린트에 대해 자세히 알아보고 있다. 또한, AI PC와 워크스테이션에서 AI 에이전트, 크리에이티브 워크플로우, 디지털 휴먼, 생산성 앱 등을 구축하려는 사람들을 위한 정보를 제공한다.

RTX AI PC 뉴스레터를 구독하거나 페이스북(Facebook), 인스타그램(Instagram), 틱톡(TikTok), X 채널을 구독해 최신 소식을 받아볼 수 있다. 더불어 엔비디아 워크스테이션(Workstation)의 링크드인(LinkedIn), X 채널에서도 관련 소식을 확인할 수 있다.

여기에서 소프트웨어 제품 정보에 대한 안내를 확인할 수 있다.

▶ 미호요, 뇌물 수수 직원 실형 및 협력사 24곳 영구 퇴출 발표....

▶ 클로버게임즈 신작 ‘헤븐헬즈’ 구글 플레이 인기 게임 1위 ...

▶ 아크시스템웍스 아시아 '2026 설맞이 기념 세일' 진행... '길...

▶ 디지털터치, 코에이 테크모 액션 RPG '인왕 3' 발매... 론치 ...

▶ 에이치투 인터렉티브, 액션 RPG ‘그리드폴: 더 다잉 월드’ P...

관련뉴스	- 관련뉴스가 없습니다.

'명일방주: 엔드필드' 출시 맞춰...

6주년 맞은 스테디셀러 '명일방...

새 학기는 '명조'와 함께, 쿠로...

가장 많이 본 뉴스

취재기사

기획/특집

게임정보

1	[금주의 게임일정] 크래프톤 'PUBG: 블라인...

2	'메이플 키우기' '리니지M' 등 순항... '명...

3	넥슨코리아 강대현 공동대표, '메이플 본부...

4	BTS 광화문 컴백 라이브, 넷플릭스로 본다....

5	넥슨, '메이플 키우기' 전액 환불 절차 5일...

6	미호요, 뇌물 수수 직원 실형 및 협력사 24...

7	'이스케이프 프롬 마스'? '타르코프' 니키...

8	'닌텐도 스위치2' 판매량 1500만대 돌파......

9	넥써쓰, ‘몰트북(Moltbook)’ 열풍 속 광...

10	[금주의 게임일정] 위메이드 맥스 '미드나...

'명일방주: 엔드필드' 출시 맞춰 팝업...

6주년 맞은 스테디셀러 '명일방주' 팝...

새 학기는 '명조'와 함께, 쿠로게임즈 ...

한화생명e스포츠 2천 명이 넘는 팬들을...

'검은사막 모바일' 축제 '칼페온 축제'...

화제의동영상

[지스타25] 넷마블 성진우와 군주의 치열한...	레벨 인피니트 'INTO THE INFINITE' 쇼케이...
모든것이 파괴되는 현실같은 전장을 담다. ...	[지스타24] 크래프톤 '딩컴투게더' 개발자 ...

(주)지원커뮤니케이션즈 / 등록번호 : 서울 아01363 / 등록일자 : 2010. 09. 29 / 발행일자 : 2010. 06. 01
제호 : 게임포커스 / 발행인 : 김세영 / 편집인 : 김세영 / 청소년보호책임자 : 백혜수
발행소 : 서울시 서초구 효령로 61 이수빌딩 401호 / 전화번호 : 02-6053-7894 / FAX : 02-6053-7895
게임포커스의 모든 컨텐츠(기사)는 저작권법의 보호를 받으며, 무단 전재 및 복사, 배포를 금합니다.
Copyright(c) 2010 Global No.1 Game Media 게임포커스 All rights reserved.

뉴스센터

게임정보

오피니언

멀티미디어센터

엔비디아, 모델 양자화로 '스테이블 디퓨전 3.5' 성능 대폭 향상

가장 많이 본 뉴스

화제의동영상