엔비디아 로컬PC에서 파운데이션 모델 지원, 생성형 AI 접근성 향상 : Global No.1 Game Media 게임포커스

뉴스홈 > 뉴스센터 > IT

엔비디아 로컬PC에서 파운데이션 모델 지원, 생성형 AI 접근성 향상

등록일 2024년04월11일 10시29분

게임포커스 이혁진 기자 (baeyo@gamefocus.co.kr)

엔비디아가 엔비디아 지포스(NVIDIA GeForce)와 '엔비디아 RTX GPU'가 탑재된 PC와 워크스테이션에서 파운데이션 모델을 로컬로 실행할 수 있다고 밝혔다.

초고층 빌딩은 튼튼한 기초에서 시작된다. AI로 구동되는 애플리케이션도 마찬가지이다.

파운데이션 모델은 일반적으로 비지도형 기계 학습을 통해 방대한 양의 원시 데이터로 학습된 AI 신경망이다. 이는 인간과 유사한 언어를 이해하고 생성하도록 훈련된 일종의 인공지능 모델이다. 이제 컴퓨터가 인간처럼 단어와 문장의 문맥과 의미를 이해할 수 있도록 방대한 양의 책을 읽고 학습할 수 있는 라이브러리를 제공할 수 있게 됐다.

파운데이션 모델은 심층적인 지식 기반과 자연어 의사소통 능력을 갖추고 있다. 이는 텍스트 생성과 요약, 코파일럿 제작과 컴퓨터 코드 분석, 이미지와 비디오 제작, 오디오 변환과 음성 합성 등 광범위한 애플리케이션에 유용하게 활용될 수 있다.

가장 주목할 만한 생성형 AI 애플리케이션 중 하나인 챗GPT(ChatGPT)는 오픈AI(OpenAI)의 GPT 파운데이션 모델로 구축된 챗봇이다. 현재 네 번째 버전인 GPT-4는 텍스트나 이미지를 수집하고 텍스트 또는 이미지를 생성할 수 있는 대규모 멀티모달 모델이다.

파운데이션 모델을 기반으로 구축된 온라인 앱은 일반적으로 데이터 센터에서 해당 모델에 액세스하게 된다. 하지만 이제 이러한 모델과 해당 모델에서 구동되는 애플리케이션의 상당수는 엔비디아 지포스(GeForce)와 엔비디아 RTX GPU가 탑재된 PC와 워크스테이션에서 로컬로 실행할 수 있다.

파운데이션 모델 사용 사례

파운데이션 모델은 다음과 같은 다양한 기능을 수행할 수 있다.

- 언어 처리: 텍스트 이해와 생성

- 코드 생성: 다양한 프로그래밍 언어의 컴퓨터 코드 분석과 디버깅

- 시각 처리: 이미지 분석과 생성

- 음성: 텍스트 음성 생성과 음성을 텍스트로 변환

이러한 기능은 그대로 사용하거나 더 정교하게 수정해서 사용할 수 있다. 각 생성형 AI에 대해 완전히 새로운 AI 모델을 학습시키는 과정은 비용과 시간이 많이 소요된다. 따라서 사용자는 일반적으로 특정한 사용 사례에 맞게 파운데이션 모델을 미세 조정한다.

사전 훈련된 파운데이션 모델은 검색 증강 생성(Retrieval-augmented generation, RAG)과 같은 프롬프트와 데이터 검색 기술 덕분에 놀라운 성능을 발휘한다. 또한 파운데이션 모델은 전이 학습에 탁월하므로 본래의 목적과 관련된 다른 작업을 수행하도록 훈련할 수도 있다.

예를 들어, 사람과 대화하도록 설계된 범용 거대 언어 모델(large language models, LLM)은 기업 지식 기반을 사용해 질문에 답변할 수 있는 고객 서비스 챗봇으로 작동하도록 추가 훈련시킬 수 있다.

다양한 산업 분야의 기업들은 AI 애플리케이션에서 최상의 성능을 얻기 위해 파운데이션 모델을 미세 조정하고 있다.

파운데이션 모델의 유형

현재 100개 이상의 파운데이션 모델이 사용되고 있으며 그 수는 계속 증가하고 있다. LLM과 이미지 생성기는 가장 인기 있는 두 가지 유형의 파운데이션 모델이다. 그리고 이 중 다수는 엔비디아 API 카탈로그에서 누구든지 모든 하드웨어에서 무료로 사용해 볼 수 있다.

LLM은 자연어를 이해하고 쿼리에 응답할 수 있는 모델이다. 텍스트 이해, 변환, 코드 생성에 탁월한 구글(Google) 젬마(Gemma)가 대표적인 예로 꼽을 수 있다. 젬마는 천문학자 코넬리우스 젬마(Cornelius Gemma)에 대한 질문에 "천문 항법 그리고 천문학에 대한 그의 공헌은 과학 발전에 큰 영향을 미쳤다"고 설명했다. 또한 그의 주요 업적, 유산 그리고 기타 사실에 대한 정보도 제공했다.

RTX GPU의 엔비디아 텐서RT-LLM(TensorRT-LLM)으로 가속화된 젬마 모델의 협업을 확장한 구글의 코드젬마(CodeGemma)는 커뮤니티에 강력하면서도 가벼운 코딩 기능을 제공한다. 코드젬마 모델은 코드 완성과 코드 생성 작업에 특화된 7B와 2B 사전 훈련된 버전으로 사용할 수 있다.

미스트랄 AI(Mistral AI)의 미스트랄 LLM은 명령을 따르고 요청을 완수하며 창의적인 텍스트를 생성할 수 있다.

메타(Meta)의 라마2(Llama 2)는 프롬프트에 응답해 텍스트와 코드를 생성하는 최첨단 LLM이다.

미스트랄과 라마2는 RTX PC와 워크스테이션에서 실행되는 엔비디아 챗RTX(ChatRTX) 기술 데모에서 사용할 수 있다. 챗RTX를 통해 사용자는 문서, 의사의 진단서, 기타 데이터와 같은 개인 콘텐츠에 RAG을 통해 연결함으로써 이러한 파운데이션 모델을 개인화할 수 있다. 이는 텐서RT-LLM으로 가속화돼 상황에 맞는 답변을 빠르게 얻을 수 있다. 또한 로컬에서 실행되므로 결과를 빠르고 안전하게 얻을 수 있다.

스태빌리티 AI(Stability AI)의 스테이블 디뷰전 XL(Stable Diffusion XL), SDXL 터보(SDXL Turbo)와 같은 이미지 생성기를 사용하면 놀랍고 사실적인 비주얼을 생성할 수 있다. 스태빌리티 AI의 비디오 생성기인 스테이블 비디오 디퓨전(Stable Video Diffusion)은 생성형 확산 모델을 사용해 단일 이미지를 컨디셔닝 프레임으로 삼아 비디오 장면을 합성한다.

멀티모달 파운데이션 모델은 텍스트와 이미지 등 두 가지 이상의 데이터 유형을 동시에 처리해 보다 정교한 결과물을 생성할 수 있다.

멀티모달 모델은 텍스트와 이미지를 모두 지원하기 때문에 사용자가 이미지를 업로드하고 이에 대해 질문할 수 있게 해준다. 이러한 유형의 모델은 고객 서비스와 같은 실제 애플리케이션에 빠르게 적용되고 있으며, 기존 매뉴얼을 보다 빠르고 사용자 친화적인 버전으로 대체할 수 있다.

코스모스 2(Kosmos 2)는 이미지의 시각적 요소를 이해하고 추론하도록 설계된 마이크로소프트(Microsoft)의 획기적인 멀티모달 모델이다.

글로벌하게 생각하고, 로컬로 AI 모델 실행하기

지포스 RTX와 엔비디아 RTX GPU는 파운데이션 모델을 로컬에서 실행할 수 있다. 그 덕분에 빠르고 안전하게 결과를 얻을 수 있다.

사용자는 클라우드 기반 서비스에 의존하는 대신 챗RTX와 같은 앱을 활용해 제3자와 데이터를 공유하거나 인터넷에 연결할 필요 없이 로컬 PC에서 민감한 데이터를 처리할 수 있다.

사용자는 빠르게 증가하는 개방형 파운데이션 모델 카탈로그 중에서 자신의 하드웨어에서 다운로드하고 실행할 모델을 선택할 수 있다. 이렇게 하면 클라우드 기반 앱과 API를 사용할 때보다 비용이 절감되고 지연 시간과 네트워크 연결 문제가 발생하지 않는다.

▶ "이 열차팀, 수상할 정도로 치킨에 진심이다" 호요버스 '붕괴 ...

▶ 네오위즈 로키 스튜디오, '디제이맥스 미라클' 오프라인 이벤...

▶ 메타보라 싱가폴 'BORA 3.0' 업데이트 계획 발표...

▶ 넥슨 'FC 온라인', 'FC 모바일' 2024 상반기 제주도 교육여행 ...

▶ 공포만화 거장 이토 준지의 몰입형 체험전시 '이토 준지 호러...

관련뉴스	- 관련뉴스가 없습니다.

"이 열차팀, 수상할 정도로 치킨...

포켓몬코리아 '포켓몬' 팬들을 ...

"강남역은 나 '은랑'이 접수했다...

가장 많이 본 뉴스

취재기사

기획/특집

게임정보

1	'기억이 무너진 신을 구원하라' 넥슨 '던파...

2	'T1', 한화생명 누르고 6연속 LCK 결승 진...

3	네오노비스 '이지투온 리부트 : R', 日 인...

4	데브시스터즈 '쿠키런: 킹덤' 팝업 카페 '...

5	엔씨와 '롬' 저작권 소송 레드랩게임즈 입...

6	'스타시드'와 '별이되어라2' 매출 순위 상...

7	시프트업 신작 '스텔라 블레이드' 데모 버...

8	봄과 함께 찾아온 KBO 개막! 팬심 사로잡는...

9	넥슨 '빌딩앤파이터', 출시 약 8개월 여만...

10	서울서 다시 열린 '소닉' 공식 팬미팅 "다...

"이 열차팀, 수상할 정도로 치킨에 진...

포켓몬코리아 '포켓몬' 팬들을 위한 특...

"강남역은 나 '은랑'이 접수했다"... ...

"미라클 메이드 킹덤에 어서오세요" 스...

[포토] "호텔 레버리에 어서오세요" 호...

화제의동영상

2025년까지 기다릴 수 있을까? 락스타게임...	[지스타23] 크래프톤 K-심즈 '인조이' 지스...
[지스타22] 전쟁 게임이 줄 수 있는 재미를...	[지스타22]크래프톤 서바이벌 호러 게임 '...

(주)지원커뮤니케이션즈 / 등록번호 : 서울 아01363 / 등록일자 : 2010. 09. 29 / 발행일자 : 2010. 06. 01
제호 : 게임포커스 / 발행인 : 김세영 / 편집인 : 김세영 / 청소년보호책임자 : 백혜수
발행소 : 서울시 서초구 효령로 61 이수빌딩 401호 / 전화번호 : 02-6053-7894 / 02-6053-7892
게임포커스의 모든 컨텐츠(기사)는 저작권법의 보호를 받으며, 무단 전재 및 복사, 배포를 금합니다.
Copyright(c) 2010 Global No.1 Game Media 게임포커스 All rights reserved.

뉴스센터

게임정보

오피니언

멀티미디어센터

엔비디아 로컬PC에서 파운데이션 모델 지원, 생성형 AI 접근성 향상

가장 많이 본 뉴스

화제의동영상