엔비디아(CEO 젠슨 황)의 창립자 겸 CEO인 젠슨 황(Jensen Huang)이 엔비디아 GPU 테크놀로지 컨퍼런스(GPU Technology Conference, 이하 GTC)의 기조연설에서 인공지능 및 고성능 컴퓨팅의 발전을 선도할 가장 강력한 GPU 컴퓨팅 아키텍처인 볼타(Volta)를 발표했다.
본 기조연설에서는 볼타 기반의 최초의 프로세서인 엔비디아 테슬라(NVIDIA Tesla) V100 데이터센터 GPU도 함께 발표됐다. 테슬라 V100 데이터센터 GPU는 인공지능 추론 및 트레이닝에서 요구되는 뛰어난 속도와 확장성을 지원하며, 고성능 컴퓨팅 및 그래픽 워크로드를 가속화한다.
엔비디아 창업자이자 CEO인 젠슨 황(Jensen Huang)은 "인공지능은 인간 역사상 가장 위대한 기술 발전을 이끌고 있다"며 "인공지능은 지능을 자동화하고 산업 혁명 후 유례 없는 새로운 사회적 진보를 가져올 것"이라고 말했다. 또한 "학습이 가능한 컴퓨터 소프트웨어를 구축하는 혁신적인 인공지능 접근법인 딥 러닝은 무한대의 프로세싱 파워를 요구한다. 이러한 수요에 대응하기 위해 수천 명의 엔비디아 엔지니어들이 지난 3여년 간 볼타 개발에 매진해왔으며, 삶을 변화시키는 인공지능의 잠재력에 대한 업계의 인식을 제고시켜왔다"고 말했다.
엔비디아의 7세대 GPU 아키텍처인 볼타는 210억개 트랜지스터로 구축되었으며, CPU 100대와 같은 수준의 성능으로 딥 러닝을 구현한다.
볼타의 테라플롭 피크 성능은 엔비디아의 현 세대 GPU 아키텍처인 파스칼(Pascal) 대비 5배, 2년 전 출시된 맥스웰(Maxwell) 아키텍처 대비 15배 향상됐다. 이는 무어의 법칙으로 예측된 수준을 4배 가량 넘어선 성능 개선이다.
최근 인공지능 가속화에 대한 그 어느 때보다 큰 수요가 발생하고 있다. 개발자, 데이터 과학자, 연구진 등은 뉴럴 네트워크를 사용한 암 치료법을 개발하고, 자율주행 자동차로 도로 안전성을 강화하고, 보다 스마트한 고객 경험을 제공하는 등 각 분야에서 인공지능을 활용하고 있다.
네트워크가 고도화됨에 따라, 데이터센터는 기하급수적으로 개선된 프로세싱 파워를 제공해야 한다. 또한 자연어 가상 비서(VA), 맞춤화된 검색 및 추천 시스템 등 고도의 정확성을 갖춘 인공지능 기반 서비스의 신속한 도입을 위해 효율적인 확장성을 갖춰야 한다.
볼타는 고성능 컴퓨팅 시스템에 새로운 통찰을 위한 연산 과학 및 데이터 과학에 뛰어난 플랫폼을 제공하며, 고성능 컴퓨팅을 위한 새로운 기준을 제시할 전망이다. CUDA 코어와 새로운 볼타 텐서 코어(Volta Tensor Core)를 통합 아키텍처에 결합시킴으로써, 테슬라 V100 GPU를 탑재한 1대의 서버는 기존 고성능 컴퓨팅에 필요한 수백 개의 일반 CPU를 대체할 수 있다.
첨단 기술
테슬라 V100 GPU는 100 테라플롭 장벽을 허무는 첨단 기술로, 엔비디아의 이전 세대 GPU을 뛰어넘는 딥 러닝 성능을 제공한다. 자세한 내용은 다음과 같다.
텐서 코어(Tensor Core)
인공지능 워크로드를 가속화기 위해 고안됐다. 640개의 텐서 코어를 장착한 V100는 CPU 100개의 성능에 준하는 120 테라플롭 딥 러닝 성능을 구현한다.
새로운 GPU 아키텍처
210억개 이상의 트랜지스터로 구성됐으며, CUDA 코어와 텐서 코어를 통합 아키텍처에 결합해 단일 GPU로 인공지능 슈퍼컴퓨터 급의 성능을 구현한다.
NVLink
CPU와 GPU, 또는 GPU 간의 초고속 연결을 지원하는 차세대 인터커넥트로, 이전 세대 NVLink 대비 최대 2배 가량의 성능을 제공한다.
900 GB/sec HBM2 DRAM
삼성과 협력을 통해 개발되었으며 이전 세대 GPU에 비해 50% 향상된 메모리 대역폭을 제공한다. 볼타의 탁월한 연산 처리량을 지원하기 위해 필수적이다.
볼타 최적화 소프트웨어
CUDA, cuDNN, 텐서RT(TensorRT) 등 볼타에 최적화 된 소프트웨어는 선도적인 프레임워크와 애플리케이션에 쉽게 도입되어 인공지능 및 연구를 가속화 시킬 수 있다.
| |||
| |||
| |||
| |||
|
|
|||
|