엔비디아(CEO 젠슨 황)가 매사추세츠 공과대학교(MIT)와 하버드대학교(Harvard)의 브로드 연구소(Broad Institute)와 파트너십을 체결했다고 발표했다.
학계, 스타트업, 제약 대기업의 바이오메디컬 연구원 등 25,000명 이상의 사용자와 테라 클라우드 플랫폼을 위해 방대한 양의 의료 데이터를 신속하게 분석하는 데 필요한 AI 가속 툴을 제공한다.
이번 협업은 엔비디아(NVIDIA)의 AI 전문지식과 의료 컴퓨팅 플랫폼을 브로드 연구소의 저명한 연구자들이나 과학자들, 개방형 플랫폼과 연결하기 위해 마련했다.
다음의 세 가지 핵심 분야에 초점을 둔다.
- 엔비디아 클라라 파라브릭스(Clara Parabricks) 테라 플랫폼에서 사용 가능: 시퀀싱 데이터의 2차 분석을 위한 GPU 가속 소프트웨어 제품군인 파라브릭스를 이제 6개의 새로운 테라 워크플로우에서 사용할 수 있게 됐다. 사용자는 CPU 기반 환경에서 24시간 걸리는 전체 게놈 분석 작업을 클라라 파라브릭스를 사용하면 단 1시간 남짓 만에 끝낼 수 있을뿐만 아니라 컴퓨팅 비용을 절반 이상 줄일 수 있다.
- 대형 언어 모델(LLM) 구축: 연구진은 생물학의 대형 언어 모델용으로 오늘 발표한 AI 애플리케이션 프레임워크인 엔비디아 바이오네모를 통해 인간 생물학에 대한 이해를 높이기 위해, 생명체의 구성 요소 DNA와 RNA의 기초 모델을 개발할 예정이다.
- 게놈 분석 툴킷(GATK, Genome Analysis Toolkit)에 대한 딥 러닝 향상: 엔비디아는 100,000명 이상의 연구자가 사용하는 산업 표준인 브로드 연구소의 GATK 툴킷에 직접 새로운 딥 러닝 모델을 제공하고 있다. 이 툴킷은 질병과 관련된 유전적 변이를 식별하는 데 도움을 준다. 이는 약물을 발견하려는 연구원에게 새로운 치료법 개발을 지원하게 될 것이다.
엔비디아 의료 부문 부사장 킴벌리 파월(Kimberly Powell)은 "의료 생태계 전반에 걸쳐 질병을 이해하고, 진단을 개발하며, 치료법을 전달하는 데 획기적인 발전을 이끄는 더욱 뛰어난 계산 툴이 필요하다. 브로드 연구소와 협력을 확대하면서 저희는 대규모 언어 모델의 힘을 활용해 궁극적으로 공동 솔루션을 제공하고 연구자의 통찰력과 환자에게 제공할 수 있는 실제적인 혜택 간에 격차를 좁힐 수 있다"라고 말했다.
브로드 연구소는 연구자를 서로 연결해주는 오픈 클라우드 플랫폼을 제공하고 과학의 획기적인 발전을 이루는 데 필요한 데이터 세트와 툴을 제공함으로써 차세대 협업 바이오메디컬 연구를 이끌어내는 것이 목표다.
브로드 연구소의 최고 데이터 책임자인 앤서니 필리파키스(Anthony Philippakis)는 "데이터 혁명의 중심에 서있는 생명 과학 분야에서 연구자들은 바이오의학에 머신 러닝을 도입하기 위한 새로운 접근 방식이 매우 필요한 상황이다. 이번 협업으로 데이터 공유와 협업 프로세스의 임무를 유전체학 연구로 확장하는 것이 목표이다"라고 말했다.
질병 연구를 위한 대규모 언어 모델
엔비디아의 바이오네모 프레임워크에는 훈련, 추론, 확장을 간소화하는 단백질 및 화학에 대한 사전 훈련된 대규모 언어모델(LLM)이 포함돼 있다. 바이오네모는 엔비디아 네모 메가트론(NeMo Megatron) 프레임워크의 확장판으로서 화학, 단백질, DNA/RNA 서열에 대해 도메인별로 전문화되어 있다.
바이오네모를 통해 개발자는 수십억 개의 매개 변수를 가진 생물 대규모 언어모델(LLM)을 효과적으로 훈련하고 배치할 수 있다. 두 조직의 협업은 이런 작업에 새로운 모델을 만들어 바이오네모 컬렉션을 확장하고 테라 플랫폼에서 사용할 수 있게 만든다.
도메인 별 AI를 위한 엔비디아 소프트웨어
엔비디아 파라브릭스 GPU 가속 워크플로우는 광범위한 게놈 데이터를 분석하는 데 처리 시간을 줄이며 비용을 절감한다. 브로드 연구소의 게놈 분석 툴킷(GATK) 모범 사례인 생식 계열 워크플로우의 경우는 GPU에서 파라브릭스를 통해 분석하면 속도가 최대 24배까지 향상되며 비용을 절반 이상 절감할 수 있다.
또한 브로드 연구소 연구진은 의료 이미징 AI를 위한 오픈 소스 딥 러닝 프레임워크인 모나이(MONAI)는 물론, 게놈 단세포 분석에 사용되고 데이터 준비 속도를 높여주는 GPU 가속 데이터 과학 툴킷인 엔비디아 래피드(NVIDIA RAPIDS)도 사용할 수 있다.
클라라 파라브릭스와 테라 통합에 대해 더 자세히 알아보고 여기에서 엔비디아 바이오네모 LLM 서비스 얼리 엑세스에 가입할 수 있다.
| |
| |
| |
| |
|
관련뉴스 | - 관련뉴스가 없습니다. |