애피어, 에이전틱 AI 신뢰성 높이는 ‘리스크 인지 의사결정 프레임워크’ 연구 발표

등록일 2026년03월11일 11시36분 트위터로 보내기

 

애피어(Appier)가 에이전틱 AI 시스템의 신뢰성을 높이는 새로운 연구 결과를 발표했다. 연구개발 역량의 영향력을 더욱 확장하기 위해 애피어 AI 리서치팀은 에이전틱 AI와 거대언어모델(LLM) 등 핵심 분야를 중심으로 미래지향적 기술 연구를 진행하며 마케팅 기술 혁신의 경계를 넓히고 있다.

 

애피어는 최신 논문 “답할 것인가, 거절할 것인가, 추측할 것인가? 언어모델의 리스크 인지 의사결정 (Answer, Refuse, or Guess? Investigating Risk-Aware Decision Making in Language Models)”을 통해 다양한 리스크 조건에서 언어모델이 어떻게 의사결정을 내리는지 체계적으로 측정할 수 있는 평가 프레임워크를 제시했다. 해당 접근은 새로운 방법론적 설계를 기반으로 고위험 시나리오에서 모델의 의사결정 신뢰성을 크게 향상시킬 수 있음을 보여준다.

 

이번 연구는 기업 환경에서 에이전틱 AI를 도입할 때 핵심 과제로 꼽히는 ‘자율적 AI 의사결정의 신뢰성 확보’를 다룬다. 연구 결과는 애피어의 AI 기술 리더십을 더욱 공고히 하는 동시에, 에이전틱 AI 생태계 전반에도 실질적인 기술적 인사이트를 제공할 것으로 기대된다.

 

기업들의 AI 활용이 AI 코파일럿 단계에서 자율형 AI 에이전트로 진화해가는 가운데, 신뢰성은 도입을 결정하는 핵심 장벽으로 떠오르고 있다. 2025년 맥킨지(McKinsey) 조사에 따르면 기업의 62%가 이미 AI 에이전트 도입을 시작했지만 ‘부정확성’은 여전히 엔터프라이즈 AI 도입 시 가장 많이 언급되는 리스크다.

 

애피어는 AI 네이티브 AaaS(Agentic AI as a Service) 기업으로서 최첨단 연구 결과를 실제 기업 환경에 적용 가능한 방법론과 제품 기능으로 실현하고 있다. 본 연구는 기업들이 AI 도입 과정에서 가장 크게 우려하는 ‘AI 환각(hallucination)’과 ‘의사결정 신뢰성’을 집중적으로 다룬다.

 

연구진은 이를 해결하기 위해 다양한 리스크 조건에서 LLM의 판단을 정량적 지표로 전환해 평가하는 ‘리스크 인지 의사결정(Risk-Aware Decision-Making)’ 프레임워크를 제안했으며, 이를 통해 엔터프라이즈 AI 도입에 필요한 거버넌스 기반을 한층 강화할 수 있을 것으로 보고 있다.

 



 

리스크 인지 전략을 정량적 지표로 전환

기존의 LLM 평가 방식은 주로 답변의 정답 여부에 초점을 맞춰져 있었다. 그러나 기업 환경에서는 오답에 따른 비용과 답변 거부에 따른 가치가 확연히 다르다. 본 연구에서 애피어는 이런 판단을 정량적으로 평가할 수 있도록 정답에 대한 보상, 오답에 대한 페널티, 답변 거부 비용 등 구조화된 리스크 파라미터(매개변수)를 도입해 다양한 시나리오를 시뮬레이션했다. 이 프레임워크에서 모델은 답변을 생성하기 전에 자신의 수행 능력, 확신 수준, 리스크 조건을 종합적으로 평가한 뒤 답변, 거부, 추측 중 하나를 선택하도록 설계된다. 의사결정의 질은 모델이 기대 보상을 극대화했는지에 따라 측정되므로, 보다 현실적인 전략적 의사결정 평가가 가능하다.

 

주요 연구 결과: 기존 모델의 전략적 불균형

리스크 인지 의사결정 프레임워크를 적용한 결과, 다수의 선도적 LLM들이 리스크 시나리오 전반에서 전략적 불균형을 보이는 것으로 나타났다. 예를 들어 고위험 환경에서 모델들은 잠재적 손실이 있음에도 불구하고 과도하게 추측하는 경향을 보였으며, 저위험 환경에서는 지나치게 보수적으로 작동해 답변을 과하게 거부하는 경향을 보였다. 이러한 비일관성은 기업 환경에서 AI 시스템의 자율성과 안전성을 동시에 저해하는 요인이 된다. 연구진은 이 문제가 단순한 지식 부족이 아니라, 모델이 여러 역량을 하나의 안정적인 의사결정 전략으로 통합하는 데 어려움을 겪기 때문이라고 분석했다.

 

스킬 분해(Skill Decomposition) 접근법으로 의사결정 최적화

애피어는 이 문제를 해결하기 위해 의사결정 과정을 세 단계로 나누는 ‘스킬 분해(Skill Decomposition)’ 접근법을 제안했다. 먼저 ▲과업 실행(Task Execution) 단계에서 문제를 해결해 초기 답변을 생성한다. 이어 ▲확신도 추정(Confidence Estimation) 단계에서는 해당 답변에 대한 확신 수준을 평가한다. 마지막으로 ▲기대 가치 추론(Expected-Value Reasoning) 단계에서는 리스크 조건에서의 결과를 기반으로 기대값을 추론한다.

 

이러한 구조화된 추론 과정을 통해 모델은 답변을 제시할지, 혹은 거부하는 것이 더 나은 결과를 가져오는지를 판단할 수 있다. 이 접근 방식은 모델이 다양한 역량을 효과적으로 통합하도록 하며, 특히 고위험 환경에서도 더욱 합리적이고 안정적인 의사결정을 가능하게 한다. 이는 신뢰할 수 있는 엔터프라이즈 AI 시스템 구축을 위한 실질적인 방향을 제시한다.

 

치한 위(Chih-Han Yu) 애피어 CEO 겸 공동창업자는 “에이전틱 AI가 기업의 핵심 업무에 도입되기 위해서는 AI를 더 똑똑하게 만드는 것뿐만이 아니라, 자율적 의사결정의 신뢰도를 높이는 것이 중요하다”라며, “애피어는 AI를 중심으로 제품을 구축해 왔으며, 세계적 수준의 연구에도 지속적으로 투자해 왔다. LLM의 리스크 인지 능력을 수치화된 방법론으로 구현한 이번 연구는 신뢰할 수 있는 엔터프라이즈 AI의 기반을 강화하고, 에이전틱 AI가 실제 비즈니스 가치와 ROI로 연결되도록 지원할 것”이라고 말했다.

 

이번 연구 결과는 애드(Ad) 클라우드, 개인화 클라우드, 데이터 클라우드 등 애피어의 에이전틱 AI 기반 플랫폼에 통합되어 기업들이 보다 신뢰 가능하고 안정적인 방식으로 자율형 워크플로우를 고도화할 수 있도록 지원하고 있다.

 

애피어는 앞으로도 강력한 AI 연구 역량과 독자적인 데이터 자산, 깊이 있는 산업 전문성을 바탕으로 에이전틱 AI 기술 혁신을 지속적으로 추진하고, 기업들이 보다 효율적이고 신뢰할 수 있는 AI 기반 운영 체계를 구축할 수 있도록 지원할 계획이다.

관련뉴스 - 관련뉴스가 없습니다.
 

가장 많이 본 뉴스

취재기사 기획/특집 게임정보

화제의동영상