🔼 표준화된 재무제표로 미래 수익 예측
🔼 재무제표 분석에서 60% 예측 정확도 달성
🔼 복잡한 수치 분석에서 인간보다 뛰어난 성과
시카고 대학 연구진은 대형 언어 모델(LLM)이 전문 애널리스트와 맞먹는, 혹은 이를 능가하는 정확도로 재무제표 분석을 수행할 수 있음을 입증했다. “대형 언어 모델을 활용한 재무제표 분석”이라는 제목의 이 연구는 금융 분석과 의사결정의 미래에 중대한 영향을 미칠 수 있다.
연구진은 OpenAI의 최신 LLM인 GPT-4의 성능을 기업 재무제표 분석을 통해 향후 수익 성장 예측 작업에서 테스트했다. 놀랍게도, 표준화되고 익명화된 대차대조표와 손익계산서만 제공된 상태에서도 GPT-4는 인간 애널리스트를 능가하는 성과를 보였다.
연구진은 “LLM의 예측 정확도는 최신 기계 학습 모델과 동등한 수준이며, LLM의 예측은 단순한 기억력에서 비롯된 것이 아니다”라며, “LLM은 회사의 미래 성과에 대한 유용한 내러티브 통찰을 생성한다”고 밝혔다.
핵심 혁신은 GPT-4가 금융 애널리스트의 분석 과정을 모방하도록 유도하는 “사고의 연쇄” 프롬프트를 사용하는 데 있었다. 이를 통해 GPT-4는 트렌드를 식별하고, 비율을 계산하며, 정보를 종합해 예측을 내놓았다. 이 개선된 GPT-4는 미래 수익 방향 예측에서 60%의 정확도를 기록했는데, 이는 인간 애널리스트의 53-57% 범위를 상회하는 성과였다.
연구진은 “우리의 결과는 LLM이 의사결정의 중심 역할을 할 수 있음을 시사한다”고 결론지었다. LLM의 강점은 방대한 지식 기반과 패턴 및 비즈니스 개념 인식 능력에서 비롯되며, 불완전한 정보로도 직관적인 추론을 수행할 수 있다는 점에 있다고 설명했다.
숫자 분석이 전통적으로 언어 모델에게 어려운 영역이었음을 감안할 때, 이번 발견은 더욱 놀라운 것이다. 연구 공동저자인 알렉스 김은 “언어 모델에게 가장 어려운 영역 중 하나는 계산을 수행하고, 인간과 같은 해석을 하며, 복잡한 판단을 내리는 수치 영역이다”라며, “LLM은 텍스트 작업에서는 효과적이지만, 숫자에 대한 이해는 주로 내러티브 맥락에서 비롯되며, 심층적 수치 추론이나 인간의 유연성은 부족하다”고 말했다.
일부 전문가들은 연구에서 벤치마크로 사용된 “ANN” 모델이 정량 금융의 최신 기술을 대표하지 않는다고 경고했다. Hacker News 포럼의 한 실무자는 “그 ANN 벤치마크는 최신 기술과는 거리가 멀다”며, “1989년 이후로 사람들이 이 분야에서 돈을 벌기 위해 계속 작업해 왔다”고 언급했다.
그럼에도 불구하고, 범용 언어 모델이 특화된 기계 학습 모델과 인간 전문가의 성과를 능가할 수 있다는 점은 금융 분야에서 LLM의 혁신적 잠재력을 시사한다. 연구진은 GPT-4의 능력을 궁금해하는 독자들을 위해 인터랙티브 웹 애플리케이션도 제작했지만, 정확성은 독립적으로 검증해야 한다고 주의했다.
AI가 급속히 발전하면서 금융 애널리스트의 역할도 변화를 맞이할 가능성이 크다. 인간의 전문 지식과 판단이 완전히 대체되기는 어렵겠지만, GPT-4와 같은 강력한 도구는 애널리스트의 작업을 크게 증대하고 효율화할 수 있으며, 향후 재무제표 분석 분야를 재편할 가능성을 내포하고 있다.

◎GPT매거진 (https://www.gptmagazine.net)
지피티 기자 : gptmagazinebiz@gmail.com
카카오 오픈채팅방 : https://open.kakao.com/o/gLI8Wetf
페이스북 그룹 : https://www.facebook.com/groups/392367786704067
댓글 영역
획득법
① NFT 발행
작성한 게시물을 NFT로 발행하면 일주일 동안 사용할 수 있습니다. (최초 1회)
② NFT 구매
다른 이용자의 NFT를 구매하면 한 달 동안 사용할 수 있습니다. (구매 시마다 갱신)
사용법
디시콘에서지갑연결시 바로 사용 가능합니다.