[해외DS] S&P500도 넘지 못한 AI 펀드, 투자 적용은 아직 ‘시기상조’
AI 기반 펀드, S&P500 지수에 비해 성과 미미
인간 개입 전혀 없는 AI 펀드 성과는 더욱 저조
의미 파악 및 판단 능력, 여전히 인간 수준 미달
[해외DS]는 해외 유수의 데이터 사이언스 전문지들에서 전하는 업계 전문가들의 의견을 담았습니다. 글로벌AI협회(GIAI)에서 번역본에 대해 콘텐츠 제휴가 진행 중입니다.
2022년 말 챗GPT(ChatGPT)가 인공지능(AI) 챗봇 시대의 서막을 열었을 당시 세상은 이를 경이로움과 뜨거운 기대감으로 맞이했다. ‘실리콘밸리의 큰 손’으로 널리 알려진 마크 앤드리슨은 챗GPT를 “순수하고, 절대적이며, 형언할 수 없는 마법”이라 극찬했고, 빌 게이츠는 PC, 인터넷에 비견될 만큼 중요하다고 평가했다. 여기에 더해 알파벳과 구글의 CEO인 순다르 피차이는 AI를 인류 역사상 가장 심오한 기술이라 선언했으며, ‘AI 대부’로 알려진 제프리 힌턴은 산업혁명, 전기, 바퀴에 비견될 만큼 혁신적이라고 언급했다. 이처럼 AI 챗봇의 등장은 세상을 뒤흔들 만큼 강력한 변화의 시작을 알렸다.
인간의 오류와 편견을 배제한 새로운 시대의 도래?
하지만 지난 70년간 이어져 온 AI 지지자들의 장밋빛 전망은 현실의 한계에 부딪혔다. GPT와 같은 대규모 언어 모델(LLM)의 등장에도 불구하고, 이들이 진정한 지능을 갖추지 못했다는 비판이 끊이지 않고 있어서다. 채용, 판결, 금융, 투자 등 중요한 의사 결정에 AI를 섣불리 적용하기 어렵다는 주장이다.
물론 AI 기반 투자는 기술의 성능을 정량적으로 평가할 수 있다는 점에서 매력적이다. 2017년 10월 투자 플랫폼 에퀴봇(EquBot)은 최초의 AI 기반 상장지수펀드(ETF)인 ‘AIEQ'(인공지능 운용 주식)를 출시하며 AI 투자 시대의 개막을 알렸다. 당시 치다 카투아(Chida Khatua) 에퀴봇의 CEO 겸 공동 창업자는 보도 자료에서 AIEQ는 유전자 알고리즘, 퍼지 로직, 적응형 튜닝 등 혁신적인 AI 기술을 적용해 인간의 오류와 편견을 제거한 투자를 가능하게 한다고 자랑했다.
AIEQ 출시 2주 후 글로벌 자산 운용사 호라이즌(Horizons, 현 Global X)도 AI 기반 ETF인 ‘MIND’를 출시하며 AI 기반 투자 열풍에 합류했다. MIND는 모회사인 미래에셋자산운용의 자문을 받아 ‘딥 뉴럴 네트워크 학습’을 통해 데이터 분석 및 패턴 추출을 수행하는 AI 시스템을 기반으로 투자 전략을 실행한다. 호라이즌은 이 시스템이 인간의 뇌처럼 패턴을 인식하고 스스로 결정을 내리면서도 훨씬 빠르게 작동한다는 점을 강조해 투자자들의 관심을 끌었다. 당시 호라이즌의 CEO였던 스티브 호킨스(Steve Hawkins)는 “오늘날의 포트폴리오 매니저는 과신이나 인지 부조화와 같은 투자자 편향에 영향을 받을 수 있지만, MIND는 감정이 전혀 없다”고 강조했다.
S&P500 지수에 크게 뒤처진 실적
그러나 이 모든 것은 과장된 광고에 지나지 않았다. 실제로 두 펀드 모두 S&P(스탠더드앤드푸어스)500 지수에 비해 훨씬 저조한 성과를 보였다. AIEQ의 경우 지난해 말 기준 누적 총수익률은 63%에 그쳤으나, S&P500 지수는 108%의 수익률을 기록했다. MIND 역시 2022년 종료되기 전까지 누적 총수익률이 -12%로 마이너스였지만 같은 기간 S&P500 지수는 65%의 수익률을 달성했다.
다른 AI 펀드들의 사정도 크게 다르지 않다. 게리 스미스(Gary N. Smith) 미국 포모나대(Pomona College) 경제학 교수와 샘 와이어트(Sam Wyatt) 포모나대 학생이자 포모나 컨설팅(Pomona Consulting Group)의 프로젝트 책임자가 2017년 10월 18일 이후 출시된 모든 AI 기반 ETF와 뮤추얼 펀드를 분석한 결과 AI를 사용하면서도 인간의 개입을 허용하는 43개의 AI 펀드 중 단 10개만이 S&P500 지수보다 더 나은 성과를 기록한 것으로 나타났다. 43개 펀드의 평균 연간 수익률은 S&P500 지수보다 약 5%포인트 낮아, AI 펀드의 평균 수익률은 7.11%인 반면, S&P500 지수는 12.43%의 수익률을 기록했다.
인간 개입이 전혀 없는 AI 펀드의 상황은 더욱 심각했다. AIEQ와 MIND 같은 완전 AI 기반으로 운영되는 11개의 펀드 모두 S&P500 지수보다 저조한 성과를 보였다. 이들 11개 펀드 중 6개는 실제로 손실을 기록하기도 했다. 전체적으로 해당 11개 AI 펀드는 연평균 1.8%의 손실을 기록한 반면, S&P500 지수는 투자자에게 연평균 7.6%의 수익률을 제공했다. 이런 이유로 운영 기간이 짧았음에도 불구하고, 11개 AI 펀드 중 6개와 부분적으로 AI를 사용하는 43개 펀드 중 25개가 이미 폐지된 상태다.
단순 패턴 인식과 진정한 이해의 차이
AI 시스템은 방대한 데이터 속에서 통계적 패턴을 찾아내는 데 탁월하다. 하지만 이러한 패턴이 실제로 의미 있는 상관관계를 갖는지, 아니면 단순한 우연의 일치인지를 판단하는 능력은 여전히 부족하다. 예를 들어 특정 연도의 주가와 몬태나주의 앤틸로프 최저 기온 사이에 우연히 통계적 상관관계가 나타난다고 가정할 때, AI는 이러한 상관관계를 논리적으로 분석하고 평가하는 능력이 부족해, 두 변수 사이에 인과관계가 전혀 없더라도 이를 투자 결정에 잘못 활용할 가능성이 있다.
최근 월스트리트에서 AI에 대한 과도한 기대감이 줄어들고, 혁신적인 알고리즘을 활용한 투자 상품들의 수익률이 실망스러운 결과를 보이는 것도 AI 기술의 이러한 근본적인 한계와 무관하지 않다. AI는 뛰어난 계산 능력과 패턴 인식 능력 덕분에 때때로 인간의 분석 능력을 능가하는 성과를 보여주기도 하지만, 진정한 ‘이해’와 ‘판단’ 능력에서는 아직 인간의 수준에 도달하지 못하고 있다는 의미다. AI 알고리즘이 단어의 의미와 맥락을 이해하고, 이를 현실 세계와 연결해 논리적으로 추론할 수 있는 능력을 갖추기 전까지는, 투자를 비롯한 중요한 의사 결정에 AI를 맹목적으로 의존하는 것은 바람직하지 않다는 분석이 나오는 이유다.
원문의 저자는 게리 스미스(Gary N. Smith) 미국 포모나대(Pomona College) 경제학 교수와 샘 와이어트(Sam Wyatt) 포모나대 학생이자 포모나 컨설팅(Pomona Consulting Group)의 프로젝트 책임자입니다. 영어 원문은 AI Makes Unreliable Investment Decisions | Scientific American에 게재돼 있습니다.