[해외 DS] 인공지능 일기예보, "아직은 인간을 대체할 수 없어"

AI 기상 모델 '그래프캐스트', 허리케인 '리'의 상륙을 슈퍼컴퓨터보다 더 빨리 예측해
그래프캐스트는 기존 모델보다 빠르고 저렴하게 예측을 생성할 수 있어
하지만 해석이 어렵고 드문 사건을 예측하는 데는 한계점 분명

[해외DS]는 해외 유수의 데이터 사이언스 전문지들에서 전하는 업계 전문가들의 의견을 담았습니다. 저희 데이터 사이언스 경영 연구소 (GIAI R&D Korea)에서 콘텐츠 제휴가 진행 중입니다.

AI_weather_forecasting_ScientificAmerican_20240110 — 사진=Scientific American

작년 9월 중순 허리케인 ‘리’가 버뮤다 서쪽으로 북상하고 있을 때, 예보관들은 폭풍이 상륙할 가능성이 있는 위치를 파악하기 위해 기상 모델과 ‘허리케인 헌터’ 항공기의 데이터를 분주하게 분석하고 있었다. 예상 착륙 지점은 뉴잉글랜드 또는 캐나다였다. 기상학자들이 위치를 빨리 파악할수록, 해일, 폭우로 인한 피해를 보는 사람들에게 더 빨리 경고할 수 있는 긴박한 상황이었다. 상륙 6일 전에는 리가 동쪽 경로를 따를 것이 분명해졌고, 그에 따라 경고가 발령됐다. 하지만 놀랍게도 ‘그래프캐스트'(GraphCast)라는 AI 기상 모델은 예보관들의 기존 모델보다 3일 전에 이를 정확하게 예측해 냈다.

그래프캐스트의 예측은 일기 예보를 개선할 수 있는 AI의 잠재력을 보여주는 사례로, 적은 컴퓨팅 파워로 더 빠르게 예측할 수 있는 장점이 있다. 구글 딥마인드에서 개발한 그래프캐스트는 최근 몇 년간 출시된 여러 AI 기상 모델 중 가장 최신 모델이다. 2020년에 처음 소개된 구글의 ‘MetNet’은 이미 구글의 날씨 앱 ‘나우캐스트'(Nowcast)와 같은 제품에 사용되고 있으며, 엔비디아와 화웨이도 자체 AI 날씨 모델을 개발했다. 모두 AI가 탑재되지 않은 기존의 예측 컴퓨터 모델과 비슷하거나 더 높은 정확도를 자랑하며 기상학 분야에서 큰 반향을 불러일으켰는데, 그중에서도 그래프캐스트는 지금까지 가장 큰 파장을 일으켰다. 35개국의 일기 예보를 발표하고 많은 전문가들이 최고의 일기 예보 모델 중 하나로 꼽는 유럽 중기예보센터(ECMWF)에서 머신러닝을 연구하는 과학자 마리아나 클레어(Mariana Clare)도 “정말 큰 영향을 미쳤다”라고 강조했다.

허리케인 리가 발생하기 전, 딥마인드 연구팀은 과거 기상 데이터를 그래프캐스트에 입력해 어떤 일이 일어날지 정확하게 예측할 수 있는지 테스트했다. 작년 11월 사이언스(Science)에 게재된 이 연구 결과에 따르면, AI는 테스트 사례의 90%에서 최고 표준인 ECMWF의 통합예보시스템(IFS)과 동등하거나 더 나은 성능을 보였다. 또한 허리케인 리의 예측 경로를 실시간으로 예측하는 것을 보고 구글 딥마인드 연구팀은 시스템이 실제로 작동한다는 확신이 들었다고 전했다.

AI 기상 예측 모델의 원리와 한계

AI는 기존의 예측 모델과는 매우 다른 방식으로 작동한다. 기존 예측 모델은 대기 역학을 포착하기 위한 복잡한 물리 방정식으로 표현돼 있다. 이 모델은 전 세계의 기상 관측용 풍선과 기상관측소에서 수집한 데이터를 바탕으로 다양한 기단과 기타 대기 특징이 상호작용하면서 날씨가 어떻게 전개될지 예측하는 데 사용된다. 예보관은 일반적으로 이러한 모델을 여러 개 실행한 다음 지역 지리에 대한 자신의 전문 지식과 각 모델의 장단점을 통해 필터링된 결과 정보를 통합하여 최종 예측 결과를 결정한다.

이와는 대조적으로 그래프캐스트와 다른 대부분의 새로운 AI 모델은 실제 대기 역학을 이해하고 이를 수학적으로 복제하려는 노력을 포기한다(엔비디아의 포캐스트넷은 예외). 대신 AI 도구는 통계적 모델로서, 수십 년간의 기상 관측 기록과 물리적 예측에서 수집한 정보로 구성된 학습 데이터의 패턴을 인식한다. 따라서 AI 모델은 특정 날짜의 날씨 설정이 과거의 유사한 사건과 유사하다는 것을 알아차리고 그 패턴을 기반으로 예보를 내리는 방식을 취한다.

미국 애리조나대학교의 대기과학 및 수문학 부교수인 킴 우드(Kim Wood)는 과거 데이터에 의존하기 때문에 대부분의 AI 모델은 드물게 일어나거나 한 번도 경험하지 못한 사건을 예측하는 데는 한계가 있다고 지적했다. 2017년 텍사스 일부 지역에 전례 없는 60인치의 폭우를 쏟아부은 허리케인 ‘하비’, 지난해 멕시코 태평양 연안을 강타하기 직전에 5등급으로 급격히 강화된 허리케인 ‘오티스’ 등이 이러한 사례에 속한다. “학습 데이터에서 가장 자주 볼 수 있는 이벤트를 가장 잘 포착할 수 있다. 평균적으로 예측을 잘하는 것이다”라고 우드는 설명했다. 우드는 기후가 변화함에 따라 ‘희귀한’ 사건들이 점점 더 보편화되고 있기 때문에 이를 정확하게 포착하고 예측하는 것이 점점 중요하고 어려울 것이라고 말했다.

그래프캐스트는 폭풍과 강우 강도를 예측하는 데도 한계가 있는 것으로 보인다고 ECMWF의 클레어와 구글 딥마인드의 과학자 레미 램은 언급했다. 이는 이 모델의 공간 해상도가 상대적으로 낮기 때문일 수 있다. 그래프캐스트의 모델은 전 세계를 28km² 단위로 보지만, 돌풍과 폭우는 도시 블록과 동네 단위로 발생한다. 램은 “분명 개선의 여지가 있다”라고 말하지만, 더 높은 해상도의 AI 모델을 얻으려면 그와 그의 동료들은 훨씬 더 많은 고해상도 훈련 데이터를 수집해야 한다. 이는 어려운 일이지만 극복할 수 없는 문제는 아니라고 램은 덧붙였다.

슈퍼컴퓨터 없이 예측 가능하지만, 설명력은 떨어지는 AI 모델

물리학 기반 모델이 슈퍼컴퓨터로 실행하는 데 2~3시간이 걸리는 데 비해 AI 모델은 몇 분 만에 예측할 수 있는 것은 사실이지만, AI가 어떻게 예측에 도달하는지 정확히 알 방법은 없다. 물리 기반 모델과 달리 그래프캐스트 및 기타 유사한 AI 예측 도구는 ‘해석 가능’하지 않다. AI 모델을 구성하는 수천만 개의 매개변수를 통해 결과를 쉽게 추적할 수 없기 때문이다. 미국 노스다코타대학교의 대기과학 부교수인 아론 케네디(Aaron Kennedy)는 “모델에 문제가 발생하면 세부 사항을 살펴보고 그 이유를 파악할 수 있어야 한다”고 꼬집었다.

에너지 회사인 세니에르 에너지(Cheniere Energy)의 기상학자이자 휴스턴에 본사를 둔 극한 날씨 웹사이트 ‘The Eyewall’의 공동 설립자인 맷 란자(Matt Lanza)는 오류를 이해하는 것이 어느 정도는 중요하다는 데 동의했다. “AI의 [블랙박스] 특성은 현장의 사람들이 AI를 유용한 것으로 받아들이는 데 방해가 되는 요소 중 하나가 될 것이다”라고 그는 내다봤다.

AI 모델의 낮은 설명력은 고질적인 문제다. 그래프캐스트가 현재 직면한 구체적인 과제 중 하나는 결정론적 예보, 즉 실제로 일어날 가능성에 대한 확률 없이 제시되는 단일 예보만 생성할 수 있다는 점을 먼저 개선해야 한다. 일련의 매개변수가 주어지면 그래프캐스트를 실행할 때마다 비슷한 결과가 나오기 때문에 다양한 예측 가능성을 생성하기가 어렵다. 이는 대기에 내재된 무작위성을 수용하는 기존의 물리적 앙상블 예보에서 벗어난 예측 방식이기 때문이다. 미국 해양대기청(NOAA) 산하 미국 국립기상청(NWS) 기상예보센터의 예보운영책임자인 그렉 카빈(Greg Carbin)은 기존 기상 모델 예보의 궤적을 강 위에 떠 있는 코르크에 비유했다. 매번 같은 출발점에 똑같은 코르크를 조심스럽게 놓아도 하류로 내려가는 길은 달라지는데, 코르크의 이동 거리가 길어질수록 기존의 궤적에서 더 멀리 떨어져 있을 가능성이 높아지는 이치다. 현재 그래프캐스트는 이러한 불확실성을 계산하지 못하는 상태다.

하지만 그래프캐스트가 확률적으로 변하더라도, 그리고 모델의 해상도가 향상되고 AI가 비와 폭풍의 강도를 더 정확하게 예측하더라도, 모델링은 기상 예측 파이프라인의 한 구성 요소에 불과하다고 NWS의 고급모델링시스템 수석 고문인 헨드릭 톨만(Hendrik Tolman)은 지적했다. 예보의 첫 번째 단계는 센서를 통해 전 세계의 상태에 대한 데이터를 수집하는 것이고, 두 번째 단계는 이러한 모든 관측 데이터를 매개변수로 통합하여 모델에 입력하는 것이다. 그다음에는 모델링이 이루어지며, 마지막으로 대중을 위해 예보를 번역하는 과정이 있다. 톨먼은 예측 단계에서 지름길을 개발했다고 해서 정보를 수집, 전달, 해석하는 전문 인력의 필요성이 없어지는 것은 아니라고 말했다. 물론 AI가 정확한 예측을 빠르고 저렴하게 생성할 수 있다면 기존 방법과 함께 사용하지 않을 이유가 없다. 아울러 슈퍼컴퓨터를 사용할 수 없는 기업이나 기관이 날씨 모델링에 훨씬 더 쉽게 접근할 수 있는 기회가 생긴 것은 그래프캐스트가 가져온 커다란 변화다. 하지만 향후 5년 또는 10년 이내에 AI 모델이 물리학 기반 모델과 사람을 대체하는 세상이 올 가능성은 거의 없다는 게 전문가들의 중론이다.

영어 원문 기사는 사이언티픽 아메리칸에 게재되었습니다.