[해외 DS] 언어 모델을 활용한 수명 예측 정확도 78% 달성, “인공지능으로 죽음을 예측할 수 있을까?”
덴마크 연구팀, 언어 모델 기반 인공지능으로 사망률·해외 이동 예측 4년 이내 사망률 78% 정확도, 해외 이동 73% 정확도 활용 가능성 높지만, 윤리적 고려도 필요
[해외DS]는 해외 유수의 데이터 사이언스 전문지들에서 전하는 업계 전문가들의 의견을 담았습니다. 저희 데이터 사이언스 경영 연구소 (GIAI R&D Korea)에서 콘텐츠 제휴가 진행 중입니다.
사람들은 항상 미래를 예측하려 한다. 그리고 오늘날 머신러닝의 발전이 가속화되면서 불가능해 보였던 죽음에 관한 예측 가능성도 새롭게 제기됐다. 게다가 이번엔 정형화된 데이터로 학습한 방식이 아닌, 챗지피티와 같은 언어 모델로 죽음을 예측한 것이 화제다. 네이처 계산과학(Nature Computational Science)의 최근 연구에 따르면 인간의 삶을 언어처럼 취급하는 새로운 인공지능 시스템이 특정 기간 내에 사망할지 여부를 비롯한 여러 가지 삶의 세부 사항을 유능하게 추측할 수 있을 것으로 보인다.
라이프투벡 사망률 예측 78% 정확도, 독특한 방식으로 삶의 궤적 예측
연구팀은 사망, 해외 이동, 성격 특성 같이 사람들 삶의 세부 사항에 대해 일반적인 예측을 할 수 있는 라이프투벡(life2vec)이라는 머신러닝 모델을 개발했다. 이 모델의 학습 대상은 600만 명의 덴마크 거주자다. 생년월일, 성별, 직업, 거주지, 덴마크의 보편적 의료 시스템 사용 여부 등의 정보가 포함됐다. 연구 결과에 따르면 이 새로운 모델은 4년 이내의 사망률을 78% 이상 정확하게 예측했으며, 다른 여러 예측 방법보다 훨씬 뛰어난 성능을 보였다. 아울러 별도의 테스트에서 라이프투벡은 같은 기간 동안 사람들이 덴마크를 떠날지 여부도 약 73%의 정확도로 예측했다. 연구진은 또한 라이프투벡을 사용하여 성격 설문지에 대한 사람들의 응답을 예측했으며, 해당 모델이 성격 특성과 삶의 특정 사건을 연결지어 해석할 수 있다는 기대감을 샀다.
이 연구는 사람들의 삶의 궤적을 예측하고 분석하는 흥미로운 접근법을 보여줬다고 컴퓨터 사회과학을 연구하고 ‘비트 바이 비트: 디지털 시대의 사회 연구’라는 책을 저술한 프린스턴대의 사회학 교수인 매튜 살가닉(Matthew Salganik)은 말했다. 그는 “지금까지 아무도 사용하지 않았던 매우 다른 스타일을 사용했다”라고 덧붙였다.
살가닉 교수의 말대로 라이프투벡은 독특한 방식으로 작동한다. 라이프투벡은 오픈AI의 챗지피티와 구글의 바드와 같은 유형의 언어 모델 아키텍처를 기반으로 한다. 특히 2018년에 구글이 도입한 언어 모델인 버트(BERT)에 가장 가깝다. 연구를 이끈 덴마크 공과대학의 네트워크·복잡성과학의 수네 리만 교수는 “우리는 언어 모델링을 위해 개발된 원리를 인간의 삶을 서술한 문장 데이터에 적용했다”고 전했다. 예를 들어 ‘2012년 9월, 프란시스코는 엘시노레의 성에서 경비원으로 일하며 2만 덴마크 크로네를 받았다’ 또는 ‘중등 기숙학교 3학년 동안 헤르미온느는 5개의 선택 수업을 들었다’와 같은 개인의 삶을 이벤트 단위로 서술한 내용들이다.
일반적으로 텍스트 형태의 일련의 정보가 주어지면 언어 모델은 입력을 수학적 벡터로 변환하고, 학습된 패턴에 따라 다음에 올 문장을 채우는 자동 완성 프로세스처럼 작동하여 예측을 수행한다. 여기서 사람들의 미래를 예측할 수 있는 언어 처리 도구를 개발하기 위해 리만 교수와 그의 동료들은 개인의 데이터를 급여 변동이나 입원과 같은 이벤트로 구성된 고유한 타임라인으로 처리하고, 특정 이벤트를 컴퓨터가 인식할 수 있는 디지털 ‘토큰’으로 변환했다. 연구진은 훈련 데이터가 사람에 대해 많은 정보를 포착하고 모델 아키텍처가 유연하기 때문에 라이프투벡이 아직 밝혀지지 않은 인간 삶의 많은 측면에 대한 예측을 쉽게 미세 조정할 수 있는 기반을 제공할 수 있다고 제안했다.
잠재적 활용 방안은 다양하지만 한계도 존재
이미 일부 의료 전문가들은 희소 질환의 위험 요인을 밝히는 데 도움이 될 수 있는 라이프투벡의 보건 버전을 개발하자며 리만 교수의 연구팀에 협업을 요청하는 중이다. 리만 교수는 이 모델을 사용하여 ‘인간관계가 삶의 질에 어떤 영향을 미치는가?’, ‘연봉이나 조기 사망을 결정하는 가장 중요한 요인은 무엇인가?’와 같은 질문을 탐구함으로써 세상과 인간의 삶의 결과 사이에 이전에 알려지지 않은 관계를 발견하기를 희망한다고 전했다. 또한 승진과 나이 또는 출신 국가 사이의 예상치 못한 연관성 등 숨겨진 사회적 편견을 찾아낼 수도 있다고 전망했다.
하지만 현재로서는 몇 가지 심각한 한계가 있다. 리만 교수는 연구 대상이 덴마크에 한정되어 있다고 지적했다. 그리고 사용된 정보에는 많은 공백이 남아 있는데, 개인의 사망 위험이나 삶의 궤적과 관련된 모든 내용을 포착하기 어렵고, 일부 사회계층은 광범위한 건강·고용 기록을 보유할 가능성이 작기 때문이다.
게다가 가장 중요한 정확도 측정 방식이 엄밀하지 못하며, 여러 소식통에 따르면 이 연구 결과는 특정 사람이 어떤 기간에 사망할지를 정확하게 예측할 수 있기보다는 개념 증명(PoC)에 가깝다고 한다. 듀크-마골리스(Duke-Margolis) 보건정책센터의 디지털건강연구 책임자인 크리스티나 실콕스(Christina Silcox)는 이 연구의 통계 분석 결과를 보면 라이프투벡의 개별 4년 사망률 예측에 너무 많은 신뢰를 두면 안 된다고 전했다. 이는 리만과 그의 연구팀의 방법론에 대한 비판이 아니라 삶에 관한 예측 분야의 본질적인 한계라고 지적했다.
살가닉 교수도 이와 같은 도구의 정확성을 평가하는 가장 좋은 방법을 알기는 어렵다고 언급했다. 왜냐하면 이와 비교할 만한 다른 도구가 없기 때문이다. 모든 사람이 결국 사망하지만 대부분의 젊은이와 중장년층은 해마다 생존하기 때문에 개인 사망률을 평가하기는 특히 어렵다. 연구 대상인 65세 미만 연령층에서 사망은 비교적 드물게 발생한다. 덴마크에 거주하는 35세에서 65세 사이의 사람들(연구 대상 집단)의 모든 사람이 매년 생존할 것이라고 간단히 추측한다면, 이미 꽤 정확한 사망 예측을 한 셈이다. 이 연구에 따르면 라이프투벡은 이러한 추측보다 훨씬 더 나은 성능을 보였지만, 살가닉 교수는 현실과 비교하여 얼마나 연관성이 높은지는 정확히 판단하기는 어렵다고 강조했다.
미국 산타바바라 캘리포니아대학의 통계학·응용확률학 교수인 마이클 루드코브스키(Michael Ludkovski)도 이에 동의했다. 그의 연구 분야는 대부분 보험 계리, 즉 위험 예측 분야이며, 라이프투벡의 예측 결과가 보험 계리사가 말하는 방식과는 다른 언어를 사용하고 있다고 설명했다. 예를 들어 보험계리 예측은 ‘사망’ 또는 ‘생존’이라는 이분법적 예측이 아니라 위험 점수를 부여하며, 이러한 연속 데이터(위험 점수)는 라이프투벡의 이진 분류가 설명하지 못하는 불확실성을 더 많이 포착한다.
개인정보 보호·차별 금지·알고리즘 편향 등, 심도 있게 논의해야
라이프투벡의 예측 대상이 사람과 생명에 관련된 만큼 윤리적 고려 사항도 중요하다고 전문가들은 강조했다. 실콕스 교수는 이러한 모델의 알고리즘 편향은 실질적인 위험이며, “AI 도구로 해결하고자 하는 문제에 대해 매우 구체적으로 테스트해야 한다”고 전했다. 새로운 용도로 사용할 때마다 라이프투벡을 철저히 평가하고, 학습 데이터에 반영된 과거 조건이 더 이상 적용되지 않는 데이터 드리프트(예: 중요한 의학 발전 이후)와 같은 결함이 있는지 지속해서 모니터링하는 것이 중요하다.
연구진은 자신들이 위험한 영역에 발을 들여놓았다는 사실을 인정했다. 하지만 연구진은 덴마크가 강력한 개인정보 보호 및 차별 금지법을 시행하고 있다는 점을 피력했다. 학계, 정부 기관 및 기타 연구자에게 라이프투벡에 대한 접근 권한을 부여한 연구자들은 데이터가 유출되거나 비과학적 목적으로 사용되지 않도록 해야 하는데, 저자들은 논문에서 “자동화된 개인 의사 결정, 프로파일링 또는 개인 수준 데이터 접근을 위해 life2vec을 사용하는 것은 엄격히 금지되어 있다”고 명시했다. 리만 교수는 이런 민감한 문제에 대해 편안함을 느끼는 이유 중 하나는 덴마크 정부를 신뢰하기 때문이라고 전했다. 그는 연방 데이터 보호법이 없는 미국에서 이러한 모델을 개발하는 것이 ‘불편할 것’이라고 밝혔다.
리만 교수의 걱정처럼 라이프투벡과 동등하게 침습적이고 강력한 머신러닝 도구는 이미 공적, 사적 분야 구별할 것 없이 인간의 삶에 깊숙히 들어와 있다. 미국에서는 많은 법원에서 알고리즘을 사용하여 형량을 결정하고, 법 집행 기관은 예측 치안 소프트웨어를 사용하여 경찰관과 자원을 어떻게 배분할지 결정한다. 국세청에서도 머신러닝을 활용하여 세무 감사를 실시한다. 이 모든 사례에서 편향성과 부정확성이 반복되는 문제가 발생하고 있는 것이 현실이다. 문제가 있어도 해결하기 쉽지 않은 것이 민간 영역에서 기술 기업은 고급 알고리즘 예측과 수집한 사용자에 대한 엄청난 양의 데이터를 사용하여 소비자 행동을 예측하고 참여 시간을 극대화하는데, 정부 및 기업의 AI 시스템에 관련된 세부 사항은 모두 비공개이기 때문이다.
리만 교수는 학계 연구자들이 접근할 수 있는 강력한 AI 예측 도구를 개발함으로써 이미 시작된 예측의 시대에 투명성과 이해도를 높여야 한다고 말했다. “이제 우리는 예측에 관해 이야기하기 시작할 수 있고, 무엇이 가능하고 무엇이 옳은지, 무엇을 내버려둬야 하는지 등 예측을 어떻게 사용할지 결정할 수 있다”라며 “이것이 우리를 디스토피아에서 벗어나 유토피아의 방향으로 나아가는 데 도움이 되는 논의의 일부가 되기를 바란다”고 그는 덧붙였다.
영어 원문 기사는 사이언티픽 아메리칸에 게재되었습니다.