[선거] 1변수 회귀분석의 문제점과 정치권 패널들의 선거 분석
22대 총선의 여당 참패를 무조건 대통령 잘못으로만 설명하는 정치권 패널들의 해석 다수
실제 사회 현상은 수 많은 변수들의 복합 작용으로 이뤄짐에도 단순히 쉬운 설명만 찾기 때문
시민 사회 역량 성장을 위해서라도 다양한 원인을 찾아내는 분석 역량을 길러내야
지난 10일 치뤄진 제22대 총선에서 집권 여당의 참패로 결론이 나오자, 정치권 패널들 대부분이 정부 실패, 혹은 정부의 수장인 대통령에 대한 책임을 돌리는 평가를 내놨다. 기업이 잘 돌아가지 않아 상장폐지, 워크아웃, 법정관리 등의 절차를 밟게되면 모든 비난이 회사 대표에게만 쏠리고, 그 아래 모든 직원들은 불쌍한 피해자인 것처럼 취급되는 것과 비슷한 모습을 보는 것 같더라.
대표 한 사람이 전지전능해서 하루 24시간 안에 모든 것을 완벽하게 관리하기는 불가능에 가깝다. 실제로는 직원들의 심각한 무능, 도덕적 해이, 범죄 등이 원인일 수도 있고, 시장 상황이 나빴기 때문일 수도 있지만, 많은 경우에 사람들은 대표자 한 명에게 책임을 집중시킨다. 이번 선거 결과 해석도 지나치게 한 가지 원인으로만 해석을 내놓는 것을 보면서, 학부 저학년 학생들에게 처음 회귀분석을 가르칠 때 1변수만으로 설명하는 회귀분석의 문제점을 지적하던 생각이 났다.
1변수 회귀분석과 대통령 한 사람만을 탓하는 정치권 패널들의 총선 해석
이번 총선 결과를 놓고 정치권에서 대통령에게 반감을 많이 가진 관계자들이 대통령에 대한 비난을 내놓는 것은 어느 정도 납득 가는 면이 있다. 대통령을 비난해서 자신이 이득을 얻을 수 있기 때문이다. 예를 들어, 최근 정부가 의료 개혁을 강하게 밀어붙인 탓에 의사 집단에서는 무리한 의료 개혁이 총선 패배의 원인이라고 지적하기도 했다. 정부가 발주한 R&D사업들로 사업체를 연명하던 좀비기업들 대표들을 만나보면 R&D예산 축소가 총선 패배의 주 원인이라고 설명하기도 한다. 모두 각자의 상황이 다르고, 덕분에 보는 관점이 다르기 때문에 벌어지는 현상이다. 모두가 맞는 말일 수도 있고, 모두가 맞기는 하지만, 데이터 과학적으로 보면 아주 조금씩만 맞는 말일 수도 있다.
아주 조금씩만 맞는다는 말이 무슨 뜻이냐면, 회귀분석이라는 통계학 기초 개념은 1개 변수가 모든 것을 설명하지 않는다는 기본 가정에서 출발한다. 실제로 세상에는 단 1개의 변수가 모든 것을 바꾸는 경우는 굉장히 드물다. 매트릭스 영화 속의 시스템 관리자인 스미스처럼 자기 복제를 한 인간만으로 구성된 사회라면 1명에게 바이러스를 심어도 모든 인간에게 똑같이 적용될 수 있겠지만, 세상 사람들 모두가 조금씩 다른 유전자를 갖고 태어나고, 다른 상황 속에서 삶을 영위하고 있고, 상황에 따라 시선이 다르고, 경험이 달라지고, 해석이 다르고, 결국 판단이 달라진다.
1개의 변수가 매우 중요한 변수일 수도 있고, 혹은 여러 개의 변수들이 중요한 것처럼 보이지만 실제로는 눈에 보이지 않는 1개의 변수가 여러 개의 변수들을 조종했다는 점에서 1개의 변수가 가장 중요한 변수인 경우가 있는 것은 사실이다. 최근 일반인에게 널리 알려진 딥러닝 등의 계산과학 계산방법론은 대표적으로 그런 숨겨진 변수들을 찾아내는 계산이기도 하다. 그런데, 단순 기초 통계보다 컴퓨터 계산 비용을 많이 쓰는 고급 계산들도 더더욱 1개의 숨겨진 변수가 아니라 수 많은 숨겨진 변수들을 고려해서 프로그램을 구성한다. 숫자 0에서 9까지를 구분하는데는 모델마다 사정이 다르겠지만 기본적으로 최소한 10개의 다른 변수가 있어야 10개 숫자를 구분할 수 있고, 실제 현장에서 쓰이는 모델은 숫자 0에서 9까지에 벌써 30개의 숨겨진 변수를 채택한다.
대통령이 당선되던 2022년에 약속했던 주요 공약들이 실행되지 않았고, 주요 정책들이 실패했던 것이 대통령에 대한 비난으로 돌아갔을 수 있다. 그 부분이 선거에 큰 영향을 미쳤을 수도 있다. 그러나 단지 그 하나의 변수만으로 선겨 결과를 모두 설명하기는 어렵다. 세상 사람들은 숫자 0에서 9까지 이상으로 다양하고 복잡한 사회적 현실 속에서 살아가고 있기 때문이다.
1변수 기반 설명은 가장 쉽지만 가장 틀린 설명
세계 2차 대전 이후 8년간 미국 대통령을 지낸 해리 트루먼(Harry Truman)은 ‘손이 하나만 있는 경제학자(One-hand economist)’가 필요하다는 농담을 자주했다. 어떤 정책을 하고 싶어서 경제자문위원들에게 질문을 하면 해당 정책으로 목표한 바를 달성할 수 있다며 한 손을 꺼내고, 다른 한편으로 생기는 부작용을 설명하면서 다른 손을 꺼내 들었기 때문이다. 이렇게 세상 모든 사건에는 명암이 있는 것처럼, 특정 사건을 해석하는 회귀분석 기반 설명도 1변수가 아니라 2개 이상의 다변수로 설명을 찾아야 할 가능성이 대단히 높다.
다변수 회귀분석을 바탕으로 최근 인기를 얻은 머신러닝, 딥러닝 등등의 인공지능 계산법들을 배운 학생 중 하나가 1변수 기반의 설명이 얼마나 조악한 계산인지를 인지했는지, “세상 사람들은 왜 그렇게 쉬운 것만 찾는 걸까요?”라는 질문을 한 적이 있다. ‘딥러닝 계산만 쓰면 무조건 인공지능이고, 인공지능만 쓰면 모든 것을 다 자동화해서 100% 맞출 수 있다’는 잘못된 상식이 얼마나 사회적 문제를 일으키는지 공감을 표현하면서 쓴 표현이다.
당시 트루먼 대통령도, 이번 선거 결과를 해석하는 정치권 패널들도, 딱 그 학생의 지적을 들어야 할 분들이다. 1변수로 설명하면 원인과 결과가 바로 보이니 매우 쉽다. 사실 1변수 이외에 다른 변수들도 있다고 말을 이어가면 “넌 왜 이렇게 어렵게 설명하냐?”, “원인과 결과, 딱딱, 하나로 정리해라고” 같은 따가운 비난을 윗사람들에게 듣는 경우도 자주 있었다. 요컨대, 정확성을 높이려는 설명은 ‘어려운 설명’이 되어버리니 정치권 패널들도 쉬운 1변수 해석에 매몰되어 버리는 것일 수도 있겠다.
다변수 해석을 이해할 수 있어야 진정한 민주 시민이 아닐까?
군중들을 어리석게 만들어서 정치적 영향력을 행사하려는 정치를 중우정치라고 부른다. 프랑스의 사회심리학자이자 사상가인 귀스타브 르봉(1841~1931)은 100년도 더 전인 1895년에 《군중심리학》이라는 책을 내놨다. 당시 서론에서 그는 “과거에는 소수의 엘리트층이 사회를 이끌었다면, 다가오는 20세기는 군중의 힘이 커지는 ‘군중의 시대’가 될 것”이라고 예견했다.
문제는 선거가 집단지성(Collective Intelligence)을 찾는 사회 제도라는 점이다. 집단지성이 집단의 평균지성인만큼, 군중들의 수준이 낮아지면 그만큼 집단지성의 결과물도 수준이 떨어지게 된다.
우리 사회가 선거 해석을 1변수 회귀분석 수준으로 반복하고 있으면, 시민들의 집단지성 수준이 떨어지고, 결국은 민주시민 사회의 역량도 함께 떨어질 수밖에 없다. 무조건 딥러닝이면 모든 것이 다 된다는 외부 인사들의 잘못된 상식을 “왜 그렇게 쉬운 것만 찾는 걸까요?”라고 묻던 그 학생에게 “그 분이 몰라서 그렇다”라고 대답하고 넘어갔는데, “배우시면 달라지지 않을까”라고 덧붙이고 싶었지만 “배우려고 하시지도 않을 것 같다”는 학생의 대답을 들을 것 같아 망설였었다.
선거라는 시스템으로 대표자를 뽑는 이상, 민주주의 발전은 결국 구성원들의 역량 성장에 달려있다. “배우려고 하시지도 않을 것 같다”는 분들로 그런 역량 성장을 일궈낼 수 있을까?