①SIAI 설립 동기

공대는 학부만 해도 되는데, 통계학은 대학원에 가야 한다고?

Estimated reading: 1 minute 160 views
160X600_GIAI_AIDSNote

필자는 학부에서 “상경계”를 전공했고, 고교 시절부터 금융권 업무 이외에 다른 직장을 생각한 적이 별로 없었기 때문에 다른 전공들은 학부에서 어떤 훈련을 받고, 그 능력이 직장에서 어떻게 쓰이는지를 열심히 찾아본 적이 없었다. 우리나라에 돌아와 우리나라의 시장 상황에 충격을 받고 데이터 사이언스 교육을 시작하기 전까지는.

실용 학문 대 순수(진짜)학문

공대도 분명히 관련 전공인데, 왜 필자의 말을 하나도 알아듣지 못하는 걸까? 한참을 뒤져보고 나서야 공대의 수학, 통계학 교육이 “상경계(경영학을 제외한 경제학, 응용통계학)”의 교육 수준보다 더 높지 않다는 것을 깨달았다. 굳이 따지면 그쪽은 계산을 더 빨리하는 데 초점이 맞춰져 있고, 경제학에선 수학/통계학 흉내를 내며 증명하는데 (아주 조금) 더 초점이 맞춰져 있다는 정도일까? 게다가 필자의 학부 동기 중에서도. 하다못해 학부 계량경제학 지식으로라도 대화가 되는 사람이 거의 없으니 공대도 상황은 비슷하리라는 것도 알게 됐다.

그러던 중 필자는

공대는 학부만 해도 취직이 잘 되는데, 수학, 통계학은 최소 석사, 아니 박사를 해야 자기가 원하는 일을 할 수 있다

라는 말을 들었다.

실제로 한동안 “전화기”라고 불리는 공대의 주요 전공들은 복지가 좋은 대기업에 안정적으로 취직할 수 있는 것처럼 알려졌었고, 굳이 대학원을 갈 필요가 없다, 대학원 가봐야 교수들 프로젝트나 해 주다가 (종이)학위만 하나 더 받는다는 평이 주류였다. 하지만 수학, 통계학과 학생들은 학부 3학년이 되면 거의 다 떨어져 나갔고, 대학원은 실력으로 승부를 보겠다는 학생이 도전하러 가는 곳이었다.

수학, 통계학을 조금만 빌려 쓰는 필자의 전공에서도 박사 지원을 하려면 복수전공은 필수였다. “박사생은 지능을 과매도한 학생들이다(PhD students are those who oversold their intelligence).”라는 표현도 있었다.

몇 년이 지나니 공학, 경영학, 사범대 같은 속칭 “실용 학문”은 훈련을 잘 받았다는 전제 아래 현장이나 연구실이나 지적 격차가 크지 않은데, 수학, 통계학을 위시한 “순수(진짜)학문”은 기업에서 그렇게 많은 인재를 필요로 하지도 않고, 고급 인재에 대한 요구 수준이 굉장히 높다는 것도 알게 되었다.

순수학문의 세상

필자가 학부 때 만난 통계학과 친구는 공대의 절망적인 통계학 이해도를 꼬집으며

거긴 어차피 미방이랑 선대 문제 풀이 이후로는 수학 안 하는 데잖아? 당연히 네 말은 하나도 못 알아듣겠지.

라고 촌철살인 한줄평을 던지던데, 통계학 학부생이 공대를 이런 관점으로 바라보고 있었다는 걸 새삼 다시 깨닫게 됐다.

공대를 나왔지만, 필자보다 확률미적분학을 더 잘하는 사람도 봤으니, 모든 공학도를 한데 묶고 싶지는 않다. 하지만 공대의 학부나 석사 교육 과정에 고급 수학이 들어가지 않는 것은 사실이기에 이 친구의 표현에 크게 공감했다. 즉, 공대 같은 “실용 학문”은 예외적인 경우가 아니면 고급 수학을 안 배워도 직장에서 일하는 데 큰 문제가 없으니 학부만 정상적으로 공부하고 졸업해도 취직이 쉬운 편이고, 그래서 굳이 대학원을 갈 필요를 못 느낀다. 실제로 대학원에서 하는 많은 “연구”는 기업에서도 충분히 비슷한 형태로 운영할 수 있다. 하지만 반대로 “(진짜)학문”은 고급 수학을 안 하면 사실상 무용지물이기 때문에, 학부만으로는 원하는 직장을 얻을 수 없다.

지금부터는 필자가 학부를 갓 졸업하고 모 외국계 증권사 IBD에서 일하기 시작했을 때의 이야기이다. 글로벌 금융위기가 닥치면서 금융시장에서 자금 조달(Financing)을 하는 게 굉장히 어려웠던 시절이었는데, 필자는 경기 회복 추세가 보이니까 너무 급하게 악조건으로 자금 조달을 하지 말고 여유 있게 접근하는 편이 좋다고 이야기하는 글에 필립스 곡선(Phillips curve)이라는, 학부 거시경제학에 나오는 간단한 그래프를 약간 보강해서 “물가지수-실업률” 대신 “인플레이션율-실업률”로 바꾼 그래프를 넣었다(필립스 곡선은 물가상승률이 0에 가까운 시대에 만들어진 모델이기 때문이다). 그런데 그 회사의 부장님, 이사님이 알지도 못하면서 그래프 그리지 말고 그냥 경제연구소 보고서에 나오는 그래프를 베끼라는 지시를 내렸다.

책임지기 싫은 내용이니 괜히 회사 이름을 쓰지 말고, 다른 회사 이름으로 면피하려는 의도였을 것이다. 하지만 이렇게 학부 수준 지식으로 설명 가능한 그래프마저도 학부 출신에게는 기회를 안 주는 게 이런 학문 출신이 겪는 비애라는 생각을 했었다. 심지어 필자의 전공은 순수학문이 아니었음에도 말이다. (참고로 당시 필자의 상사는 전부 경영학과 출신이었다.)

실용 학문의 세상

공학도 출신에게는 달갑지 않을 이야기를 더 하자면, 공학 같은 학문이 쓰이는 업계의 기술력을 바라보는 관점은 고급 수학이 아닌, 상식을 적용할 때 어떻게 모양을 바꾸는가이다. 하지만 수학 위주의 학문이 쓰이는 직장에서는, 고급 수학 수준으로 올라갈수록, 부족한 지식으로 내린 결론이 언제든 뒤집힐 수 있다.

바로 훈련 방식과 사고방식이 다르기 때문이다. 공대는 단계적 회귀분석(Stepwise regression)처럼 컴퓨터 한 대 돌려서 변수 뽑는 작업, 하이퍼파라미터 튜닝(Hyperparameter tuning)을 하는 작업이 데이터 사이언스라고 생각하지만, 수학이나 통계학 전공자들은 단계적 회귀분석은 DGP도 무시하고 비논리적일 확률도 높으니 위험하다는 생각을 먼저 하고 하이퍼파라미터 튜닝 같은 작업으로는 맞춤 계산을 할 수 없는 일상의 데이터를 쓰기 위해 고민해야 하는 내생성(endogeneity), 인과관계(causality) 같은 문제를 먼저 생각할 것이다. 단순히 컴퓨터만 ‘학대’한다고 완벽한 결과물을 얻을 수 있다는 주장 자체에 의구심이 드니 이것저것 더 뒤져보기도 할 것이다.

대전 K대의 AI 대학원 (즉 공대) 출신이 베이지안 통계적 방안(Bayesian statistics)을 배운 적이 없고, 그걸 응용하는 볼츠만 머신(Boltzmann machine) 타입의 NN 최적화 계산을 처음 듣지만, 필자는 이 주제를 보고 평소에 자주 보던 수학/통계학 응용의 확장이라는 생각을 하는 것도 같은 맥락일 것이다.

데이터 사이언스라고 불리는 분야, 아마 외부에서는 IT 전문가가 딥러닝, 인공지능이라고 불리는 엄청난 “코딩” 작업을 해 세상을 바꾸는 학문이라는 착각을 하고 있을 분야에서 위의 두 철학이 충돌할 때 나타나는 현상도 마찬가지다. 공대는 수학이나 통계학 전공자가 왜 자신들이 틀렸다고 하는 건지 이해하지 못한다. 그런 학문적 이해의 도구를 공부한 적이 없으니 왜 틀렸는지 설명을 해 줘도 이해를 못 하는 것이다. 그냥 이것저것 가져다 붙여보고 “실험”해보면 안 되냐는 생각을 한다. 이들은 대학원을 가면 더 어렵고 힘들고 괴로운 지식이 있다는 사실 자체를 경험해 본 적이 없으니, DS 대학원도 그냥 깃헙(Github) 코드 이것저것 모아보고, 혼자서 공부하다 보면 금방 따라잡을 수 있다고 생각한다. 이 분야의 대학원은 교수가 따온 프로젝트를 수행하며 코드를 찾아 붙이면 학위가 나오는 곳이기 때문이다.

“딥러닝이 제일 좋다는 게 알파고로 증명됐는데 왜 자꾸 구식 통계학을 공부하라고 하는 거야? “라고 말하는, 수많은 공학도가 대표적인 증거이다. 언제, 어떤 상황에서만 그렇다는 조건을 보지 않는, 단편적인 사고방식의 훈련에서 벗어나지 못한 채 말이다.

문득 학부 1학년 경제원론 중간고사에서 비용함수 모양이 살짝 바뀐 탓에 구간별로 다른 최적화 계산을 했던 기억이 난다. 학부 1학년 때부터 최적화 포인트가 상황에 따라 달라진다는 걸 배웠던 입장에서 조건 없이 무조건 딥러닝만을 찾는 이들을 보면 대학을 나온 게 맞는가 하는 생각을 하게 된다.

어느 종교를 가진 몇몇 신도들의 이상한 행태로 그 종교 전체에 대한 이미지가 나빠진 것처럼, 무조건 딥러닝을 외치는 ‘엉망’ 전문가가 정부 프로젝트로 국민 세금을 가져가는 것을 그대로 방치하는 전공에 어떻게 좋은 이미지를 가질 수 있을까?

필자 학교에 다니는 통계학 학사 출신 학생 한 명은 그전까지 통계학이 왜 데이터 사이언스의 핵심인지 이해하지 못했는데, 필자 학교의 수업을 들으면서 통계학이 이쪽 학문에서 한문, 라틴어와 같은 기본 “언어”라는 사실을 깨달았다고 말했다. 단지 그 언어를 쓰는 방식이 조금 달라졌기 때문에, 학부 시절에는 그렇게 안 배웠기 때문에 이해를 못 했던 것 같다면서 말이다.

서울 최상위권 대학인 K대의 통계학 석사생이 졸업할 때가 돼서야

“DGP와 내생성, 인과관계를 고려하지 않고 무작정 DNN 노래를 부르는 사람들에게 (필자가) 왜 이렇게 화를 냈던 건지 이제야 깨달았습니다.”

라는 말을 했던 것도, 그만큼의 지식이 있어야 볼 수 있다는 증거일 것이다. 생각의 틀이 확장되어야 사고의 깊이가 깊어지고, 사물의 구성 원리를 좀 더 구체적으로 이해하게 된다.

“실용 학문”이라고 불리는 전공들은 학부 전공만 잘해도 충분히 직장에서 능력 있는 인재로 대접받을 수 있고, 또 그래도 큰 문제가 없다. 심할 땐 대학 교육 수준에도 미치지 못하는 지식으로도 가능하다.

쪽수 싸움

문제는 데이터 사이언스라고 불리는 학문이, 통계학을 IT업계 데이터에 적용하는 학문이라는 용어로 받아들여지고 있는 세상에서 통계 문맹이지만 IT 관련 전공을 한 사람들이 정부 관계자, 기업 경영인, 팀장, 직원, 학계 관계자 등이 되어 사실상 “쪽수 싸움”을 하는 현실이다.

좀 더 정확하게는, 통계 문맹이어도 기업에서 즉시 투입이 가능한 “공학” 인력이었던 공학도가 이미 “권력”을 쥐고 있으니 통계 문맹이면 못 하는 업무가 생겨 통계학과 출신에게는 엄청나게 큰 시장이 열렸음에도 불구하고, 그 자리를 “IT 관련 전공자”에게 나눠주고 있다.

통계학과는 학부 3학년 이후 포기하고 다시는 통계를 안 쳐다보게 되는 “통포자”를 대량으로 양산하는 전공이다. 그래서 이 시장에서 “쪽수 싸움”을 할 수 있는 인력을 확보하지 못했다.

더닝 크루거 현상(Dunning-Kruger effect)의 관점에서 볼 때, 공학 인력은 “아예 몰라서” 자신감이 넘치지만 좀 더 많이 알고 있는 통계학과 출신 인력은 “잘 모르겠으니까” 자신감을 잃어버린 상태인 것이다.

사진=어린이 조선일보

쪽수 싸움 대 실력 싸움

시장 초창기에는 인력의 수준 격차가 잘 구분되지 않아 시장 진입이 쉽다. 하지만 시간이 지나면서 이 격차를 팀장이, 대표가, 오너가, 시장이 이해하는 시점이 온다. 필자는 우리나라 데이터 사이언스 분야에서도, 좀 많이 늦기는 했지만, 이 시점이 조금씩 다가오고 있다고 생각한다. (필자가 개발자에게 ‘버린’ 돈이 스쳐 지나가는 순간이다.)

우리나라에는 여전히 필자가 “‘IT 출신’이 아니라 수학/통계학이 중요하다고 착각한다고 주장”하며 진짜 “착각”을 하고 있는 사람이 있지만, 영미권에만 가도 시장은 이미 엄청나게 많이 바뀌었다.

어떤 DS 관계자는 필자에게 요즘 영국에서는 학부에서 수학, 대학원에서 DS를 전공한 인력이 1순위이고 그중에서도 캠브릿지 대학교 수학과를 나와 ICL에서 DS 석사를 한 사람을 가장 높게 평가한다고 이야기했다. (참고로 ICL, 즉 임페리얼 칼리지 런던(Imperial College London)은 어려운 교육을 하기로 유명한 학교이다. 알파고를 만든 데미스 하사비스도 ICL에서 박사 과정을 밟았다.) 순수학문을 바닥에 깔고, 실용 학문으로 “취업 전용 교육(?)”을 받은 인재를 시장이 좋아한다는 뜻이다. 경제학이나 공학에서도 수학, 통계학을 배우지 않냐고 물어봤더니, 그 전공은 2순위라는 답이 돌아왔다. 순수학문 기반을 가진 인재가 그렇지 않은 인재보다 훨씬 더 인정을 받는 세상이라는 뜻이다.

비슷한 관점에서 미국의 마테크(MarTech), 애드테크(AdTech) 시장에서는 하버드, MIT를 나온 경제학 박사를 데이터 사이언스로 채용하고 있다. 이 분야 역시 박사 1~2학년 때 수학 공부를 정말 열심히 하지만, 논문은 현실 주제로 넘어오니까 균형이 잘 잡혔다고 생각하는 것이다. 괜히 통계학처럼 학부 3학년 때 포기하는 전공 골라서 후회한다던, 지금은 회계사로 일하는 군대 후임의 불평이 기억나는데, 원래 남들이 어려워서 못하는 것을 하는 사람이어야 (노동)시장에서 우월한 지위를 갖는 것이다. 단지 수학이나 통계학은 대학원까지 살아남아야 하는, 위험이 높지만 보상은 큰 전공이고 실용 학문은 어지간하면 다 살아남는 위험이 낮은 분야일 뿐이다.

그동안 우리나라에서는 위험이 낮은 실용 학문이 오히려 보상이 컸고(최소한 중간은 됐고), 이런 높은 위험을 감당해도 높은 보상을 받는 직장이 많지 않았던 탓에 굳이 위험한 전공을 고를 필요가 없었다. 하지만 우리나라의 데이터 사이언스 분야에서 통계 문맹이 들고 있는 “시한폭탄”은 곧 터질 것이다. 이제는 시대와 기술력이 변했으니, 통계학 전공자에게도 기회가 많이 열릴 것이다.

하지만 교육 수준이 부족한 것은 맞다. 필자는 이런 시장의 한계를 보고 굉장히 “실용적”인 활용에 초점을 맞춰 통계학과의 변형 과정인 데이터 사이언스 전공을 만들었는데, 실제로 교육을 하면서 아무리 실용적으로 만들어도 “언어”인 수학과 통계학 습득이 안 되면 어쩔 수 없다는 것을 느끼고 있다. 즉 데이터 사이언스는 순수학문 훈련이 어느 정도는 되어야 실용 학문 지식을 배워 도전할 수 있는 분야라는 뜻이다.

지난 수십 년간 높은 위험과 낮은 보상에 신음했던 통계학 전공자들에게 응원을 보낸다.

Share this Doc

공대는 학부만 해도 되는데, 통계학은 대학원에 가야 한다고?

Or copy link

CONTENTS