Skip to main content
Keith Lee
Head of GIAI Korea
Professor of AI/Data Science @ SIAI
석사 시절, Financial Economics 라는 극악의 난이도를 가진 수업을 듣던 시절의 이야기다. 그 수업이 1학기는 Discrete time, 2학기는 Continuous time으로 Asset pricing 모델을 배우는 수업인데, 잘 모르는 사람들이 착각하는 것처럼 주식시장에서 차트 따라가서 돈 버는 방법을 가르쳐주는 "기능" 수업이 아니라, 괴로운 수학 모델 기반으로 Fundamental Theorem of Asset Pricing (FTAP) I, II를 증명해가며, Portfolio 구성에 어떤 위험과 어떤 수익 관계가 생기는지를 경제학 & 수학 을 이용해 추상화된 모델을 배우는 수업이다. 특히, 2학기에는 Stochastic Calculus라는 1/무한대, 즉 무한소의 영역을 다루는 완전히 새로운 종류의 수학을 이용해야 되는터라, 안 그래도 따라가기 버거운 지식의 수학적 난이도는 더 극악이 된다. 이쪽 학자들 중에 아예 Stochastic Calculus를 모르는 사람도 은근히 될 정도다.
학부 시절에 개인적인 사정으로 잠깐 알게 됐던 어느 선배의 사연이다. 재외국민 특별전형으로 우리 학교에 왔던 형인데, 이과에서 제일 점수대가 높은 애들이 가는 과니까 컴퓨터 공학과를 골랐다고 했었다. 오직 자기가 똑똑한 사람인데, 똑똑한 증거를 보여주기만 하면 된다는 생각 이외에, 해당 전공 지식을 어떻게 써서 어떻게 활용한다는 생각이 전혀 없던 분이었는데, 정작 컴퓨터 공학과 학점은 굉장히 안 좋았고, 경제학이건 경영학이건 상관없이 복수전공 하나를 해서 "상경계열" 학위를 하나만 갖고 있으면 된다고 생각하더라. 전형적인 국내 대기업 인사팀 방식의 채용에 특화된 사고방식을 가진 분이었다고 생각한다. 어차피 전문성이라는거 없이, 똑똑한 애 뽑아다가 일 시키면 되고, 기본적인거만 학교에서 배워오면 나머지는 직장에서 알게된다는 사고의 결과물이다.   그럭저럭 15년이 흐른 요즘, 우리 SIAI에 들어온 학생들 중 몇몇에게서도 비슷한 사고방식을 본다.
15년쯤 전의 일이다. University of WisXXXXXX이라는 대학 학부를 나온 분이 해외 대학이 좋은 이유를 짧게 설명하는 간담회(?) 같은 자리에 우연히 참석한 적이 있다. 자기가 한국에서 중X대학교를 2년 다니고, 군에서 유학 준비를 해서 아예 1학년부터 다시 해외대학을 갔단다. 약간 늦게 졸업하기는 하는데, 국내 학부 동기들과 지금의 자신은 주어진 기회라는 측면에서 비교 불가능한 레벨이고, 무엇보다 지식의 절대량이 다르고, 지식을 바라보고 이해하는 방식이 완전히 다르단다. 자기는 사물의 원리를 이해하며 지식을 습득하는 서구식 교육을 통해 자신의 국내 학벌을 지표로 삼을 수 있는 잠재력보다 훨씬 더 큰 사람이 되었는데, 중X대학교 친구들은 여전히 국내식 암기 달달달 교육을 통해 대학 내내 아무것도 배우는 것 없이 졸업하고 전공 살리지도 못하는 직장을 갔단다.
오늘 글의 부제는
당신이 한국의 데이터 사이언스 대학원을 가면 안 되는 이유
라고 달고 싶다.   오늘 그 증거를 하나 보여준다. 아래는 우리 MBA in AI/BigData 학생이 보내온 개인 DM (Direct Message)다. 이 분은 국내의 모 데이터 사이언스 대학원을 다니다가, 이건 절대 아니다는 생각이 들어서 자퇴하고 우리 대학원으로 갈아탄 케이스다. 면접 때 주제넘게 MSc 도전 같은 생각은 안 하고, 그냥 MBA라도 졸업할 수 있으면 좋겠다고 했던 말도 기억나고, 국내 모 대학원 입학 중 겪은 충격적인 면접 이야기도 기억난다. 첫 수업 듣고 쇼크먹고 "유학가서부터 이렇게 공부하셨나요 ㄷㄷㄷㄷ" 같은 코멘트 했던 기억도 나네.  
아직까지 머신러닝, 딥러닝, 인공지능 같은 단어들이 보고서를 통과시켜주는 마법의 단어인 2류 시장 대한민국과 달리, 미국, 서유럽에서는 이런 계산과학 방법론을 다른 학문들이 어떻게 받아들여야하는지 이미 한번의 웨이브가 지나가고, 어떤 방식으로 쓰는게 합리적인지 내부 토론으로 정리가 되어 있다. 출신이 경제학이라 석사 이후로 발을 뺀지 오래되었음에도 불구하고 습관처럼 유명한 경제학자들 웹페이지에 올라온 Working paper나 기고를 훑어보는데, 오늘은 경제학에서 ML 방법론을 어떻게 받아들이고 쓰고 있는지에 대한 정리글을 소개한다.
Machine Learning Methods Economists Should Know About
필자에게 데이터 사이언스로 해외 유학을 준비한다면서 한국 대학과 차별되는 해외 대학의 차이는 무엇이며, 어떤 기준으로 학교를 선택해야하는지를 묻는 분들이 있다. 그 분들께 데이터 사이언스를 가르치는 커리큘럼을 먼저 보시라 조언을 드리면, 해당 학과의 교수진이 누구인지를 먼저 파악해야되는게 아니냐고 반문을 하신다. 마음 속에는 교수진이 누구인지 그렇게 중요하지 않은데, 왜 저런 질문들이 나올까하는 궁금증이 있었다. 질문주신 분들이 아마 일반 학원들처럼 1명의 스타 강사 의존형 시스템이 아니라, 학교가 갖는 커리큘럼의 위력을 보지 못하셨기 때문이라는 생각이 들기도 했다. 우리나라 대학들이 커리큘럼을 탄탄하게 운영하는 곳이 거의 없고, 노력하는 극소수의 교수 몇몇의 고급 강의 컨텐츠가 아니면 학생들이 알아서 공부해야하는 교육 시스템을 갖고 있기 때문이다. 적어도 1류 교육 시스템 아래에서는 교육의 질은 연구 분야처럼 소수의 엄청난 실력자 몇 명에 의존하는 부분을 제외하면, 모두 학교 자체가 보유한 커리큘럼의 역량에 달려있는데, 오늘은 이 부분을 좀 더 구체적으로 지적해본다.
아래는 합격점을 받은 학부 통계학과 출신의 수강후기다. 초반부 답안지는 굉장히 열심히 공부한 티가 났지만, 후반부로 가면서 구멍이 좀 많이 났다 싶었던 답안지였는데, 후기를 보니, 이런 종류의 시험을 처음 치렀을 때 흔히 겪는 대로, 시간 배분에 실패한 듯 싶다. 본인의 부족함을 알고 더 열심히 공부하고 있는만큼, 더더욱 발전할 수 있는 여지가 있으리라 생각한다.
(중략)
MSDS Boot Camp 시험을 치르고 나니 몇 개 후기를 더 받았는데, 프로그램 결정하는데 or 업무하는데 도움 될 것 같아보이는 구절들만 몇 개 골라봤습니다.
(중략) 제가 이번 강의를 들었던 가장 큰 이유는 MSDS 과정을 밟기 위해서가 아니라, (*주: MSDA 지원하겠다고 미리 말씀하신 분)데이터 사이언스라는 분야에 발을 들이기 위해선최소한 어떤 학문 또는 역량, 훈련이 필요한지 알기 위해서였습니다. 강의를 들었을 땐 조각이 맞춰지는 기분이었는데,이상하게 시험을 치뤘을 땐 '아 그 때 다 맞춰진 게 아니라 그냥 기분이었구나. 아직 멀었구나'라고 생각했습니다. 웃프네요. 12년 동안 수학은 암기과목이다 생각하고 살아온 탓에,수학, 통계학을 직관적으로 바라볼 수 있는 훈련(혹은 교육)을 받고 싶었습니다.직관적인 시각, 훈련을 기르기에 2달이라는 기간은 제게 조금 짧았던 것 같아요.(중략)
MSDS 입학시험 문제가 공개되고 난 다음에 또 말들이 돌던데, 무슨 박사 시험 문제를 냈다는 둥 어쨌다는 둥ㅋㅋ 학부 4학년 경제학과 고급계량 정도, 통계학과 학부 고학년 시계열 정도에 나올만한 내용들에 불과하다. 나중에 대학원 박사 수업 문제들 공개하면 무슨 말이 나올려나? ㅋㅋ 문제가 AI랑 아무 관계 없다는 둥 그러던데, 일부러 Deep Neural Net, Reinforcement Learning이 쓰일 수 있는 DGP가 얼마나 제한적인지를 확인하는 항목을 추가했다. 암튼, 이번에는 어문계열 출신인데 정말 이 악물고 열심히 공부해서 이 모든 걸 이해하고 시험 잘 치신 분의 후기를 공유한다.
학부는 XX과 (*주-어문계열)를 나왔고요, 석사는 대표님께서 익히 알고 계시는 빅데이터 석사를 나왔습니다. (중략)
MSDS Boot Camp 시험을 치르기도 전에 아래의 후기를 받았습니다. 학생들의 프로그램 선택 및 수학/통계학에 대한 접근 방식에 좋은 정보가 될 것 같아, 본인 동의 하에 개인정보를 생략하고 공유합니다.
안녕하세요. 이번 MSDS Prep 강의 수강자 XXX입니다. 준비가 너무 미흡하여 입학시험을 포기하겠습니다. 죄송합니다. 아직 미련이 남아 시기를 정확히 말씀드리지는 못하지만 이번 MBA 코스 혹은 내년 MSDA를 목표하고 있어 이하 변명의 글을 적습니다. 저는 CS학부를 졸업하고 현재 데이터 직종에 종사하고 있습니다. 사내 분류상 DS직무로 분류되지만 본 업무는 데이터 모델링 및 분석 업무가 주된 업무입니다.
업계에서 필자의 컬럼에 대해 "코딩은 필요없다는건가", "현업에서 수학의 효율은 기대하기 어렵다", "통계학은 평균,분산 구하는것 아닌가", "수학・통계학의 시대는 지났고, 인공지능에게 맡기면 된다"등의 지적들을 하고 있는 것으로 안다. 그러나, 이는 단지 필자만의 주장이 아닌, 영미권 응용 수학・통계학(Applied Mathematics & Statistics) 전공에서 운영하는 데이터 사이언스 프로그램이 선도하고 있는 AI라는 학문의 전반적인 흐름이다. 필자는 지금까지 많은 글들을 통해 관련 오해들을 지적해왔는데, 이와 비슷한 관점을 대한민국에서 유일하게 S대 계산과학 연계전공에서도 볼 수 있다는 점을 이번 글에서 전하고자 한다. 아래 소개하는 교수님과는 개인적인 친분이 전혀 없고, 순수하게 구글링을 통해 찾은 정보임을 미리 밝힌다.  
지난 글 이후로 많은 의견을 받았는데, 답변차원에서 2번째 글타래를 이어가본다. 지난 글에서 이미 컨설턴트의 '케이스 풀이법'에서 선형적 비지니스 접근의 한계에 대해서는 언급했으므로, 이번에는 실제 현업에서 비지니스 하는 사람들과 컨설턴트들의 차이를 살펴보자. 케이스 풀이법에서 슈퍼마켓 예시를 들었으니 같은 산업에서 스토리를 이어가보려 한다.
우리 회사에 전략 컨설팅 방식의 비즈니스 접근 방식을 좋아하고, 그 방법으로 비지니스 의사결정을 안 하고 있는 상황을 잘못되었다고 지적하는 직원이 하나 있다. 그 분의 접근 방식이 왜 잘못되었는지를 설명하다보니, 해당 설명이 왜 선형 회귀에서 비선형 회귀 또는 머신러닝으로 계산 알고리즘의 중심축이 이동하고 있는지와 맞닿아있는 것 같아 글을 한번 정리해본다.
대부분의 일반인들에게 빅데이터 분석이라고 하면, 빈도수 기반으로 워드 클라우드를 뽑아내거나, 데이터와 관련된 그래프를 뽑아내는 것으로 이해하고 있을 것이다. 혹은 나아가 빅데이터 분석의 키워드를 데이터 과학(Data Science)로 잡을 확률이 높고, 지적 & 철학적으로 훈련된 리그로 가면 복합지능(Integrated Intelligence)라는 표현을 진정한 키워드로 보기도 한다. 그러나 사실 필자가 생각하기에 빅데이터 분석의 핵심 키워드는 계산과학(Computational Science)이다. 그렇다면 계산과학이란 무엇일까?