①SIAI 설립 동기

수학, 통계학 중심의 AI대학원 커리큘럼

Estimated reading: 1 minute 69 views
160X600_GIAI_AIDSNote

업계에서 필자의 컬럼에 대해 “코딩은 필요없다는건가”, “현업에서 수학의 효율은 기대하기 어렵다”, “통계학은 평균,분산 구하는것 아닌가”, “수학・통계학의 시대는 지났고, 인공지능에게 맡기면 된다”등의 지적들을 하고 있는 것으로 안다. 그러나, 이는 단지 필자만의 주장이 아닌, 영미권 응용 수학・통계학(Applied Mathematics & Statistics) 전공에서 운영하는 데이터 사이언스 프로그램이 선도하고 있는 AI라는 학문의 전반적인 흐름이다. 필자는 지금까지 많은 글들을 통해 관련 오해들을 지적해왔는데, 이와 비슷한 관점을 대한민국에서 유일하게 S대 계산과학 연계전공에서도 볼 수 있다는 점을 이번 글에서 전하고자 한다.

아래 소개하는 교수님과는 개인적인 친분이 전혀 없고, 순수하게 구글링을 통해 찾은 정보임을 미리 밝힌다.

 

사진=서울대학교 컴퓨터공학과 장병탁 교수님 홈페이지

S대 컴퓨터 공학과에서 수학・통계학 기반의 AI 관련 교육을 하시는 장병탁 교수님이시다. 그동안 필자가 봐왔던 우리나라 컴퓨터 과학(Computer Science) 교수님들의 강의 목차 중 처음 볼츠만 머신(Boltzmann Machine)을 가르치시고 계셨다. 또, 볼츠만 머신을 이해하기 위해 마르코프 연쇄 몬테카를로(Markov Chain Monte Carlo, MCMC), 깁스 샘플링(Gibbs sampling)으로 이어지는 베이지안(Bayesian) 계산통계학의 한 축과 네트워크 이론(Network theory)에서 랜덤 워크(random walk)와 같은 주제, 그리고 이를 다루기 위한 마르코프 과정(Markovian process), 그리고 요인 분석(Factor Analysis)을 가르치시는 강의 노트를 확인할 수 있었다.

그간 필자는 역전파(Back-propagation)은 80년대 계산법이고, 90년대 후반 이후에 문제점을 보완한 볼츠만 머신을 쓰지 않는 이상, 그 한계로 인해 신경망(Neural Net) 계산을 신뢰하기는 어렵다고 강조해왔다. S대 대학원 수업에 볼츠만을 가르치시는 위 교수님의 커리큘럼이 필자의 신경망에 대한 견해와 같은 선상에 있다는 것을 확인할 수 있다.

 

사진=서울대학교 컴퓨터공학과 장병탁 교수님 홈페이지

위 교수님이 남들은 고개를 한번쯤은 숙일 S대 컴퓨터 공학과 교수, S대 AI 연구원장, 그리고 N사에서 연구원 100명이 참여하는 수백억원대 공동 프로젝트를 맡기는 핵심 인력이니, 충분히 설득이 될 것이다. 우선, 이런 분을 못 찾고 그동안 컴퓨터 과학 분야를 비난한 부분에 대해서 고개 숙여 사과드린다. 대신, 이런 글로벌 수준 지식을 갖고 있는 분이 아니라면, 인공지능에 대한 오해를 불러일으키는 언행은 자제해주셨으면 좋겠다. 이와 비슷한 수학・통계학 훈련을 받아 연구 주제만 전환하면 짧은 시간 안에 적응할 수 있는 분들이 문과인 경제학에만도 국내 최소 수백명은 있다는 점을 상기시켜드리고 싶다.

영미권의 유수 대학 데이터 사이언스 프로그램들과 비교해서, 위 교수님의 커리큘럼과 관련해서 공유할만한 포인트가 크게 3가지가 있다.

 

1. 영미권에서는 여러 과목에 나눠서 가르치는 내용을 1-2과목에 압축했다

해외 대학의 플래그십(flagship)에 해당하는 데이터 사이언스 프로그램들을 살펴보면,

  • Graph Theory,
  • Information Theory,
  • Machine Learning,
  • Reinforcement Learning,
  • Bayesian Time Series

에 걸쳐 나눠넣은 교육 과정을 1-2과목에 다 가르치시고 있다. 필자 또한 필요한 수학은 스스로 찾아가며 공부하면 된다고 생각하기에, 이런 1-2과목 압축형 커리큘럼에 동의한다.

그러나, 비슷한 수업을 여러 주제를 필요한 수학・통계학 기준에 맞춰 12시간의 수업으로 묶어 필자의 ‘데이터 사이언스 모델링’이라는 수업으로 운영한 적이 있었는데, 대부분의 수강생이 좌절하고 한 학기 수업으로 만들어달라고 요청하는 경우가 대부분이었다.

꽤 준비되신 분들마저도 수업 중반부에 들어서면서 퍼지시는 모습을 지켜봤는데, 위처럼 1-2과목에 내용을 모두 몰아넣으면 충분히 지식이 전달 되었을지 우려스러운 부분이 있다. 해당 커리큘럼을 소화하기 위해 수강생들이 그 전에 상당한 수준의 수학・통계학 훈련을 받았어야 할 것이다.

 

2. 얼마나 지식을 소화할 수 있었을까?

필자가 3년간 ‘데이터 사이언스 모델링’ 강의를 총 3번 진행했던 경험이 있다. 약 50명의 인원을 가르치면서, 수학 및 통계학으로 일정 수준 이상의 훈련을 받은 분들만 수강생으로 받았고, 상당수는 국내외 대학의 박사과정을 거치셨던 분들이었음에도 불구하고, 대부분이 지식을 완전히 소화하기 버거워하셨던 것으로 기억한다.

S대 컴퓨터 공학과 전공 커리큘럼 상 수학・통계학을 훈련하는 수업이 주를 이루고 있지는 않다보니, 얼마나 많은 수의 학생들이 제대로 듣고 이해했을지 우려스럽다.

남의 전공 상황을 함부로 재단하고 싶지는 않으나, 배운 지식에 대한 측정이 가능한, 볼츠만 머신과 관련된 질문에 대답을 제대로 하셨던 분이 거의 없었던 필자의 경험상, 다른 기초 훈련없이 해당 수업을 제대로 이해한 분이 있을지, 고급 지식을 이해하기 위한 추가적인 기초 수업들이 필요하진 않을지 걱정되는 부분이 있다.

 

3. 체계적인 커리큘럼의 중요성

필자가 견지하고 있는 AI에 대한 견해는 필자의 석・박 유학 시절 혹독하게 받은 영미권 교육 및 해외 유수 대학의 데이터 사이언스라는 학문의 전반적인 흐름에 기반하고 있다. S대 계산과학 연계전공이 위 흐름을 유일하게 이해하고 있는 것으로 보이나, 학부 사정 및 커리큘럼의 구성을 고려했을 때, 혹독한 교육과정에서 제대로 살아남을 수 있는 인재는 몇 안될 것으로 짐작된다.

어느 유명 해외의 데이터 사이언스 프로그램의 경우, 위 커리큘럼 스타일을 유지하면서도, 이를 더 자세하게 가르쳐 주는 커리큘럼을 제공하고 있다. 더불어 많은 데이터 셋에서 데이터 생성 과정(Data Generating Process, DGP)에 맞춘 적절한 모델링을 할 수 있도록 경제학의 계량경제학 도구, 방법론, 활용처 일부까지 가르치는 커리큘럼을 제공하는 경우도 있다. 이러한 교육과정을 거쳐야 수학, 통계학을 해당 교육기관이 가르치는 레벨로 이해하고, 나아가 데이터 사이언스 업계에서 복잡한 현실 상황을 맞닥뜨려도, 배운 수학・통계학적 지식과 도구들로 문제들을 논리적으로 해결할 수 있는 능력을 갖추게 될 것이다.

그러나, 아직 우리나라의 AI 교육기관은 위와 같은 지식선진국의 체계적인 교육 커리큘럼이 구성된 바가 없어 아쉬울 따름이다. 언젠가는 ‘진짜’ 전문가들이 힘을 합쳐 경제학, 수학, 통계학의 기반을 단단히 다져 계산과학 및 인공지능 전문가를 양성할 수 있는 체계적인 커리큘럼을 갖춘 데이터 사이언스, 인공지능 교육 기관이 출범할 수 있기를 바래본다.

 

+AI를 제대로 공부하고 싶은 분들께

AI를 제대로 공부하고 싶다면, 수학・통계학적 훈련은 일정 수준 이상으로 필요할 것이다. 다른 양적(Quantative) 학문의 상황도 별반 다르지 않다.

경영학과를 예로 들면, 경영학과에서 재무(Finance) 교수님들이 다루는 수학・통계학 훈련이 된 경우는 경영학과 학・석사를 마친 분들이 아닌, 수학・통계학을 복수전공 하신 분들이다. 이런 훈련을 받았어야 대학원에서 재무 전공과 관련된 논문들을 이해할 수 있기 때문이다. 수학・통계학 공부를 자체적으로 하는 경제학과 또한 상황은 다르지 않다. 수학, 통계학과의 해석개론, 수리통계학 이수기록 및 학점이 있어야 대학원 추천서를 받을 수 있다.

위의 CS 대학원 수업 커리큘럼 또한 AI로 이름을 달아놓은 주제도 위와 맥락을 같이한다. 수학・통계학을 어느 정도 깊이 이상으로 공부해야하는 전공의 대학원은 누구나 다 괴로운 벽을 넘어야한다. 다루는 내용이 이미지 인식, 언어 처리인지, IT업계의 개인 행동 데이터인지, 금융데이터인지 등으로 도메인의 차이만 있을 뿐이다. AI라고 불리는 계산과학을 제대로 공부하고 싶다면, 수학적인 도전은 반드시 필요할 것이다.

Share this Doc

수학, 통계학 중심의 AI대학원 커리큘럼

Or copy link

CONTENTS