Why SIAI - 3. 박사과정 중 필요성을 느꼈지만 엄두를 못냈던 지식들이라는 확신이 들었습니다

Picture

Member for

5 months 1 week

Real name

Keith Lee

Bio

Head of GIAI Korea
Professor of AI/Data Science @ SIAI

Input

2022-01-03 00:00

S대 공학 박사 시리즈 글 3번째다.

1편: S대 공학 박사가 본 수학 & 통계학이 필요한 이유

2편: S대 공학 박사가 본 수학 & 통계학이 필요한 이유 - 후기

은 위의 링크를 따라가서 직접 확인하기 바란다.

아래는 MSc DS 지원 당시에 보낸 메일에서 개인 정보를 최대한 제거한 글이다.

(1) 소개

올해 3월 데이터 사이언스 메인 강좌를 수강한 XXX입니다.

블로그 내용대로, 작년에 수학 & 통계학 for Data Science 수강 후 학부 2~3학년 수준의 선형대수/ 회귀분석/ 통계 복습에만 4개월 이상 걸렸습니다.

(중략)

(4) 지원 전공: MSc Data Science (예비 석사 과정)

(5) 지원 사유

고급 수준의 XXX 관련 연구에 꼭 필요하지만 공대 대학원에 있을 때 습득하지 못한 수리통계 지식들이 SIAI의 MSc DS ~ MSc AI 커리큘럼에 있는 것을 보고, 인생에 오는 몇 번의 큰 기회 중 하나라고 생각하여 지원합니다.

XXX 연구 당시, 선도적인 논문들에서는 상당수가 하기의 수리통계적 요소를 포함하고 있었습니다.

[A] Stochastic analysis: XXX는 불확실성을 갖습니다. 특히 XXX 연구 기준으로 High-frequency (15분 - 1시간)이면서 장기간 (몇 년) 축적된 Time series data 이므로, 계절 성분을 포함하고, 자기 상관이 큰 장기간의 Non-stationary 데이터 처리 테크닉이 필요합니다.

[B] Multi-stage programming: 불확실성을 고려해 여러개의 시나리오를 상정하거나, Period를 N개로 나누고, 각 Sub-period별로 직적 sub-period의 최적화 결과가 다음 sub-period의 초기조건이 되도록 문제를 구성하는 경우가 있습니다. 이런 경우, Multi-stage programming 문제가 되며, (*주: MSc DS ~ MSc AI에 걸쳐있는) Dynamic optimization으로 해결 가능한 것으로 알고 있습니다.

[C] Multiple decision makers: XXX 시장과 공급망 내 여러 참여자들 각각의 YYY 등 행동은 최소비용 수요 충족 등 제약 하에 각자의 목적함수를 최소화하는 방향으로 이루어지며, 서로에게 영향을 미칩니다. (특히 XXX 비중 증가로 sotchasticity도 증가해 문제가 어려워지고 있습니다.) 한편 정부의 XXX 정책도, YYY 보급률을 늘리려는 정부와 비용을 최소화하려는 YYY 도입 주체 간의 dependent한 의사 결정으로 볼 수 있습니다. 관련해 Game theory를 적용할 수 있겠다는 생각을 했습니다. (자세히 배운 적은 없지만요.)

[D] Panel data analysis: XXX 분야는 필연적으로 정책과 유관하므로, XXX 연구 결과물은 정책 관련 함의 제시에 쓰일 수 있어야 합니다. 관련해 XXX 연구원 등 유수의 연구기관에서 발행한 연구결과물에서, 패널 데이터 분석 등 계량경제 이론이 많이 쓰이는 것을 보았습니다.

[E] AI: 최근 XXX 분야에서도 "XXX and AI"라는 신생 저널도 생기고, YYY 연구에서도 ZZZ을 RNN으로 예측하는 등, AI를 접목하려는 시도가 활발히 이루어지고 있습니다. 그러나 대부분의 경우, 그 시도들에 수학적 고민이 충분히 포함되었는지에는 다소 의문이며, 위에서 기술한 XXX 연구의 전체 그림과 유기적으로 얽힌다기보다는, 딥러닝으로 당장 결과를 뽑을 수 있는 일부 Module에 한정적으로 적용되고 있다는 느낌입니다.

[A] ~ [E] 전부 SIAI의 커리큘럼에 포함되어 있는 것을 보고, 제가 대학원생 때 막연하게 필요성을 느꼈지만 습득할 엄두를 내지 못했던 바로 그 지식들이라는 것을 확신했습니다. 이러한 확신이 드니, 평범한 직장에 고착화되기 전에 한 해라도 빨리 도전하자는 생각 또한 들었고, 지원을 결정하게 되었습니다.

위의 사항들을 왜 대학원 때는 습득하지 못했냐 하면...

우선 지도교수님께서 XXX을 주력으로 연구하는 분이 아니셨고,

저년차 때는 XXX 도메인과 최적화 공부, 그리고 ZZZZ를 쓰는 프로젝트 수행에 바빠 저런 시각을 갖지 못했습니다.

대학원 중년차(?) 쯤 되니 슬슬 저런 요소들이 있다는 것은 보였으나, 저런 수학 요소들을 경제수학의 이런저런 교재를 보면 배울 수 있다는 것을 알려주는 사람도 없었고, 코스웍 기간은 지나버린 데다, 당장 학위논문 주제를 정하고 논문을 싣는데 신경써야 하는 현실(?) 앞에서, 당장의 프로젝트에 쓰지 않을 수학에 장기투자(...) 할 엄두가 나지 않더군요.

블로그 글에 지적해주셨던대로 이제서야 정신차리고 다시 배우겠습니다. 그래서, 국내 XXX 연구 수준과 XXX 관련 의사결정의 합리성을 Global 수준으로 끌어올리는데 이바지할 수 있는 사람이 되고 싶습니다. SIAI에서라면 실현 가능한 목표라 믿습니다.

(일반적인 Data Science 및 Artificial Intelligence 관련 동기와는 다소 다른 동기가 되어버렸는데, 이를 "개인화된만큼 더욱 확실한 학습 동기", 혹은 "SIAI의 Output 다양성"으로 봐 주신다면 감사드리겠습니다.)

입학 당시 내부 평가

국내에서 지난 몇 년간 다양한 종류의 공학 전공에서 국내 대학 박사 학위를 한 분들을 만나봤었지만, 이렇게 구체적으로 자기에게 필요한 수학, 통계학 주제를 정확하게 이해하고 있는 경우는 극히 드물었다.

처음 1달짜리 단기 수업에서 만나봤을 때부터 이미 느꼈지만, 국내 공돌이, 아니 공학도 중에 상위 0.01%에 해당하는 분일 것이다.

(내가 공돌이들 한테 혐오감이 최대치를 찍었지만, 이런 분에게까지 그런 비속어를 쓰고 싶진 않다. "공학도"로 정정한다.)

기초 수학을 따라오는데 긴 시간이 걸리는 비전공자인만큼, MSc DS, MSc AI에서 최상위권이 될 확률은 높지 않지만, 수업 따라오는데 큰 어려움은 없으리라고 기대를 했었고,

실제로도 매우 잘 따라오고 있는 중이다.

한국 사회를 바꿔주는 밀알이 되시리라고 큰 기대를 갖고 있다.

지원 서류 검토 당시에 우리가 가장 높게 샀던 부분은,

뭘 배워야하는지를 알고 있고, 우리 SIAI에 와서 그 포인트들이 해결될 수 있을 것이라는 구체적인 방향 설정이었다.

무슨 코드 베껴서 AI 전문가 되겠다는 허황된 꿈을 가진, 국내 언론들 때문에 왜곡된 시야를 가진 지원자 투성이였는데,

(ex. 제가 비전공자이지만 10년 동안 코딩을 해서 좀 자신있는데요, 그럼 MSc AI 바로 들어갈 수 있나요?)

다른 학생들과 다르다고 잘못되었다는 생각을 한게 아니라, 되려 우리와 Fit이 꼭 맞는 분이 아닐까 생각했었다.

우리가 AI 전문가를 기르는데 정작 Business 연계 전공인 MBA에 큰 초점을 두고 있는 이유가,

다양한 학문 출신들이 자기의 강점과 SIAI의 강점을 결합해서 Synergy를 창출해내기를 바라기 때문이다.

일전에 소개했던 S대 계산과학 연계 전공의 Business 버전이 우리가 꿈꾸는 학교의 모습이거든.

우리 SIAI가 제공해 줄 수 있는 교육

우선 저 위의 [A] ~ [E] 교육이 우리가 Boot camp 수준의 AI 코딩 교육에 비해서 가진 2가지 장점 중 하나다.

Global 레벨 연구자들에게 공통적으로 받아들여지는 연구 방법론을 AI 교육에 접목한 커리큘럼, (즉, 영미권 초명문대 대학원 교육)

나머지 하나는 MBA에서 가르치고 있는 Business 적합도를 높인, "진짜 실제 현실의 문제를 해결하는 능력"을 키워주는 교육이고.

아마 저 공학 박사 분은 국내에서 [A] ~ [E] 교육을 받을 수 있는 교육 기관 자체를 찾기 힘들었을 것이다.

어쩌면 내 모교, 모 학부인 S대 경제학부 대학원 석/박 과정에서 일부 가르쳐주실지는 모르겠는데, (나도 대학원 안 가봐서 모르겠다)

경제학과 스타일로 가르치지, 공대 학생을 배려해서 Problem Set이나 기말고사를 출제하기는 어려울 것이다.

당장 미시, 거시 경제학의 주제들을 저런 수학으로 풀어내는 문제를 만들어내는 것도 쉽지 않은데, 공대생 1-2명을 위해 추가로 시간을 쏟기에는 교수님들도 힘드시겠지.

경제학에서 저런 고급 수학을 쓰는 교육을 받고, 나중에 Financial Math가서 다시 저 수학을 쓴 모델을 배우면서 느낀 거지만,

학문 범위가 아주 조금만 달라져도 수학이라는 도구만 똑같지, 정작 문제에 접근하는 태도 같은게 확 달라지더라.

더더군다나 ML, DL, RL 하는 CS분들이 같은 수학, 통계학을 쓰는걸 보면, 아예 철학적인 태도마저 다른 것도 느낀다.

CS로 미국에서 박사하신 다른 박사님도 우리 MSc DS에 오셨는데,

미국에서 이런저런 괜찮은 MSc DS를 찾아가봐도, 대부분 원하지 않는 뜬금없는 해당 학문 내용을 너무 많이 요구하더라는 불만이 있으셨다.

우리 SIAI는 같은 레벨의 고급 수학을 Data Science의 문제를 풀어내는 관점에서 커리큘럼으로 만들(기 위해 엄청난 노력을 쏟아 부)었다.

물론 세부 과목마다 내 출신 전공인 경제학이나 Financial Math 냄새가 풀풀 풍기는 문제들을 던지거나,

다른 교수님들이 자기 전공 출신 냄새가 풍기는 강의노트를 들고 있기는 할 것이다.

아마 몇 년간 이렇게 고생해서 우리 나름대로 Data Science 교육용 커리큘럼을 체계화할 때까지는 시간이 좀 걸리겠지.

최소한, MSc AI/DS쪽 공부를 하면서, 국내에서 우리보다 더 고급 수학을 "자유자재로" 활용하는 교육 과정을 찾기는 어려울 것이다.

이건 이미 국내 몇몇 명문대 교수로 있는 지인들의 한탄섞인 자조를 한 두 번 들어본 게 아니기 때문에, 확신을 갖고 말할 수 있다.

아마 저 위의 고급 수학이 쓰였다는 논문에 쓰인 수학 주제 자체를 위의 S대 공대 박사 분 정도로 구분해내는 국내 연구자도 거의 없을 것이다.

국내 공대에 있는 인력(교수, 박사, 석사 등등) 전부를 통틀어서 100명, 아니 50명만 나와도 기적이라고 생각한다.

저 위의 5개 주제 전체를 나같은 글로벌 시장 쩌리만큼이라도 강의할 수 있는 국내 "공대" 교수 10명 데리고 올 수 있으면 군말없이 큰 절 해 줄 수 있다. 절 할 일이 없을 것이다.

한국인 입장에서 받아들이기 비참하지만, 그게 한국의 인력 수준이고, 글로벌 시장 학문적 지위더라.

그런데, 위에 쓰신대로 분야에 상관없이 "해외 선도적인 연구"에서는 저런 수학을 쓰는게 너무 당연하다.

내가 2개 전공을 공부하면서 보기도 했고, SIAM이라는 수학 학회에 논문 하나 발표하다가 타 전공 연구자들의 결과물을 보면서도 느꼈던 사항이기도 하다.

저런 "기본적인" 수학 도구를 모르면, 그 리그에서 대화 자체가 안 된다.

그러니까 국내 연구진이 글로벌 시장에서 2류, 3류 취급받고, 쩌리급 SCI급 저널에도 못 내서 국내용 K-SCI나 만들어서 자위(?)하고 있을 수 밖에.

우리 MSc 교육 레벨은, 딱 이렇게 Global 수준의 연구인력을 키워내는 곳이다.

(이정도 레벨의 연구 인력이 되는게 목표가 아니라면 무리하지 말고 MBA in AI/BigData -> DBA in AI/BigData 하자 응?)

기본도 모르는 국내 대학 졸업생들

MBA in AI/BigData 학위 초반부 수업 중 하나에 회귀분석의 가장 기초인 Gauss-Markov 가정 5개를 설명했던 날의 일이다.

어차피 머신러닝, 딥러닝, 인공지능 용어만 화려하게 써 놨지, 사실은 회귀분석이라는 기초를 모르면 코드 복붙해서 사기치는 개발자 수준 밖에 안 되는, 그래서 GM 5개 가정 (A1 ~ A5)은 정말 필수 중에 필수인데, 자기네 회사에 "명문대 데이터 사이언스 석사" 출신인 분이 A1 ~ A5를 하나도 모르고, 변명이라고 하는 꼴이,

머신러닝 공부하느라 회귀분석은 까먹었다. 몰라도 상관없지 않나?

란다더라. 저 의견에 동의하는 까막눈 공돌이들이 많겠지만, 적어도 내 눈엔

밥 하는데 집중하느라 쌀을 안 샀다. 햇X 데워주면 되지 않나?

같은 표현과 동치로 보인다.

밥 하는데 집중하느라 쌀을 안 사는건 뭐지? 그냥 밥솥만 사 놓으면 흙을 넣어도 밥이 되나?

현미보리밥 같은 신경 쓴 밥도 아니고, 백보 양보해서 단순 흰 쌀밥도 아니고, 햇X 내놓는 식당 밥을 프리미엄 얹어 주고 사드실 분 있나?

근데 '프리미엄이 붙은' 명문대 데이터 사이언스 석사 출신이라고? 그래서 다른 인력보다 연봉이 높다고?

한국은 자칭 IT강국, 인재들 갈아넣어서 전세계 10대 경제 대국 아니었나? 인재가 엄청 많은 나라 아님? ㅋㅋ

저 의견에 동의하는 구간은, 정말로 회귀분석이 그다지 필요하지 않은 데이터들, 즉 자연어, 이미지 같은 패턴이 항상 정해져 있는 데이터 셋에서 "동일(at least 유사) 정보값" 매칭하는 작업 밖에 없다. (ex. 챗봇) 개념 이해를 바탕으로 추상화 모델링을 하는게 아니라, 단순 공식을 찾는 공돌이들이 좋아하는 A -> B 매칭이 적용되는 구간은 "항상 정해져" 있거든. 나머지 모든 heavy noise 데이터에서는 데이터 전처리 작업에만도 Gauss-Markov가 깨지는 상황들이 헤아릴 수 없이 벌어진다.

Noise도 별로 없는 벽돌깨기 게임 문제 푼다고 쓴, 인공지능 마니악 CS 전공자들이 그렇게 좋아하는 Reinforcement Learning 중에 Experience Replay 한번 봐봐라. Dynamic optimization, MCMC, Gibbs sampling, Change of measure, Time Series, ARMA, Endogeneity 같은 주제를 다 알아야 제대로 쓸 수 있는 모델인데, 이런 지식은 회귀분석을 기초 상식으로 깔고 가르치는 내용들이다. Noise가 더 많으면, 더 다양해지면, Endogeneity도 단순히 공식 대입하듯이 풀 수 있는 것도 아니고.

어떤 데이터, 어떤 목적에 어떤 방법론을 어떤 방식으로 적용해야하는지 제대로 이해 못하는 인재를 길러내는 학교가, 기본도 모르는 대학 졸업생들이 어떻게 교육이 됐다고 할 수 있겠나? 그런데 틀린 걸 가르쳐줘도 끝까지 맞다고 우기고 그걸로 세금, 투자금 같은 아까운 돈을 낭비하고 있으니 도대체 얼마나 모르면, 얼마나 엉망으로 가르쳤길래 애들이 저렇게 고집불통이 되나는 생각을 할 수 밖에.