②SIAI는 수학&통계학 기반 AI/Data Science 대학원

MSc AI/DS 입학시험 후기

Estimated reading: 1 minute 23 views
160X600_GIAI_AIDSNote

아래는 MSc AI/DS 입학시험으로 이름이 변경될 예정인 오픈 강좌를 듣고 시험을 치른 분의 강의 후기다.

시험 문제 및 강의 후기 일부는 다른 글에 남겨놨으니 참고하시기 바란다.

자세한 개인 사정을 알지는 못하지만, 수학 쪽 전공자인 것 같고, 국내 어지간한 학부 출신과는 달리 수학으로 교육 수준이 탄탄한 분,

현재 업무는 외국계 보험사에서 수학 기반의 논리구조를 활용하는 업무를 하는 분으로 보인다.

가끔 회사 블로그 글이 외부에 돌 때마다 MBA 따위는 제쳐놓고 MSc 입학 따윈 껌으로 할 수 있다고 착각하는 메세지를 보내는 분들에게,

당신이 과연 이 분보다 훨씬 더 뛰어난 능력자인가는 질문을 던지고 싶다.


안녕하세요! 시험후기(+학습후기) 남기러 왔습니다.

다들 시험 치시느라 고생 많으셨고

또 이번 시험 준비하신 대표님과 조교님들도 고생 많으셨습니다.

원래는 시험 이주 전부터 미리 얘기해서 휴가를 이틀 내놓고 답안을 어느정도 준비해서 시험에 들어갈 생각이었는데,

휴가는 무슨 매일 야근하는 바람에 제대로 대비하지 못하고 들어가서 아쉬움이 있네요.

보통 저는 이런 종류의 시험 칠 때 일단 개념정리를 하고 기출문제를 싸그리 외우고 나의 언어로 바꿔서 모범답안을 만든다음 세번정도 필사하고

시험에서 비슷하게 나오면 바로 쓸 수 있게 키워드별로 정리를 해서 단권화를 해야되는데

개념정리도 다 못끝내고 들어갔네요

그런 기분이 들었어요 다들 많이 준비를 해주셨을텐데… 성의표시도 못한거 아닌가 괴로웠네요

심지어 대표님 말씀대로 예전보다 훨씬 쉽게 나왔잖아요……… 정말 말씀대로 풀이를 전부 외워버리기만 했어도 됐을텐데(?)

그 부분에서 좀 죄송스러운 부분은 있지만, 진짜 야근하고 집에와서 2시까지 공부하고 다음날 6시 반에 일어나고…

점수나 결과에 후회는 없네요 ㅎㅎ

다만 공부하면서 후회가 되었던 점들을 모아 수강생의 입장에서 후기를 써봅니다.

특히 다음에 시험 응시하시는 직장인분께(저처럼 시즌이 있거나, 야근을 자주하셔야하는) 도움이 되었음 좋겠네요

시험문제를 보면 알 수 있듯 이 시험은 고시처럼 해야됩니다 ㅎㅎ

관련지식이 머릿속에 온전하게 정리되어 있어야 하고 단련이 되어서 툭 건드리면 바로 나와야 됩니다.

회계사나 세무사처럼 실무적인 내용을 실무를 한 번도 안해봤더라도

학원을 통해서 머릿속에 다 집어 넣고 단련을 시키잖아요 시험 볼 때는 실무 마스터 한 사람처럼

답안지를 쓰게끔… 그런거랑 비슷한거같아요 사실 실무를 하면 금방 들어오는 지식일수도 있는데 말이죠

(MBA 과정 수강생들이 수업시간에 지속적으로 관련 내용으로 자극을 받아 월등히 빠르지 않을까 싶네요)

어쨌든 그래야 고민을 많이 하고 쓸만한 문제들을 접근할 수 있을 거 같네요 (예컨대 2-7, 2-8)

저같은경우에 업무를 하며 고민을 했던게

Classic credibility 를 써서 freq(q)를 추정할 때 공식화되서 정리가 되어있고, 그냥 가져다가 쓰는 경우가 많은데

Derivation을 잘 따라가보면 q의 분포를 포아송으로 가정하고 출발하는데 q가 인간의 사망사건이랄지 를 다루면 q 값이 작을테니

포아송이 적절한데, 이게 너무 빈번한 q를 추정한다고 하면 안되겠죠 그러면 기존 방식대로의 산출1 / 보고자의 의견이 반영된 다른 최선의 대안 1,2해서

올리고 의사결정 받아야될거같은거죠… (제가 여기 지원을 맘먹었던 이유도 저 지식을 제가 알기에 생각할 수 있는거지, 몰랐으면 생각 못했을테니까요.

지금 업무하면서 저렇게 스쳐지나가는 것들이 너무 많을 것 같아서였죠)

저야 하루종일 저런 고민을 하며 살지만 저걸 통계학과 보험통계전공시험으로 턱 하고 던지면 다들 풀어도 꽤 오래 걸릴 거 같거든요

저런 것처럼, 이쪽 사이드(계량경제)에서 주요하게 다루는 영역들이 분명히 있을거고(내생성 등)

그런 고민을 많이 해보신 분이라면 즐겁게 시험준비하실 수 있으실 거 같습니다.

(사실 Causality, IV, 2SLS 등등 여기저기 선배, 친구들 물어봤는데 수학과, 통계학과, 그리고 자주 언급되는 그 계산과학과에서

답변을 준 사람은 없었고 대전 K대 경영공학과에서 경제트랙 전공한 친구(학부는 통계/경제)는 바로 나오더라구요 계량경제 백그라운드 있으시면 금방이실거같네요)

시험에도 왠지 느낌에 Assumption을 묻는 문제가 나올거라 생각했는데 그냥 Assumption이 뭐냐가 수학적 Definition을 물어보는건 아닐거고

수리적으로는 어떤어떤 이유로 이렇게 가정이 들어왔는데 현실에서는 당연히 저 가정을 만족할수는 없고, 그 어떤 어떤 이유때문에 어떻게 문제가 생길거다

까지 어떤 모델을 만들기 위해 필요한 수리적 가정과 그 이유 그리고 현실과 이으면서 그 이유와 맞닿는 가정의 모순을 딱 찾아야 될건데 말입니다.(계량경제 책을 보려고 했었던 이유죠)

근데 … 못찾았어요 ㅋㅋ 그리고 첫문제를 받았을 때 역시.. 묻는 가정이 GM가정일까? 아니면 현실적인 가정일까?를 고민했지만 저는 Fail…

Anyway,

개념정리를 모델을 만드는 순서에 맞춰 정리하시는걸 추천드립니다.

가설 설정(문제인식) – Sampling – EDA – Modeling – Monitoring&Assumption Review

가설 설정에서는 어떤 상황이 던져질거고, 어떤 이슈가 있을 수 있는지

(뭐랑 뭐가 어떤 관계가 있을 것 같다, Sign은 뭘로 예상된다 같은거)

Sampling은 어떻게 해야 될지

(Sampling Bias 유형 정리 한 번 하고(연구자의 편향이랄지, 자가선택이랄지)

Sampling Bias가 생기지 않도록(Random Sampling이 되도록)하는 방법들

뭐 언급하지는 않으셨지만 층화추출이랄지, 특정한 상황에서 어떻게 왜 해야되는지를

표본론 책 보고 정리하면 좋을 거 같습니다 층화추출같은걸 시험에 내지는 않으시겠지만, 직관을 얻을 수 있을거라고 생각해요 층화추출이 뭔지는 몰라도 랜덤표본이 중요하고 랜덤표본을 만들기 위해서 이런 저런 행동들을 하니 같은 방법론을 시험문제에도 적용할 수 있을거라고 기대합니다.)

EDA? 라고까지 하기는 그렇지만

얼추 데이터를 스윽 보고 뒤에 세부적으로 뭘 해야할지 결정하는 단계에서 어떤 이슈가 있을 지

(예컨대 simple linear 해봤더니 sign이 가설설정 단계와 다르게 이상하네? OVB 있을까? 랄지

등분산성 가정이 위험하다던지

트랜스폼이 필요하겠다던지

어떤 종류의 문제가 있어 어떻게 Bias를 야기할 수 있겠다던지

Partial Effect를 보는게 가능할지 등등)

그리고 Modeling 할 때

모델 어떻게 만들지,

어떻게 validation 할 지(위에서 언급한것과 연계해서 Bias가 있으면 어떻게 처리를 할건지)

F-test를 한다던가, 우리 모델을 만드는 목적이 Interpretation이라면 어떻게 할거고 뭐 Prediction이면 어떻게 할거고 등등)

그래서 모델을 만들었는데, 상황이 바뀌면??

가정이 어떻게 바뀌기 때문에 어떻게 대응해야된다 랄지,

상황이 바뀌어도(무의미하게 데이터 개수만 늘었다거나) 우리 모델은 괜찮다 랄지

아니면 모델의 한계도 생각해보면 좋을 거 같습니다.

제가 고민하던 것 중 하나는 Partial Effect를 보는게 불가능할 때 예컨대 X1과 X2 중 X2를 고정시켜놓고 X1만 조정하는게 불가능하더라

이러면 모델이 어떻게 될거고 어떻게 대응해야되나 이런거였네요 왠지 시험에 나올 거 같았거든요

이렇게 한 번 쭉 정리한 다음에 문제풀이 처음부터 쭉 들으면서 정리해둔 개념 밑에 예시로 하나씩 추가하면 좋을 거 같습니다.

Causality, IV, 2SLS… 는 제가 끝까지 이해를 못했기 때문에 ㅎㅎ;; 얘는 어떻게 해야될지 모르겠네요 저는 수박 겉핥기는 커녕 이게 수박인지도 모르겠어요

얘네는 따로 공부를 하셔야 하지 않나 싶습니다… 강의내용과는 상당히 괴리감이 있어요

여기에 블로그를 통해서 자주 나왔던 주제들 한번씩 정리하시고 따로 조교님들이 정리해주는 개념정리하면 될 거 같네요

그리고 문제풀이까지 3회독하시면

얼추 1시간 내로 유사한문제를 해결하고 남은 1시간동안 찬찬히 고민하며 고득점 문제를 풀 수 있을 것 같습니다.

그리고 문제의 동사를 잘 보시는게 좋을 것 같습니다.

Prove that이나 show that 이 아니라 Demonstrate that이면, 수리적으로 보이는데에서 끝나는게 아니고 무언가 더 있다는 건데

한국어로만 공부하면 모를수 있는 부분인 것 같아요.(근데 이런거는 미국애들도 놓치니 뭐…)

새벽 세시반이네요… 전 오늘도 야근했거든요 ㅋㅋ 다들 정말 고생 많으셨습니다. 다음에 보시는 분들은 더 잘보셨으면 좋겠어요!

끝으로, 직장을 다니면서 이 빡빡한 공부스케쥴을 소화하시는 분들(기혼자,,,, 육아,,, 거기에 TA까지 하시는 분들은…) 진심으로 멋지십니다.

화이팅입니다! 감사합니다!


 

공유를 하고 싶은 이야기가 있어서 글을 남깁니다.

저는 정말 우연찮게 운이 너무 좋아서 고등학교 때 정부에서 시행하는 영재교육을 받은 적이 있고, 그 때 너무 큰 충격을 받았어요 보통 그때까지 학교에서는 왜? 라고 질문하면 안됐거든요 왜?를 묻는건 수업시간을 길어지게 만들고, 진도를 밀리게 하는 나쁜학생이였지요. 그런데 영재교육을 받는 곳에서는 왜?라고 묻지 않으면 부족한 학생이에요 영재가 아닌거죠(왜?라고 물어도 스스로 대답 가능한 경우 제외죠 ㅎ). 그 교육을 받으면서 저는 억눌려있던 ‘왜?’가 폭발했고, 우수한 성적으로 영재교육을 수료할 수 있었어요. 그 때 한국 학교는 뭔가 크게 잘못되어있다고 생각하게 되어 과감히 내신을 다 버리고 일어 독학해가면서 일본원서보고, 일반물리 일반화학 미국 교재 따로 공부해가며 한일공동이공계학부 국비장학생에 합격을 하게 되었어요.(하지만 여러 사정으로 한국대학에 진학하게 되었습니다.)

이 때 비록 책을 통해서지만, 일본의 교육과 미국의 교육을 모두 접하게 되면서 국내 교육의 부족한점을 너무나도 절실히 느꼈어요. 일본과 비교해보면 일본은 어떻게 지식을 정리해서 머릿속에 넣어줄지에 대해 굉장히 많은 고민을 한 것을 엿볼 수 있고(그래서 교육자의 철학이 그대로 드러나는 경우가 많습니다. 출판사, 저자마다 내용을 다 다르게 설명해요. 획일적으로 공식 툭툭 던지고 기출문제 숫자만 바꾼 한국 교재와는 차원이 다르죠. 아직도 기억에 남는 표현이 ‘극한은 끌어모으는 감각’이라는 표현이에요), 미국의 경우 풍부한 사례와 여러번의 돌려말하기를 통해 사물에 대한 이해, 성찰을 중요시 하더라구요.(아마 미국은 플라톤이나 소크라테스의 영향을 많이 받은 것 같아요. 육면체의 모든 면을 최대한 보여주면서 idea 그 자체를 이해시키려는 것 같기도 하고 변증법을 통해 이해를 높이려는 것 같기도 하네요).

저는 너무 공부가 하고싶었지만 여러 사정으로 양질의 교육을 받기는 어려웠었기에 꼭 나중에 어떤식으로든지 양질의 교육을 제공하는 것에 기여하겠다는 꿈(?)이 있었습니다. 나중에 저 같은 학생이 가정형편이든, 출신지이든, 출신학교든 구애받지 않고 능력이 있거나, 열정이 있으면 양질의 교육을 받을 수 있었으면 했거든요. 그렇게 대학에 가서 하라는 공부는 안하고… ^^;; 교육사업을 하게 되었습니다.

그런데 Business와 저의 이상은 굉장한 갭이 있었어요. 아직도 기억에 남는게 유명한 커뮤니티에 올라온 후기가 기억나는게 ‘문제를 풀면서 모르고 있었던 오개념이 정리가 되고 확실한 깨달음이 있었던 좋은 문제였다. 하지만 결국 수능엔 안나올듯. 계륵’ 이라는 피드백을 받고 현타를 세게 느꼈습니다 현실과 타협하여 교재를 제작하고 유명해졌지만 결국 현타를 극복하지 못했어요.

그래서 다시 학교로 돌아와 학업에 매진했어요. 근데 이 때도 ‘왜’를 버리지 못하고 수학 외에도 통계학, 경제학, 경영학, 법학, 철학 타 전공수업을 듣고(처음 선택한 타전공과목이 수리경제학이었는데 이 때 받았던 충격이 여기 문제를 처음 받았을 때랑 똑같아요 ㅋㅋ), 미국 Actuary 자격을 공부하게 되었어요. 그러면서 한 번 더 충격을 받게 됩니다. 미국이 고등학교와는 완전 다른게 대학 이후부터는 논증은 기본이고 거기에 커뮤니케이션까지 요구하더라구요. 수학 통계학 법학 공부했는데 논증은 좀 괜찮지 않겠어? 했는데 아주 탈탈 털렸어요. 논증 + 실생활적용 + 커뮤니케이션(+Formal English)을 요구하더라구요.

예컨대 Predictive Analytics 시험에서는 데이터 하나 주고 6시간정도 되는 시간동안 분석 잘 해서 보고서를 내야하는데 채점기준에 Communication Manner가 들어갑니다. 논리적 분석은 당연한거고 Consultant의 입장에서 전문적인 지식이 없는 고객을 이해시킬수 있도록 쉬우면서도 정중하게 메일로 Report를 써야 Pass를 줍니다. 그 당시에는 이렇게까지…? 라고 생각했는데 회사 와서 보니 본사에 있는 친구들은 정말 그렇게 소통을 하고 있더라구요..(기회가 되면 이런 부분도 많이 강조해주시면 좋을 것 같아요. Interpretation이 얼마나 중요한지… 어떻게 비전문가들과 커뮤니케이션해야하는지…)

아직도 미련이 남았는지 그래서 어떻게 내가 저걸 더 잘할 수 있을까(사실 저 시험에서 Pass를 받기는 했지만 운이 좋았던 것 같아요)를 고민하고 또 그리고 배우고 난 다음엔 어떻게 또 다음 세대에 저런 교육을 전해줄 수 있을까를 많이 고민하고 있었어요(잘 준비해서 나중에 시간강사를 뛰어야 할지, 협회 강사를 해야할지…) 그러던 와중에 학교 게시판에 올라온 글을 통해 이곳을 알게 되었고, 저와 비슷한 고민을 많이 하셨던 것 같아서 또 공감이 되어서 꼭 한 번 Try 해보고 싶었습니다. 그리고 역시나 문제들에서 단어 하나하나까지 고민 많이 하셨던 흔적이 묻어나더라구요(Prove that Show that Demonstrate that… 다 제가 틀려보고 몸으로 겪은거죠… ^^;;).

비록 고등학생 대상으로 저도 한 번 시도해봤지만 이 일이 아주 힘들기도 하고 또 어떻게 보면 이상을 실현하는 정말 대단한 일이잖아요. 편하게 돈 버는 것을 포기하고 후세대를 위한 희생(?) 일수도 있고 알아주는 사람도 별로 없는데다가 정말 계란으로 바위치기 ㅎㅎ… 현실과 타협하고 그냥 취업을 해버린 입장에서, 또 양질의 교육을 제공하려고 시도 해봤던 입장에서 봤을 때 학생들에게 많은 기회를 주시는 부분(특히 재정적인 부분까지), 그리고 학습에는 엄격한 부분을 보면서 이상을 현실화하기 위해 굉장히 노력하시는구나 싶었습니다.

사실 저는 공부하던 중간에 바로 MBA로 지원하고 싶었는데… 그래도 지원한 이상 열심히 시험 쳐봐야 하는게 맞지 않겠냐는 조교님의 말에 아차 실수했다 싶어(반성합니다…) 최선을 다 했습니다. 도중에 MBA로 안 바꾸고 끝까지 최선을 다 해 완주하는게 정말 많은 고민을 하고 준비하신 그 노력에 대한 저의 나름대로의 Respect 이었어요 ㅎㅎ

구글링을 해봐도 응원하는 글은 없더라구요. 며칠 전에 찾아보니 왜 Pabii 운영자는 항상 화가 나 있는지 모르겠다는 글이 있던데 음… 회사에서 일을 열심히하는 사람을 찾을려면 화가 나 있는 사람을 찾으면 된다는 말이 있지요!! 홀로(이런 형태의 교육이 국내 유일하니까) 고독한 싸움을 하고 계실수도 있을 거 같은데 저 포함 비슷한 고민을 하셨던 분들은 다들 공감하고 계실거고, 뒤에서 묵묵히 응원하고 있을거라는 것을 말씀드리고 싶었어요. 그 당시 저는 그런거 뭐하러 하냐, 왜 하냐 등등 주변의 목소리에 너무 스트레스를 받았거든요. 마음이 너무 지쳤었어요.

지금 되돌아보면 저에게 필요했던 말들은 힘든 길이지만 옳은 방향으로 가고 있다. 응원한다. 세상을 더 나은 방향으로 바꾸기 위한 노력을 하는구나. 이런 응원이 필요했던 것 같아요. 정말 힘든 일이었을텐데 양질의 교육을 제공하려고 해주셔서 너무 감사드리고, 이곳에서부터 시작해서 우리나라에 많은 변화가 있었으면 좋겠습니다(이미 시작되었는지도 모르죠!). 꼭 데이터 분석이나 이런 부분이 아니더라도, 블로그를 통해 논리적 사고의 중요성, 논리적 커뮤니케이션의 중요성만이라도 잘 전달된다면 후세에 큰 변화가 있지 않을까요?


내 고민을 이미 다 이해해주신 분의 글이라 토를 달 생각은 없고,

Prove, Show, Demonstrate that 같은 구분이 사소한 차이지만 눈에 들어왔다니 참 고맙고,

특히 우리 학생들이 Prove, Show보다 Demonstrate that으로 된 문제들을 잘 풀어냈으면 하는 기대가 있다.

또, CPA 같은 시험 준비할 때 학원 교육 방식이 실무 마스터 한 사람들처럼 상황 별 대응을 다 할 수 있도록 해주는 것과 유사한 방식으로,

회사에서 일을 할 때 벌어질 수 있는 상황에 적절한 대응을 고민하도록 문제를 만들었다는걸 바로 감 잡아주시는 부분도 고맙다.

 

어떻게 외부 관계자들에게 보여주고 설득시킬 것이냐에 대한 고민들도 BUS501, 502, 503 수업들에 다 포함되어 있는데,

미국 Actuary 시험에도 나왔던 부분이라며 교육 프로그램 안에 넣어달라고 하는 부분에서도

우리 교육을 제대로 따라오기만 한다면, 뛰어난 Data Scientist가 될 것이라는 내 기대치를 어느 정도 확인해주는 것 같다.

 

몇몇 통계 전공자들이 학부 계량경제학 수준 밖에 안 된다고 비아냥거리는 걸 많이 보는데,

장담컨대 인생 걸고 제대로 공부한다는 마음으로 도전하지 않으면 좋은 점수 받아가며 공부하긴 어려울 것이다.

그런 간단한(?) 지식을 잘 엮어서 “실제 현실에 응용”하는 교육이 통계학이 아니라 Data Science 교육이어야 한다고 생각하고,

돌이켜보면 난 수학 증명을 잘 하거나, 새로운 학문의 영역을 개척하는 것보다, 이렇게 응용력을 키우는 교육에 강점이 있는 인간이었던 것 같다.

그랬으니 Best TA of the Year 상을 2번이나 받았던 거겠지. 내 강점을 살리는 컨텐츠로 세상에 조금이나마 기여할 수 있다는게 참 다행이다.

 

이런 교육을 시키는 곳이 한국인에게 열린 곳은 우리 SIAI 밖에 없긴 하지만, 꼭 우리를 거치지 않더라도 다른 해외 교육기관을 통해서라도

SIAI에서 강조하는 교육, 즉 글로벌 시장 최상위 클래스의 Theory – Practice 밸런스 교육을 받으면서 성장하길 바란다.

다들 그렇게 좋은 교육을 받아서 우리나라 현업 수준을 한 단계 끌어올려주시면 좋겠다.

Share this Doc

MSc AI/DS 입학시험 후기

Or copy link

CONTENTS