입력
수정
SIAI 한국 운영을 지난해부터 단계적으로 접으면서 그간 알게 된 많은 내용들을 유럽 애들과 공유하는 중인데, 괜찮은 분석 하나가 나와서 한국에서도 좀 읽어봤으면 해서 GIAI Korea에도 링크를 걸었다.
핵심 포인트는 수학 실력이라는 기준점이,
- 아시아: 절차적 유창성 (Procedural fluency)
- 서구권: 개념적 이해력 (Conceptual understanding)
에 달려있다는 것이다.
때문에 아시아에서는 계산 속도가 빠르고 정확한 사람, 시험 문제를 빠르게 잘 푸는 사람이 수학 실력이 뛰어나다고 생각한다. 나 역시 그런 줄 알고 대학을 갔었다.
그런데, 서구에서는, 최소한 대학 이상의 교육 과정에서는 위의 두 능력이 크게 도움이 안 된다. 석·박 시절 교수님들은 개념적 이해력이 탄탄하게 갖춰진 논리를 들고오면 반가워했어도, 시험을 잘 치는 것에 대해서는 둔감한 편이었다. 특히 그 시험 문제가 2류 직장들 취업 전용으로 만든 석사 수업 수준의 문제일 경우에는 더더욱 시험 점수에 관심을 두질 않았다.
위의 글에서 David이 갖고 온 세 가지 '수학 능력자'의 타입을 구분하면
- 계산기
- 문제 풀이 전문가
- 사고력 훈련
인데, 위의 2개 타입이 아시아 타입이고, 높은 확률로 몇 년 안에 AI로 다 대체될 것이라고 주장해놨다. 이미 1번은 사실상 자동화 알고리즘에 대체된 상태고, 2번은 아직 썩 맘에 들진 않지만 어느 정도 진행 단계에 있다는데는 공감한다. (단, 3번째도 앞으로 5년 후에는 그만큼 도전적인 전망을 내놓을 수 있을지는 잘 모르겠다.)
SIAI에 관심을 보이는 한국 학생들이 하나 같이 자기들은 MSc AI/Data Science 아니면 절대로 안 가고, MBA AI 혹은 PreMSc로 이름 붙인 학부 과정은 갈 필요가 없다고 생각하면서 수학 공부를 열심히 하면 언젠가는 MSc를 뚫을 수 있을거라고 생각하는 경우들을 굉장히 많이 봤었다. 반대로, SIAI 재학생들은 하나같이 밖에서 시간 버리지 말고 빨리 들어와서 두들겨 맞는 편이 낫다고 반박했던 것도, 우리나라 교육 과정의 교육이 1번, 2번 능력에만 초점을 맞추지, 3번 능력에는 초점을 맞추지 않기 때문이라는 인식을 막연하게나마 가졌기 떄문일 것이다. 수업 들어보니 바로 깨달았겠지.
수학을 철학, 논리학의 관점에서 이해하면 유럽 중·고교, 학부 2-3학년과, 석사, 박사 과정이 한국식 '수학 지식'이 아니라 '내공'을 갖췄느냐 여부에 따라 성적이 결판나는 것도 공감할 수 있을 것이다. 재수, 삼수를 해도 성적이 안 바뀌는 것도 마찬가지고.
SIAI Korea로 봤던 한국 교육의 문제
David이 한국 사례 이야길 듣고 윗 글에 2가지 예시를 들어놨는데, 시계열 데이터면 무조건 RNN을 쓰면 된다, RNN의 파라미터만 잘 맞추면 된다고 생각하는 '개발자 출신'들의 사고 방식이 틀렸고, 발산하는 데이터 인지 여부, 반복성이 얼마나 강하게 나타날 수 있는지 여부에 따라 RNN를 쓸 수 있는지, 어떻게 쓸 수 있는지를 논리적으로 추측할 수 있는 사례를 볼 수 있을 것이다. 우리 학생 중 하나가 국내 컨설팅 회사 보고서 같은 걸 논문 Draft로 갖고 왔길래 발표를 중단시켜버렸던 사건이 배경이다.
분명히 Deep Learning 수업에서 NN 모델들이, 특히 RNN 모델들이 적용 가능한 데이터 구조를 NN 모델의 설계 방식 상, 결국은 Regression 여러개가 Tree로 뭉쳐졌고, 각 Layer별로 MCMC 스타일 업데이팅이 돌아가는 구조가 있는 만큼, 각각의 모델들이 가진 장점과 단점이 모두 다 들어가 있는 배경을 설명했었는데, 그 지식이 자기 논문에 적용이 안 됐던 것이다. 됐었으면 'RNN을 쓰겠다', '라이브러리를 찾아야 한다'고 국내 개발자 출신들처럼 생각하지 않고, 다른 SIAI 학생들처럼 데이터 구조를 뜯어 고치는데서 오랜시간 헤매고 있었을 것이다. 저 학생은 그래도 데이터에 뭔가 작업을 해야한다는 건 어렴풋이 깨달았는지, 그간 배운 시계열 데이터 전처리 관련 작업들을 한참해놨던걸 수십 장의 슬라이드로 설명했는데, 내가 발표를 멈추고 나니 전직 IT컨설팅 조직 출신 학생 하나가 '(온라인이라) 얼굴을 못 봐도 대표님이 계속 참으시는게 상상이 됐다'고 농담을 던지기도 했다.
나머지 1개 사례는 회사 크기, 산업, 사정에 따라 계산 모델이 어떻게 달라지는지 간단한 예시인데, 우리 SIAI 학생들 눈에는 IV를 왜 바꿔야 되는지 쉽게 납득이 되겠지만, 아마 밖에서 이런 훈련을 안 받았으면 왜 딥러닝 코드만 붙이면 되지, IV같은 저런 이상한(?) 지식을 배워야 하냐고 생각할 것이다. '인공지능 교과서'나 '라이브러리'에 없는 내용이니까. 유럽에서도 그런 '개발자 출신'들을 본 적이 있었는지 내 불만에 공감을 하던데, 이번에 스위스에서 수학 박사 출신 2명을 교수진으로 영입하자는 결론을 얻는 회의에서도 같은 이야기가 언급됐었다.
내가 만든 교육 프로그램의 가치를 한국 시장이 이해 못하고, 국내 기업들이 '시민 데이터 과학자(Citizen Data Scientist)'만 많이 만들면 '데이터 과학 전문 기업'이 된다고 굳이 믿는 것도 위의 인식 격차가 원인일 것이라고 본다. 특히 국내 경영학과, 공대는 3번 훈련을 아예 안 받는 것 같더라. 그 분들이 만들고 있는 한국 기업 문화, AI 시장 문화가 그렇게 흘러가는 것은 당연한 귀결인 것 같다.

SIAI 2.0 for Research platform & Networking platform
지난 출장에서 정리됐던대로 SIAI 2.0으로 부를만한 내부 혁신이 적용되는 중인데, 유럽 팀 애들이 학위 과정 가격을 큰 폭으로 인상했다. 단순히 교육만 하는게 아니라, 연구와 네트워킹도 추가하는만큼 가격을 정상화하자던 생각이 반영된 것이다. 앞으로 Accreditation에 추가 작업이 더 되면 몇 년간 단계적으로 가격이 인상될 것이다.
내 손을 떠난 상황인데, 한편으로 보면 아쉽고, 다른 한편으로 보면 이게 맞았는데 너무 한국 학생들 챙기는 것만 생각해서 조직에 피해를 줬다 싶어서 미안한 생각도 든다.
이번에 요청 받은대로 연구 프로젝트들을 만드는 중인데, 예전에 Multi-touch Attribution이라는 아이디어로 다뤘던 Shapley value를 Multi-stage로 업그레이드하고, LLM 방식으로 이메일/채팅 데이터들을 처리해서 기업 인사팀의 보너스 배분 시스템을 만들어 볼까 한다. Single stage가 아니라 Multi-stage로 된 Tree 형태의 데이터를 만들면, 2~3개 layer 뒤에나 결과가 나타나는 기여도, 남들에게 '버프'를 잘 주는 사람들의 진짜 기여도 같은 값들을 Regression 모델들보다 더 세련되게 처리할 수 있는 시스템이 나온다. Flow data는 아무래도 Tree 형태의 Network 가 더 적합하기 때문이다.
이미 BUS 수업들에서 조별 발표 과제 기여도를 Shapley Value로 계산하는 맛보기 작업을 해 본 SIAI 학생들은 좀 더 낯익을 것이다. 올 가을엔 수업 별로 Forum discussion에 기여도를 유사한 방식으로 계산해서 기말 성적에 산입하는 시스템을 도입해서 온라인 교육 시스템의 한계를 보완하려는 시도도 있는다. 즉, 위에 제시한 고급 저 프로젝트는 지난 몇 년간 SIAI가 교육 시스템을 'AI/Data Science 대학'이라는 타이틀에 맞게 업그레이드 해 온 작은 도전들의 집대성이라고 보면 될 것 같다.
게임이론이나 네트워크 이론 같은 지식도 필요하고, 자연어처리(NLP) 관련 지식도 좀 있어야 되고, Tree형태로 된 Sequence 데이터를 처리해야되니 머신러닝, 딥러닝, 강화학습 같은 기초적인 계산과학 모델들 지식도 다 필요해 보인다. 데이터 전처리 때문에 어쩔 수 없이 시계열이나 도구변수(IV) 같은 지식과 더불어, '사람-시간'에 더해 '직군' 같은 3번째 차원이 더 들어가야 되니 그룹 간의 동질성/이질성을 나누는 패널 데이터 지식도 요긴하게 쓰일 것이다.
이걸 우리는 실용성이 높은 (고급) '기술'을 기업에 팔기 위해 만든다고 접근하는 중인데, 국내 기업들에서 '기술'을 보셨던 분들은 이걸 학자들 연구지, 기업에서 쓰는건 아니라고 생각할 수도 있겠다 싶다.
우리도 한국 같은 시장에서야 큰 기대가 없지만, 미국이나 유럽에선 HR 컨설팅 회사들 쪽에서 수요가 있을 것 같다고 해서, 그 친구들 네트워크만 믿고 한번 공들여 만들어 볼 계획이다.
이번 2025-2026 입학 시즌 끝날 때까지 프로젝트 주제 3개 뽑아서 공지하는게 내가 할 일인데, 내년 가을까지 다 끝내는 게 목표다. 앞으로 매년 이런 식으로 수익성이 있을만한 연구 프로젝트들을 미리 뽑고, 준비된 학생들이 오면 계획했던대로 연구 프로젝트에 RA로 데려다가 데이터 전처리부터 이런저런 Toy 모델 작업들을 부탁할 예정이다.
(다음 프로젝트는 백종원씨 논란을 보면서 - 댓글부대 여론조작단, 음해공격을 잡아내는 연구 프로젝트의 필요성 - SIAI / SIAI Korea - GIAI Square -> 이걸 생각하고 있는데, 예전에 만들었던 여론 추적 대시보드, 댓글 조작단 추적 서비스 등을 출발점으로 삼아, 역시 그간 해 왔던 작은 도전을 하나로 뭉치면서 수학 모델링을 좀 해봐야 될 것 같다)
위와 더불어, 실리콘 밸리의 주요 AI 관련 기업 관계자와 런던의 금융권(City, Mayfair) 관계자들을 Guest lecturer로 섭외하는 중인데, 학기 시작 전 오리엔테이션을 포함해, 4개월마다 한번씩 Zurich에서 Meet-up을 총 4~5번 정도 하는 계획이 있는데, 걔네들이 알아서 잘 하겠지?
Beyond Korea
끝으로, 이번 글로 SIAI 관련된 한국어 공지나 기고는 접는다. David의 분석에서 언급된대로, SIAI 교육으로 아시아 시장에서 인재를 키우기도 어려워 보이고, 키워내더라도 국내 시장이 흡수할 역량이 없어 보인다. 있었을지도 모르지만, 내가 더 노력한다고 인연이 닿을 것 같진 않다.
또, 유럽 시장에 맞춰 조정된 SIAI 2.0 가격과 패키지를 찾는 한국 수요가 없을 것이라는 예상도 있고, 이미 너무 많이 바쁘다. 하루가 48시간, 아니 72시간이면 좋겠다. 사실 한국 시장은 작년부터 접었었는데, 억지 춘향으로 진행한 올해 예비 수업 수요 조사 ([SIAI] 수요조사 - 2025학년도 예비 신입생 보조 교육 및 MSc 입학 시험 | GIAI Korea ) 결과를 보곤 유럽 팀 애들도 내 업무의 초점을 프로젝트로 바꾸는데 공감했기도 하고. SIAI 2.0으로 가격 오른 걸 뒤늦게 보고 깜짝 놀라서 연락오는 학생 한두 명 정도는 어차피 남은 애들 졸업은 시켜준다는 생각에 받아주긴 하겠지만, 이만하면 한국에 지킬 예의는 다 지켰다고 생각한다.
그간 날 믿고 찾아와서 살아남은 학생들은 연구 프로젝트들이 수익화되면 논문 도와주면서 봤던 실력에 맞춰 따로 불러주는 식으로 학위의 Monetization을 도와주면 생존에 대한 보상이 될까?
SIAI와는 별개로, GIAI 본사 전략에 반기를 든 사업([공지] 2030 취업 시키기 프로젝트 - 글로벌 개발자 양성 프로그램)은 어지간하면 인도에 뺏기고 싶지 않은데, 내 뜻대로 되는 일이 얼마나 될까.
Comment