입력
수정
L모 대기업의 어느 주력 계열사 중 한 곳에 다니는 우리 SIAI 학생에게 최근에 들은 이야기다. 회사에서 기술직 대상으로 AI 교육이라는 걸 하는데, 강사로 온 사람이 분포 함수를 이야기를 하길래 깜짝 놀랐단다. SIAI 교육처럼 Normal 분포가 깨져나갈 때 터지는 현상이나, Poisson 분포로 변형되는 Imbalance case 같은 사례들을 언급하는 수준은 아니지만, 그간 한국 대기업들이 데려오는 강사들 수준이 그저 코드 복붙에 불과했던 걸 생각하면 분포함수를 안다는 것만으로도 놀랄만한 일이지 않냐는 이야기다.
위의 기사를 보면 우리나라 대기업들을 대기업으로 만들어 준 주요 기간 산업들, 심지어 새 먹거리로 생각하고 도전하던 신산업까지 모두 중국에 기술적으로 따라잡힌 사업들 투성이라는 이야기가 나온다.
중국에 안 따라잡힌 사업이 없다? A급 인재를 그렇게 길러냈으니...
지난 몇 년간 곧 중국에 따라잡힌다 그랬는데, 이제 반도체 빼고 나면 남은 주력 사업은 거의 없는 것 같고, 자동차도 전기차로 대세가 넘어가면 현대차가 지난 수십년간 노력해서 개발한 가솔린 연료 기반 엔진 기술력도 시장 우위가 무의미해질 것이다.
한국 귀국 후 봐 왔던 한국의 AI/Data Science 교육 수준, 공대 교육 수준, 대기업 다니는게 마치 벼슬인양 목에 힘을주던 인력들의 수준을 봤을 때, 이렇게 따라잡히는건 시간 문제였을 뿐이다. 지난 몇 년간 반복적으로 이야기 한대로, 글로벌 명문대학 2-3학년 수준의 기말고사 문제도 줄줄이 F 학점을 받아가는 한국 명문대 공대 출신 석박사들이 대기업의 연구직으로 있는데, 그나마 SIAI를 찾아왔던 소수의 학생들은 문제를 인식하고 개선하려던 예외 샘플이었고, 하루하루 월급 받는 걸로 만족하고 사는 다른 연구직들이 열화 샘플일 것이라는 사정을 따져보면 기술 격차를 재역전하기는 매우 어려울 것이다.
중국을 너무 칭찬해주는 것 아니냐고 물을텐데, 유학 중에 만나본 중국의 A급 인재들은 자국에서 엄청난 훈련을 받았겠구나 싶은 경우들이 참 많았다. 러시아 애들이나 프랑스 애들은 수학 천재가 지상에 강림했다는 생각이 자주 들었던 반면, 중국 애들은 뭔가 치약을 마지막까지 쥐어짜내는 느낌으로 꾸역꾸역 공부를 했을 것 같다는 느낌이다. 유럽 애들은 자기 힘으로 올림픽에 나오는 반면, 아시아 국가들은 정부가 막대한 자금을 쏟아부어 올림픽 대표 선수들을 키워내는 것과 비슷하다고 보면 된다. 수학을 응용하는 모든 학문은 기본적으로 문제 풀이, 문제 정의 방식에서 이런 특성이 그대로 드러나기 때문에 어느 수준 이상이 되면 그런 역량을 어렵지 않게 파악할 수 있다. 분포 함수 이름 아는게 신기한 수준의 한국 대기업 'AI인력'들을 보면 같은 한국인인 내 입장에서도 기가 차고 어이가 없는데, 그런 중국 A급 인력들을 모아서 상품 만들어내는 회사에서 한국 기업들의 'AI상품'을 보면 어떤 생각이 들까?
딥러닝 매니악들에게 'AI인력' 타이틀을 달아준 한국 대기업들
올해 S모 반도체에 재직 중인 SIAI 학생 중 하나가 패널 불량을 계산하는 알고리즘으로 논문을 쓰고 있다. 그 학생도 자기 회사에서는
- 별 거 없고 딥러닝으로 돌려보면 된다
- 딥러닝으로 돌릴 수 있도록 정상/비정상 라벨링한 데이터 몇 만개 만들어 달라
같은 요청으로 인건비와 계산 비용만 엄청나게 쓰고 정작 성능이 엉망인 알고리즘을 만들어내는 'AI부서'와 그 부서에 종속된 불량 개선 부서의 무능함에 대한 불만을 여러 차례 표현했다. 외부에 발표하려고 회사 규정에 맞춰 특허까지 냈다고 하니 관련 특허를 찾아보시기 바란다.
간단하게 그 논문의 계산통계 적용 부분만 소개하면, 그 학생은 어차피 찾아야 하는 패턴의 종류가 많지 않은만큼, 데이터를 0/1을 묶은 Matrix로 처리하고, Matrix에서 특정 패턴이 나타나는 경우를 단순 F-test 스타일 계산으로 처리해버렸다. 이러면 계산비용이 0에 수렴하는 것은 두말할 나위도 없고, 패널의 종류에 상관없이 패턴에 해당하는 0/1 조합만 추가하면 간단하게 정상/비정상을 찾아낼 수 있다. 머리를 조금만 쓰면 비용 0, 확장성 무한대의 모델이 되는 것이다.
저 사례에서 겉으로는 전세계 최상위권의 반도체 기업이지만 실상은 학부 수준도 안 되는 인력들이 'AI인력'이라는 타이틀을 달고, 매우 조잡한 불량 검증 시스템을 구축해 왔다는 것을 알 수 있다. 반도체 사업에 대해 아는 것이 거의 없는만큼 말을 꺼내기 조심스럽지만, 논문을 지도해주면서 저 학생이 F-test 같은 단순 통계 검증 만으로 딥러닝 같은 고비용 계산을 쉽게 대체할 수 있는 논리를 만들어내는 것을 보고, 기초 학문 역량이 탄탄하게 갖춰져 있는지 여부가 현장에서 엄청난 차이를 낳는다는 그간의 확신을 또 한번 체감하게 됐다.
또 다른 학생은 수면에 빠졌는지 아닌지를 구분하는 웨어러블 기기 데이터 분석으로 논문을 내면서 그간 업계 사람들이 무지성으로 의존하던 딥러닝에서 벗어나서 간단한 분포함수 가정과 그 함수의 변형을 확인할 수 있는 F-test로 계산을 업그레이드했다. 통계학 공부를 한 사람들 입장에서 매우 간단한 응용에 불과할 수도 있는 변형인데, 데이터의 형태를 보고 분포함수를 추론하는 작업, 'Regime shift'를 확인하기 위해 그간 가르쳤던 Chow test, Hausman test 같은 통계 검증이 모두 F-test 기반인 것을 응용해서 모델을 만들었더라. 분포함수 가정이 있으니 심지어 MLE를 썼는데, 덕분에 계산의 Robustness도 쉽게 끌어올릴 수 있고, 모델이 매우 다양한 곳에 확장될 수 있게 됐다.
천재는 아니어도 천재를 흉내내도록 길러내는 교육
이 학생들이 천재냐? 글쎄다, 학생들이 들으면 좀 기분 나쁠지도 모르겠지만, 위의 두 학생은 천재와는 좀 거리가 먼 것 같다. 공부하는 걸 보면서 저 위에 언급한 중국 A급 인재들이 '치약을 마지막까지 쥐어짜내는 느낌'과 비슷한 느낌을 여러차례 받았다고 하고 싶다.
그룹 프로젝트 수업을 들은 학생들 대화를 지나가며 들은 이야기 중엔, 저 학생들이 회사 업무 끝나고 공부를 마저 하느라 잠을 안 자고 공부했던 사건, 병에 걸려 누운 적도 있었던 사건들도 있었다. 인생을 살면서 만났던 '천재'들과 A급 인재들의 공부하는 속도와 이해도를 놓고 비교해봤을 때, 저 학생들이 딱 중국의 A급 인재들 수준의 잠재력을 갖고 있고, 국내 대학이 제대로 그 잠재력을 키워주지 않은 탓에 B급으로 살고 있었다고 보면 될까? SIAI의 한국 학생들이 줄줄이 F 학점을 받는다고 아쉬운 감정을 여러번 토로하지만, 그래도 가르쳐보면 A급이 될만한 잠재력을 가진 인재들은 은근히 많다. 단지 우리나라 대학들과 기업들이 그들의 잠재력을 살려주지 못했을 뿐이다. SIAI 입학해서 뒤늦게 고급 교육을 받은 것이 아니라, 어릴 때부터 그렇게 고급 교육을 받았으면 글로벌 시장에서 인정받는 수준급 인재가 됐을지도 모른다.
왜 이렇게 생각하냐면, 미국에서 태어나고 자란 한국인 2세들 중에 완전히 영미권 방식의 사고력으로 훈련이 되니 러시아, 프랑스 애들에게서 봤던 '천재 강림'이 느껴지는 경우가 종종 있었기 때문이다. 샘플이 많지 않고, 인종의 문제가 어느 정도는 있겠지만, 더 근본적으로 한국 교육 방식의 실패라는 것을 확신하게 되는 경험들이었다.
그 A급 잠재력을 실현시켜놓은 학생들이 중국에는 몇 십만명이 있다. 한국에는? 내가 보지 못한 곳에도 은근히 있긴 하겠지만, 그간 들었던 한국 사례들, 국내 대학들 교육 수준, 심지어 대기업이 돈을 부어서 시키는 사내 교육 강의 수준을 미뤄봤을 때는 한국 기업의 연구직이 중국의 A급 인재들과 경쟁하는 건 아주 철저하게 완전히 불가능하다고 확신을 갖고 말 할 수 있다. 야구로 비유하면 미국 메이저리그와 한국 프로야구의 2군 정도의 격차가 있다고 본다.
인력 양성 실패가 낳은 비극, 가라앉는 배를 떠날 방법을 찾아라
한국이 겉으로 보기에는 선진국이고 세계 경제 10대 대국 중 하나라고 그러지만, 실상은 중국이 우리 제품을 사준 덕분에 IMF 구제금융을 극복했지, 기술적으로는 '해외 기술 베끼기', '저가 노동력', '빨리빨리' 같은 비기술적 역량 이외에 지난 30년간 달리 경쟁력을 키우지 못했다는 이야기를 몇 년간 꾸준히 해 왔다. 우리가 기술적 역량을 쌓았어야 하는 그 30년의 시간을 버린 반면, 중국은 충실히 교육에 투자해서 기술적 역량을 끌어올린 덕분에 미국의 강력한 견제를 받는 수준으로 성장했다.
앞으로 한국 기업, 고용 시장, 그 외 기타 사회 인프라의 사정은 더 나빠질 것이다. 주요 기간 산업들이 천천히 무너질텐데, 세금이 줄어 재원이 부족해지는 만큼 몇 십년간 힘겹게 쌓아올린 사회 시스템도 차례차례 구멍이 날 것이다.
대통령이니 장관이니 국회의원이니 하는 사람들은 좌우를 가릴 것 없이 세금을 대학과 기업 연구 시설에 투입하면 다 해결될 것처럼 착각하고, 그 정책 방향에 따라 예산을 배정하고 세부 정책을 입안하는 행시 출신 고위직 공직자 애들도 자기들이 저런 A급 인재 교육을 받아본 적이 없으니 어떻게 혹독한 훈련을 시키도록 시스템을 만들어야 하는지도 모른다. 그냥 위에서 내려오는대로 예산을 기획하고 집행할 뿐이다. 겉으로 보기에 그럴듯한 선전물과 언론 기사가 나가면 그 프로젝트는 무사히 진행됐다고 보고서가 올라가고, 그걸로 공무원은 승진하고 정치인은 치적을 내세운다. 실제 기술력은 조잡하기 그지 없건만.
이런 비극을 북한식 총살형으로 제어하면 속은 시원하겠지만, 근본적인 문제 해결은 되지 않는다. 딱 북한이 그러고 있는 것처럼, 돈과 시간을 버리고, 인력만 반복적으로 총살하게 될 뿐이다. 결국 인재를 길러내고, 그 인재들이 날아오를 수 있는 인프라를 갖춰져야 사회적인 제어 시스템이 정상 작동하면서도 기술적인 도전을 극복할 수 있는 제도가 구축된다. 즉, 어설픈 인재가 아니라 정말 고급 인재를 길러내야 한다.
꾸준히 이야기했던 대로, 이쪽 분야의 인력 수준은 0/1로 구분해야 한다. 1은 문제를 해결할 수 있지만 0.99는 문제를 해결한 것처럼 보이게 만드는 것이 최선이기 때문이다. 실제로도 한국처럼 어느 해외 기업에서 제공해주는 AI 라이브러리 몇 개 돌리는 프로젝트 경험이 있다는 이유로 AI개발자, AI연구인력 이렇게 이름 붙여봐야 제대로 되는 일이 있었나? 그저 '해외 기술 베끼기'만 했을 뿐이다. 1이 된 우리 학생들이 앞으로 얼마나 더 길게 저 기업들에 앉아 있을지 모르겠지만, 우리나라 기업들이 0을 싹 청소하고 1인 인력들로만 팀을 꾸리는 개혁을 빠르게 진행하지 않으면 겨우 만들어 시장에 공급한 1들 마저도 해외 기업들에게 뺏기게 될 것이다. 전세계적으로도 1 수준으로 올라선 인력에 대한 공급은 적은 반면 수요는 넘치기 때문이다.