왜 기업들은 코딩테스트로 데이터 사이언티스트를 뽑을까?

우리나라 IT기업들 대부분이 코딩테스트로 데이터 사이언티스트를 뽑는다. 실리콘 밸리에 있는 회사들은 대부분 수학, 통계학 질문 & 답변으로 데이터 사이언티스트를 뽑는데, 왜 국내 IT기업들만 저렇게 CS 기반으로 인재 채용을 하는걸까? 필자 역시도 R/Python code + Latex으로 정리한 PDF 문서를 보내는 1차 면접을 여러 번 거친 바 있다. 그러나, 2차 면접 이후로는 수리통계학 훈련도에 대한 검증 위주였고, 한국 방식의 개발자를 위한 코딩 테스트를 한 경험은 없었음을 밝힌다.

이와 관련된 가능성 있는 이유들을 한번 정리해보자.

 

수학, 통계학을 쓰는 업무가 없다

사실 기초과학은 학부만 졸업해서는 중요한 일을 하기 힘들다. 꼭 기초과학 뿐만 아니라, 응용 학문이 아니라면, 학부의 지식으로 직장에 바로 투입되어서 업무를 하기는 힘들다. 예를 들어, 의학, 약학, 간호학 같은 생물학의 특정 분야를 응용하는 학문 전공자가 생물학 학부 전공자보다 직장이 훨씬 더 많다. 생물학 같은 기초학문을 공부했으면, 자기 전공을 살리는 연구시설에 진입하기 위해서 대학원 학위가 필수다. 법학, 경영학 같은 사회과학 전공도 국가가 인증해주는 자격증을 하나 취득하면 전문직이라는 타이틀이 생긴다. 반대로, 두 학문 그 자체를 연구하는 분들, 혹은 두 학문의 기초가 되는 경제학을 공부한 분들은 학부 학위로 취직해서 자기의 전공을 살리기란 매우 힘들다.

실제로 직종과 관계없이, 일반적인 직장에서 수학, 통계학 같은 기초학문을 고급 레벨로 쓰는 일은 드물다. 연봉이 높은 직장이, 회사가 유명하든, 직원들이 박사급 연구원들이든, 그 어떤 경우건 상관없다. 심지어 연구소 타이틀을 달고 있는 직장을 가도 기초 학문을 고급 레벨로 쓰는 것만으로 모든 업무를 하기는 쉽지 않을 것이다. 결국은 조직의 어떤 목적에 맞는 연구 결과물을 낼 때, 내가 가진 수학, 통계학 지식을 활용해서, 어떤 공격에도 버틸 수 있는 완벽한 논리를 만들어내는데 쓰이는 정도로 밖에 비지니스적인 가치가 없다는 것이 냉정한 현실이다. 다만 어떤 조직은 그 결과물 자체가 엄청난 도전을 요구하기 때문에 고급 인재가 필요하고, 또 어떤 조직은 인재를 채용하기 위해 특정 이익 집단을 변호해줄 수 있는 ‘타이틀’을 먼저 보기도 한다.

 

국내 AI 프로젝트는 정부 프로젝트 밖에 없다

국내에 현재 AI라고 이름 붙은 프로젝트들은, 현실적으로 정부 발주 프로젝트만 있는 상황이다. 일반 기업들은 수학・통계학 지식은 부족한채로, 정확도만 끌어올리는 식의 업무 수준에 머물고 있다. 정부 프로젝트의 수준도 이와 별반 다를게 없다.

이런 상황에서 순환신경망(Recurrent Neural Network)의 장단기 메모리(Long Short-Term Memory, LSTM) 알고리즘을 구동해 주가 예측에 성공했다는 식으로 신문을 낸다. 그런데, 그 LSTM 계산을 하는데 정작 데이터가 비정상과정(Non-stationary process)이라서 모델이 엄청난 계산비용을 쓰고도 기대 이하의 결과물을 보여주었고, 그 날 그 데이터 한번에만 제대로 맞아들어가는 것처럼 나왔다는 사실은 아무도 인지하지 못한다.

회사 오너들은 아무도 인공지능을 제대로 이해하지 못하고 있다는 사실을 이해하고, 정부 프로젝트를 빨리 해주고 돈을 챙기자는 마인드로 바뀐다. 프로젝트를 발주하는 정부가 아무것도 모르기 때문에, ‘어려운’ 지식을 쓰지 않더라도 수익을 내는데에는 지장이 없기 때문이다. 고급 지식이 아니라, 그럴싸한 타이틀이 필요할 뿐이다.

 

수학/통계학 실력 테스트를 제대로 할 인력의 부재

업무의 9할은 코딩이고 단 1할이 수학, 통계학이라고 해 보자. 그마저도 무시하고 있기 때문에 기대 이하의 결과물이 나오고 있고, 수학・통계학 지식 없이 라이브러리를 쓰는 방식으로 인력을 활용하는 것으로는 근본적으로 문제를 해결하기 어렵다는 것을 기업 오너들 또한 인지하고 있다.

그래서 제대로 테스트해서 채용하려고 하니, 테스트를 할 수 있는 인력이 없다. 기업의 인력 풀이 대부분 공학 전공에 포진해있으니, 수학・통계학 지식 기반의 모델링 실력을 검증하지 못하고, 코딩 테스트를 진행한다. 실리콘 밸리와 비교해보니 그렇게 해서는 제대로 된 인력을 못 뽑는다는 걸 알지만, 그렇게 수학, 통계학 쓰는 일이 많은 것도 아니고, 일단은 사람 뽑기가 힘드니까 타협하고 본다.

필자는 월스트리트 헤지펀드, 실리콘 밸리 데이터 사이언티스트 면접 보던 시절 매일 울고 싶었다. 내가 이렇게 선형대수학을 모르고 있었나는 생각이 들만큼 괴로운 면접을 봤었는데, 이런 필자 눈에도 검증된 인재가 없는 국내 기업들이, 제대로 된 수학, 통계학 면접을 보고 인재를 채용할 수 있을 가능성은 매우 낮을 것이라 짐작 된다.

 

미국에서 같은 면접을 진행한다면

미국, 유럽의 지식선진국에서 개발자 코딩 테스트로 데이터 사이언티스트를 뽑는 회사가 있었다고 해보자.

누가 면접 후기를 올리면,

데이터 엔지니어 면접 봤는데 이름만 Scientist로 써 놓은 것 같다

라고 댓글이 달린다. 그렇게 소문이 나고, 그 회사에 제대로 된 데이터 사이언티스트들이 아무도 지원 안 한다. 그 회사는 코더 밖에 못 뽑는 회사로 전락한다.

제대로 된 훈련을 갖춘 사람이 시장에 충분히 공급되고, 그런 인력을 제대로 소화할 수 있는 시장 수요도 어느정도 갖춰진 시장이라면, 데이터 사이언티스트를 코딩 테스트로 면접하는 회사들은 ‘Science’ 회사가 아니라, ‘Engineering’ 회사라는 낙인이 찍히게 된다.

 

그럼 한국에서 어떻게 취직할 수 있을까?

통계학을 박사로 공부하더라도 한국에 적합한 취직 자리는 많지 않을 것이다. 연구소, 혹은 기업들의 핵심 연구 인력으로 자리를 찾아가지 않으면, 거의 대부분은 자기 전공 지식을 활용하지 못하는 업무를 하게 될 가능성이 높다. 심지어 연구 중심 조직을 가더라도 많은 경우에는 본인이 원하는 업무를 하지 못할 수 있다.

본인이 원하는 지식만 탐구할 수 있는 사람은 세상에 많지 않다. 이를 어느정도 보장해주어도 정작 본인이 원하지 않는 지역에서 살아야 될 수도 있고, 타이틀이 마음에 들지 않을 수도 있다. 모든 조건들을 다 갖춘 직장은 현실적으로 찾기 어려울 것이다.

사실, 해외의 지식 선진국들 또한 상황이 별반 다르지 않다. 그러나, 한국과 한 가지 차이가 있다면, 가르치고 싶은 방식과 지식이 있는데, 이를 다른 대학에서 충족시켜주지 못하기 때문에 대학을 만들고, 여기서 육성하는 인재가 좋은 자리를 찾아가지 못하니, 결국 본인들이 연구소와 기업을 만들었다는 점이다. 특히 전 세계적으로 ‘R&D 명가’로 손꼽히는 스위스는 이와 같은 사업 모델을 통해 인구 대비 박사 학위자 숫자가 전세계 최고를 달성하고 있고, 이 인재들이 전반적인 국가 산업 발전에 크게 이바지하고 있다.

우리나라에도 해외 지식 선진국들처럼 하루 빨리 올바른 지식을 제공하는 교육기관이 생겨나, 제대로 훈련된 데이터 사이언티스트들이 업계를 주도하는 날이 오기를 바래본다.

Similar Posts