왜 공대와 경영학과는 저렇게 생각할까?
그간 교육을 하면서 출신 학문 별로 사람들이 인식하는 지식의 격차에 대한 관점이 크게 다르다는 걸 알게 됐다.
우선, 아래의 3가지 형태로 표현된, 신호 세기 형태로 표현되는 지식에 대한 접근 관점을 정리해보자.
- A – 계단형: 지식은 계단 형태로 쌓인다
- B – 누적형: 지식은 고르게 누적형태로 쌓인다
- C – 구분형: 지식은 여러개의 영역으로 구분된다
우선, “영어를 잘 한다”는 표현을 좀 더 구체적으로 살펴보면서 위의 A, B, C를 이해해보자.
영어권에는 누군가가 말을 잘하고 글을 잘 쓰면 아마 “Eloquent”라는 단어를 이용해 “영어를 잘 한다”고 생각할 것이다.
외국인 대상 영어 강의인 ESL 강좌를 가르치는 교사들은, 발음이 아니라 자기의 생각을 잘 전달할 수 있느냐로 영어를 잘 한다고 생각한다.
한국인들 대다수는 누군가 혀를 잘 굴리면 “발음이 좋다”, 즉 “영어를 잘 한다”고 생각한다.
수험생들 사이에서는 수능 영어 시험이건, TOEFL 같은 공식화된 시험이건 상관없이 영어 시험 점수가 높으면 영어를 잘한다고 생각한다.
각각 목적들이 있고, 그 목적에 맞춰서 “영어”라고 하는 주제에서 남들보다 우위에 설 수 있는 요건을 마련했기 때문일텐데,
냉정하게 말해서 Eloquent에 해당하는 영어 실력자를 제외하고 나머지 분류들은 특정 집단에서만 “먹히는” 조건일 뿐이다.
그간의 경험을 미뤄볼 때, 다른 3개의 경우는 시간과 노력을 쏟아부으면 어느 정도 극복이 가능하다.
그런데, Eloquent는 뭔가 좀 레벨이 다르더라. 단순 노력으로는 불가능해 보인다.
지식이라는 것을 100점 만점의 점수로 놓고, 시간과 (돈과) 노력을 부으면 점수가 차츰차츰 올라가는게 눈에 보여서
공부할 맛이 난다고 생각하는게 한국인의 일반적인 지식 학습법인데,
정작 기업 문화로 가면, Y라고 하는 지식이 있느냐 없느냐로 그 사람을 직원으로 쓸 수 있느냐 없느냐가 결정되기 때문에,
지식에 대한 평가는 0과 1로 바뀔 수 밖에 없는 경우가 매우 많다.
“영어를 잘 한다”에서, Eloquent가 필요한 직장이면 나머지 3개 스타일로 영어 잘하는 사람에게 월급을 줘야할 이유가 있나?
나머지 3개 스타일로 영어 잘하는 사람 수십만명을 모아놔도 Eloquent 1명으로 할 수 있는 일을 못 하지 않을까?
데이터 사이언스와 A형 & B형
데이터 사이언스라고 불리는 지식을 생각해보자.
그간 만나봤던 수 많은 공학도들, 공학도와 유사한 사고방식을 갖춘 의학도, 경영학도 등등의 암기형 전공 출신들은,
자기가 열심히 공부만 하면, 즉 이런저런 지식을 계속 축적 형태로 쌓아올리기만 하면, “다 배울 수 있다”라고 생각하더라.
심하게는 1-2달, 좀 양보해서 1-2년의 시간만 쓰면 된다고 생각들을 하더라.
즉, 모든 지식을 B의 형태로 접근하고 있다는 뜻이다.
그런데, 데이터 사이언스를 수학 기반의 통계학의 연장 선상에서 바라보고 있는 이학, 경제학 같은 증명 기반 논리 전공 출신들은,
아무리 공부해봐야 어차피 될놈될…이고, 내가 할 수 있는 지식은 한계가 있는데, 그걸로는 무의미하다는 걸 이해하고 있다.
즉, 지식을, 최소한 DS라고 불리는 학문의 지식을 A형으로 접근하고 있다는 뜻이다.
지식에 대한 완전히 다른 두 개의 철학의 시작점은, 수학을 활용하는 방식에 있다.
A학문을 하는 사람들은 수학으로 설명되는 어떤 논리를 이해하는 극소수만 살아남는 전공이고, 나머지는 못하고 포기한다.
B학문을 하는 사람들은 수학이 논리가 아니라 문제 풀이에 쓰는 계산 공식이기 때문에, 어느 정도 머리만 따라가면 노동력의 싸움이 된다.
B학문을 하는 분들께 대단히 죄송하지만, DS라고 불리는 학문은, A의 방법론으로 지식이 설계되어 있다.
코드 복붙해서 라이브러리만 돌리면 결과값이 나오는데 그게 무슨 말이냐, 왜 맨날 어려운 거라고 과대포장하느냐고 화내던데,
지난 밤 서버의 간헐적인 장애 중 웹사이트 매출액 손실 부분을 서버 장애 100%가 아니라,
광고비 축소, 상품 라인업 변경 등등으로 다양한 원인들이 있음을 구분해서 보는데,
각각의 계산값이 타 회사의 광고 전략, 지난밤 드라마 방송, 스포츠 중계 방송 등등의
수 많은 외부 요소들에 얼마나, 어떻게 영향을 받았는지를 따지는 모델링 작업은,
무조건 모든 변수를 집어넣고 돌리기로 해결되지 않는다.
설령 이번에 적합한 모델이 운좋게 나왔다고해도, 다음번에도 똑같이 맞으리라는 법이 없다. 맞으면 그건 복권 당첨급이다.
어떻게든 모든 경우에 다 맞는 “기계”를 컴퓨터가 알아서 찾아내 줄 수 있을 것이라는 맹신을 끝까지 못 버리던데,
A학문을 하는 사람들은 5개 막대 중에 처음 2개 뚫어보다 이건 도저히 안 되는거다, 3번째는 몰라도 4번째는 넘사벽이구나를 안다.
5번째 막대를 채우는 건 완전히 기적, 무슨 신의 영역에 있는 사람이라는걸 깨닫는 공부를 했으면,
기계를 어떻게든 쥐어짜다보면 1->2->3->4->5….처럼 지식이 쌓이다가 마침내 다 알게 된다는 B학문 특화된 사고가 안 맞는 곳도 있다는 것을 알게 된다.
학문마다 스타일이 다른데, B학문만 하다보니 A학문이 어떤 지식인지 몰라 결국 자기중심적인 사고를 하게 되는 것이다.
어느 학위 과정의 12개 수업 중, 나는 바쁘니까 1-2개만 들으면 내가 원하는 지식을 다 얻을 수 있다고 생각하는 것도,
지식이 0/1의 게임이라고 생각했으면 저 12개를 듣던 중에 난 나가떨어지겠지..라고 A형 사고 판단을 하게되는 반면,
지식을 x% 습득 게임이라고 생각하면 내가 원하는 k%, m%만 얻어가면 된다고 이해했기 때문에 그런 결론을 내리겠지.
그간 왜 학위 과정 만들어놨는데, 안에 있는 학생들은 하나하나 넘어가는데 엄청난 한계를 극복하고 있다고 그러는데도 불구하고,
왜들 저렇게 1-2개만 골라 들으면, 책만 좀 보면 다 된다고 생각할까 궁금했는데, 사고 방식이 B형이기 때문이라고 결론 내리게 됐다.
항상 모든 문제에 대한 자동화된 해결책, 정답이 있을 것이라고 굳게 믿는 것, 그 공학식 믿음, B형 믿음이 바로 AI마니악을 낳는 근본적인 원인아닐까?
이렇게 계속 여러 정보를 부어넣다보면, 언젠가는 0% -> 100%로 올라갈 것이라는, B-누적형 믿음이 바닥에 깔려있기 때문이다.
A형은 정보를 부어넣어서 해결되는게 아니라, 사고의 흐름이 바뀌는 도전을 해야한다는 것을 알고 있다.
A형은 B형을 열등하다고 생각하나?
학문의 세계에 있는 사람들은 일반적으로 B형 지식이 A형 지식보다 열등하다고 생각한다.
A형 지식은 속칭 “천재”들이 머리로 생각해서 결론을 얻고 지식의 외연이 확장되는 반면,
B형 지식은 “실험”을 통해 계속 반복적으로 훈련하고 시간을 붓는데서 결과물이 바뀌기 때문이다.
B형으로 생각하는 사람은 학부, 석사, 박사 과정이 총 N년이다, 우와 엄청 길게 공부해야된다..와 같은 사고,
A형으로 생각하는 사람은 박사 과정 중에 논문 3개를 A 저널에 출판해야 졸업한다, 어떻게 3개나 썼나, 신이다..와 같은 사고다.
1개 논문 쓰는데 걸리는 시간이 똑같지 않기 때문이다.
로스쿨 출신이 수학 기반 연구하는 박사들한테 몇 년 만에 졸업하냐고 묻는데, 박사들은 논문을 쓰고 지도교수가 OK해야 졸업한다.
규정대로 과목 듣고 시험치면 졸업하는게 아니라.
A형은 논문 하나하나가 시간적 투입량이 중요한게 아니라 엄청난 도전을 혼자 힘으로 뚫어내야하는 지적 산물이라는 사고 방식이고,
B형은 학위 과정을 수업 듣고 학점 받는 과정의 반복이라고 생각하는 것이다.
국내는 보통 B형으로 학위과정을 운영하고, 논문도 형식적인 반면, 해외 대학은, 적어도 내가 겪은 곳은 다들 A형이었다.
평생 A형 지식을 도전하는 리그에서 지진아 취급을 당하지 않기 위해 발버둥을 쳐 왔다.
덕분에 B형 세계관을 가진 분들이 A형 지식을 공부하면서 난이도를 무시하고 Dunning-Krugger effect에 사로잡히면 보고 있기 매우 불편하다.
아무리봐도 벽을 깬 레벨인 아닌 분인데, 그저 투입량이 많았으니 충분하지 않냐는 기대는 착각에 불과하기 때문이다.
C형 지식
사실, 세상의 모든 지식은 넓게봤을 때 C형 지식이다.
각 지식별로 사회적 인식, 학문적 성취, 학습의 난이도 등등으로 제각기 다른 사이즈의 막대를 갖고 있을 수 있다.
그러나, 1개의 지식을 0/1이건 x%건 상관없이 꽤나 학습했다는 이유로 다른 지식에서도 같은 값을 갖기는 쉽지 않다.
보통은 모른다고 봐야 한다.
그래서 각 영역별로 전문가라는 사람이 생기는 것이다.
그래서 A형 지식과 B형 지식 간의 학습법의 차이를 아는 사람들이라면,
자기가 A형 지식으로 1로 올라섰다는 이유로 굳이 10년 내공이 담긴 B형 지식인을 무시하지는 않는다.
A형이 B형을 무시할 때는, 99%여서 아직 1이 안 됐는데도 1이라고 착각하며,
만들어 내는 결과물의 상태는 아직 0임에도 틀린 줄 모르고 있을 때다. (그러면서 잘 안다고 목소리를 높일 때다.)
아마 진짜로 무시하는 시점은 99%도 아니고 1% 인 주제에 1인척 하고 있을 때 일 것 같기는 하지만.
DS에 통계학 따윈 알 필요 없다고 주장하는 수 많은 공돌이들에게는 공감이 안 될 수도 있겠지만,
Times Series 구조를 제대로 이해 못하고 무작정 Neural Network에 집어넣으면 엉망의 결과물이 나온다.
그럼 Time Series 공부하면 되는거 아니냐? 학부 고학년 문제 링크인데, A학점 받을 수 있는 분?
그게 끝이 아니다. 학부 말고 대학원이야기 할거냐고?
아니, 비슷한 덩치의 통계학 주제로 Panel Data라는게 있는데, 둘 다 학부 레벨임에도 배우려면 1학기 수업으로 수박 겉핡기 수준 밖에 안 된다.
통계학이라는 전공 안에서, Time Series / Panel이라는 사촌관계에 있는 지식도, 심지어 학부 고학년 레벨인데,
하나의 전문성이 다른 하나의 전문성으로 확장되는데 상당한 훈련이 필요하다는 말이다.
좀 더 멀리보면, DS라고 불리는 학문의 사촌 학문 중 하나에서 전문가라고 해서, DS를 바로 마스터하는 것은 불가능하다.
계량경제학자들이면 평생 거의 다뤄보지 않은 Non-linear approximation 공부를 해야 DS 리그에 진입할 수 있고,
계산과학에서 시뮬레이션을 위주로 다루던 사람이면 Estimation theory를 해야 DS 리그에 발을 넣었다고 할 수 있고,
기계공학 출신이라면 Estimation theory와 더불어 통계학 이론을 상당히 공부해야 DS 리그의 일원이 될 수 있다.
회사의 덩치 큰 직원 4명이서 이삿짐을 옮기는 것보다, 이삿짐 센터 직원들 4명이 전문적으로 옮기는 편이 훨씬 더 효율적이다.
단순히 몸 쓰는 일이라 전문성이 높지 않을 것이라고 착각하겠지만, 하루 종일 책상 30개와 책장 10개를 옮겨보면 무슨 말인지 이해하리라.
장기간 경험치라고 불리는 노하우와 체력, 센스가 쌓여야 이삿짐 센터 직원들 급의 전문성을 갖추게 되겠지.
그간 컴공 출신들이 한국 사회에서 DS의 주인인 것처럼 행세해왔다.
기껏해야 컴공 교수들 몇몇이 자연어, 이미지 처리를 위해 약간의 수학 모델링 공부를 좀 해 놓은 상태이건만,
C형 지식에서 “코딩”이라는 스위치 하나만 켜져 있는 개발자들이 자기네들도 “컴퓨터” 전공자라며 교수들 권위를 호가호위하며
계산과학 / 응용통계 전반적인 지식이 모두 다 필요한 리그에서 자기네가 주인인체 한 덕분에,
길거리에서는 AI 교육이라고 하면 코딩 교육인 줄 알고, 통계학을 엉망으로 쓰고 있는 줄도 모르고 갖다 붙이고만 있다.
즉, A형 지식을 B형 지식이라고 인식하면서 C형의 분리된 세계관을 무시하고,
B형 세계관이 C 세계관 지식의 모든 곳에 맞을 것이라고 착각하고 있다.
지식의 Depth – Level – Angle
하나의 지식을 굉장히 많이 아는 것을
- 철학적으로 엄청난 고민이 담긴 지식인가
- 바둑 급수처럼 다양한 등급의 격차가 있는 지식인가
- 다양한 각도에서 고민을 담을 수 있는 지식인가
라는 관점에서 볼 때, 각각 A, B, C형으로 표현할 수 있을 것 같은데,
DS를 Depth없이 Level로만 바라보던 분들이라면, 자신의 지식 세계관을 한번쯤 다시 고민해보라고 하고 싶다.
DS가 A형 지식이라는 것에 공감할 수 없는 분들에게는,
기출문제 풀이 직전까지 뭘 하고 있는건지 전혀 그림이 안 잡히던데, 문제 풀이를 하면서 어떻게 현실에 적용하는지, 전체 그림이 어떤 거였는지 한번에 확 잡혔다
라는 SIAI 학생의 강의 후기를 공유해보고 싶다.
A형에서 계단 1칸을 더 올라가는데, 99%까지 게이지가 차올라도 다음 계단이 차오르고 있다는 느낌이 안 들고 괴롭지만,
100%가 되는 순간에 일종의 “돈오점수”의 순간이 왔기 때문에 “한번에 확 잡혔다”는 표현을 썼을 것이다.
내가 가르친 학생들 1-2명이 아니라, 그간 이런 레벨의 지식을 배운 사람들이 공통적으로 하는 이야기다.
DS가 나아갈 길 – A형 지식인이 C형의 시대를 사는 길
현실적으로, DS가 할 수 있는게 그렇게 많지 않다.
IT에서 데이터 저장/처리 쪽으로 혁신이 한번 일어났기 때문에 기존보다 훨씬 더 데이터 접근성이 향상되었고,
덕분에 A형 지식을 좁은 실험실 수준의 데이터 뿐만 아니라 좀 더 산업 기반 데이터에 다룰 수 있는 여지가 생겼다.
그 이상은?
방법론도 바뀐게 없고, 데이터도 더 바뀔 구석이 없다.
예전보다 A형 지식을 탄탄하게 배운 사람들이 할 수 있는 일이 좀 더 늘어난 것 뿐이다.
단지 한국인 B형 세계관의 사람들이 시장을 장악한 탓에 A형 지식을 갖춘 사람들의 자리를 박탈하고 있는게 문제일 뿐.
지난 몇 년간 투자금이라는게 대규모로 흘러들어갔기 때문에,
당분간은 B형 세계관의 사람들이 GPT-3 같은, 무조건 많이 집어넣어보기만 하면 어떻게 맞아들어가는 날이 오겠지….라는,
0%에서 100%로 점진적인 발전을 믿는 세계관의 도전들이, 돈이 마를 때까지, 사기라는걸 깨달을 때까지, 몇 번은 더 있을 것이다.
그러나, 그 길은 A형 지식에서 1로 올라선 사람들이 이미 오래전에 고개를 흔들었던 영역이다.
착각과 오해 속에 누군가는 돈을, 누군가는 시간을, 또 다른 누군가는 자신의 인생 커리어를 낭비하겠지.
인류가 가진 A형 지식은 아직 B형 세계관의 사람들이 꿈꾸는 이상을 위한 도전을 할 레벨이 아니다.
DS와 C형
통계 방법론은 그 때나 지금이나, 어려워서 대다수의 도전자가 중도 탈락하는 지식이다. 즉, A형이다.
예전에는 A형 지식이 그렇게 많은 효용이 없었고, 쓸 수 있는 자리도 제한적이었다.
이제 사회 많은 곳에 통계 방법론으로 도전해 볼 수 있는 데이터가 조금씩 쌓이고 있다.
즉, C형의 세계관으로 봤을 때 예전에는 스위치가 켜진 곳이 1곳 뿐이었는데, 이젠 굉장히 많은 곳에 스위치가 켜져 있는 셈이다.
A형 지식에서 1로 스위치가 켜진 분이, C형에서 1로 스위치가 켜진 곳 중 한 곳을 만나서 자신의 날개를 펼 수 있는 기회가 늘었다.
단지 각각의 C 스위치마다 다른 특성, 즉 Domain knowledge가 필요할텐데, 그걸 어떻게 메워넣고 A형 지식을 발휘하느냐가
DS가 앞으로 10년간 인류 사회에 기여할 수 있는 길, DS가 나아가야할 길이 아닐까 싶다.
C형의 시대
굳이 DS가 아니더라도, 이미 시대는 C형의 지식 구조를 갖고 있는 시대가 되었다.
예전에는 동경대 법대 생이면 모든 업무를 다 잘할 것이라는 기대로 사람을 뽑았겠지만,
이젠 우리가 뽑는 포지션의 업무를 얼마나 장기간, 제대로, 열심히 했는지를 따져 뽑는 시대가 됐다.
어느 IT 게임회사에 Junior Data Scientist로 일하는 직원이,
다른 IT 검색포털회사, IT채팅전문 서비스 회사에 Data Scientist 면접을 갔더니 모조리 B형 인간이던데 과연 A형에게 미래가 있냐고 묻더라.
국내 IT회사는 원래 B형 지식으로 매출액 만들어 내던 곳 아니었나?
왜 그런 회사들을 가서 A형 인력들이 없다고 하소연을 하지?
그런 당신은 A형 인력이라고 다른 A형 인력들에게 인정 받을 수 있는 레벨인가? 즉, 0 아니고 1인가?
IT회사라는 B형 기업의 본질을 모르고 질문하는 것부터 이미 본인이 A형이 아니라는 증거가 아닐까?
+ A형 기업들은 일반인들에게 잘 안 알려져 있지 않나? 굳이 B2C 사업을 할 필요가 없을 것 같은데…