개발자만 안 뽑았더라면 돈도 아끼고, 회사 서비스도 좋아졌을텐데 하고 싶었던 사업모델들도 지금보다 훨씬 더 키워놨을 수 있었을텐데마켓컬리를 운영하는 김슬아 대표가 한 인터뷰에서 "지금도 개발자만 없으면 적자 폭을 크게 줄일 수 있다"는 표현을 쓴 적이 있다. 회사 크기는 훨씬 더 작은 회사지만, 그 구절을 읽으면서 마음이 찡하더라. 나 역시도 상황은 크게 다르지 않았기 때문이었고, 결국 나는 개발자들을 다 내보내고 회사를 운영하고 있다. 명색 IT회사라더니 왜 개발자 다 내보냈다고 비웃는 경우도 보고, 주변에서는 "네가 아무리 혼자서 다 할 수 있다고 해도 한계가 있지 않겠냐"며 걱정해주시는 분들도 있다. 실제로 회사 업무에 막대한 지장을 주고 있기도 하고, 개발자 없이 IT서비스를 만들고 돌리는게 이렇게 힘든 거라는 걸 절감하면서 가끔은 모든 걸 다 내려놓고 싶은 순간도 있다.


Web novel to Webtoon conversion is not only based on 'profitability'If the novel author is endowed with money or bargaining power, 'Webtoonization' may be nothing more than a marketting tool for the web novel.


국내 대기업 급여 산정 방식은 학위를 연차로 전환 계산해 모델 의미 없어 해외 방식 급여 산정시 학위 별 더미 변수 설정, 급여 성장률과 결합으로 분석 가능 더미 변수 설정 없이 단순 '인공지능 계산'으로는 잘못된 결론 얻을 수 있어보통은 새로운 모임에 가면 공부를 많이 하고 왔다는 사실을 숨기는데, 본의 아니게 전문성이 담긴 발언을 꺼낼 수밖에 없는 순간이 오고, 결국 남들보다 가방 끈이 좀 더 길다는 사실을 토로하면 항상 받는 질문이 있다. 지식 수준이 높아진 것은 잠깐의 대화로 감을 잡을 수 있는데, 실제로 시장에서 그 가치를 더 높게 쳐 주느냐는 것이다.

Not the quality of teaching, but the way it operatesEasier admission and graduation bar applied to online degrees

Asian companies convert degrees into years of work experienceWithout adding extra values to AI degree, it doesn't help much in salary

The relationship between a commercial district and the concentration of consumers in a specific generation mostly is not by causal effectSimultaneity oftern requires instrumental variables

고분산 데이터에는 0/1 맞추기 모델 무의미, 새로운 데이터에서 같은 정확도 내기 힘들어 해석 가능한 인공지능은 결국 기초 통계학 모델로 돌아가는 것 무조건 '인공지능'='고급모델'='정확한 모델' 아냐, 잘못된 모델 쓸 경우 잘못된 해석 밖에 나오지 않아5년 전의 일이다. 보스턴 지역의 주거지 관련 데이터를 이용해, 방 크기, 방 숫자 등의 정보를 이용해 집 값, 혹은 월세를 맞추는 단순한 '인공지능' 학습자료가 SNS를 통해 좀 퍼진지 얼마 지나지 않았던 상황이었는데, 그 모델을 어디까지 써 본적이 있냐는 홈페이지를 만들어 놓은 어느 발표 모임에서 데이터 과학을 이용한 타겟 광고 모델을 설명해달라는 요청을 받은 적이 있다. 그렇게 수준 낮은 발표 모임에 유명 대기업이 상당한 후원을 하고 있다는 사실에 충격 먹기도 잠시, 그 데이터를 다양한 '인공지능' 모델에 넣어봤고, 그 중 가장 잘 맞는 모델이 '딥러닝' 모델이었다는 어느 SNS 포스팅을 보여주며 자기들이 굉장한 실력자들이 모여 있다고 자랑을 해 놓으셨더라.

One-variable analysis can lead to big errors, so you must always understand complex relationships between various variables. Data science is a model research project that finds complex relationships between various variables. Obsessing with one variable is a past way of thinking, and you need to improve your way of thinking in line with the era of big data.When providing data science speeches, when employees come in with wrong conclusions, or when I give external lectures, the point I always emphasize is not to do 'one-variable regression.'

With high variance, 0/1 hardly yields a decent model, let alone with new set of dataWhat is known as 'interpretable' AI is no more than basic statistics

수학, 통계학에 기반한 Data Science 교육이 이뤄져야 하는데, 단순 부트캠프 수준의 코딩 교육만 이뤄진다는 비판을 시작한지 6년이 됐다.
비판을 꺼내니 온갖 비판을 맞는 중인데, 그 중 가장 안타까운 내용이
대기업가는데 저런 거 필요없다. 코테만 통과하면 된다라는 표현이다. (코테=코딩 테스트) 난 미국서 직장 찾을 때 나같은 수리 모델링 훈련을 받은 사람들을 코딩 테스트로 거르려는 직장들은 모조리 무시했었다. 나만 그랬던 것도 아니고, Data Science 관련으로 비슷한 직군의 구직하는 애들을 만나봐도 '거긴 coding test 보는 곳'이라며 비웃으며 말했던 기억도 있다. 우리는 Matlab, R로 학교에서 수리 모델링하는 훈련을 받은 사람들인데, 난데없이 Java, C로 생뚱맞은 성배에 1/1~ 1/10까지 물 배열하는 알고리즘 짜라니까 황당할 수밖에.

S대 학석박 후 포닥 과정 밟고 있는 SIAI 학생의 제보다
이야기를 들어보니 MIT 학부 신입생들은 XX통계 첫 시간에 heteroskedasity를 배운답니다. 선형회귀 기본 정도는 알아서 떼고 오고, 가우스-마르코프 기본가정들은 숙지해오라는 것이겠지요. 케임브리지 XX학과 신입생들은 첫 시간에 ANOVA를 배우고 벡터공간에서 직각삼각형 형태로 분산이 해체되는 직관을 배운다고 합니다. t-test까지는 알아서 공부해오라고 하고요. UC 버클리 XX통계는 전반부에 PCA, 시계열까지 다 떼고, 후반부는 실제 데이터셋으로 트레이닝합니다. S대 XX는... 제가 석사생들 붙잡고 평균, 분산 가르쳐야 합니다. XX에 XX통계가 없어서 사회과학대학까지 가서 듣고 오는데, 대학원생 대상 '고급 통계학' 중간고사가 겨우 1변수짜리 단순선형회귀까지 다루고, 기말고사까지 행렬 한번 안 나옵니다.
이야기를 들어보니 MIT 학부 신입생들은 XX통계 첫 시간에 heteroskedasity를 배운답니다. 선형회귀 기본 정도는 알아서 떼고 오고, 가우스-마르코프 기본가정들은 숙지해오라는 것이겠지요. 케임브리지 XX학과 신입생들은 첫 시간에 ANOVA를 배우고 벡터공간에서 직각삼각형 형태로 분산이 해체되는 직관을 배운다고 합니다. t-test까지는 알아서 공부해오라고 하고요. UC 버클리 XX통계는 전반부에 PCA, 시계열까지 다 떼고, 후반부는 실제 데이터셋으로 트레이닝합니다. S대 XX는... 제가 석사생들 붙잡고 평균, 분산 가르쳐야 합니다. XX에 XX통계가 없어서 사회과학대학까지 가서 듣고 오는데, 대학원생 대상 '고급 통계학' 중간고사가 겨우 1변수짜리 단순선형회귀까지 다루고, 기말고사까지 행렬 한번 안 나옵니다.

지난 12일, 데이터 사이언스 경영학회 세미나에서 최근 이슈가 된 챗GPT가 기반하고 있는 대형언어모델(Large Language Model, LLM)의 방법론을 풀어내는 설명과 함께, 활용법이 노동 시장을 바꾸는 부분에 대한 예상을 정리했었다.
구글 검색을 해보니 챗GPT가 출시된 지난해 11월부터 올해 5월 초까지 무려 433,000개의 뉴스 기사가 'chatgpt'라는 검색어에 걸렸다. 뉴스 업계에서 광고 기사 1개 내는데 지불해야하는 비용을 감안하면 수십조원의 광고 비용을 쓴 것이나 다름없을만큼 화제가 됐다는 뜻이다. 한국어로도 구글 검색 기준 무려 16,600개의 기사가 검색이 됐다. 영어권과 한국어권의 기사 공급량의 차이를 감안해도 한국에서 큰 화제가 되었다는 것을 보여주는데 큰 무리는 없는 수치일 것이다.

아래는 연구자들 커뮤니티로 유명한 모 웹사이트에서 본 글이다. (링크)
수 많은 AI 대학원의 위험성(?)은 다음과 같습니다. CS 분야를 원래 전공했거나 다른 분야를 전공했지만 수학이 강한 일부 연구자를 제외하면 대부분의 AI 연구자들은 제대로 아는 것이 너무 없습니다. 공부를 열심히 하지 않는다는 뜻이 아닙니다. 급변하는 유행을 따라 경쟁적으로 논문을 쓰다 보면 연구 경험이 별로 없고, 실적이 급한 젊은 연구자 입장에서는 대학원 과정 동안 깊이 있게 공부하면서 차분하게 기본기를 익히기 어렵기 때문입니다.
수 많은 AI 대학원의 위험성(?)은 다음과 같습니다. CS 분야를 원래 전공했거나 다른 분야를 전공했지만 수학이 강한 일부 연구자를 제외하면 대부분의 AI 연구자들은 제대로 아는 것이 너무 없습니다. 공부를 열심히 하지 않는다는 뜻이 아닙니다. 급변하는 유행을 따라 경쟁적으로 논문을 쓰다 보면 연구 경험이 별로 없고, 실적이 급한 젊은 연구자 입장에서는 대학원 과정 동안 깊이 있게 공부하면서 차분하게 기본기를 익히기 어렵기 때문입니다.

스위스 AI대학(Swiss Institute of Artificial Intelligence, 이하 SIAI)는 스위스의 대학 교육 기관입니다. 2021년 8월에 개교해 현재까지 70여명의 한국인 학생들이 SIAI를 거쳐갔습니다.
학생 구성은 국내 최상위권 명문대인 SKY, SKP를 비롯, 석·박사 학위자가 전체의 40% 이상으로 대부분의 학생들이 국내 최상위권 대학에서도 받을 수 없는 글로벌 레벨의 데이터 과학 교육을 받기 위해 와 있습니다.
한국인 학생들의 수준이 글로벌 명문대에 못지 않은 가장 큰 이유는
- 국내 그 어느 대학에서도 볼 수 없는 글로벌 최상위권 교육 프로그램
- 현실 적용의 고민이 가득 담긴 연습문제, 시험문제 및 논문 지도 과정
- 온라인 교육을 통한 접근성 강화
- 높은 수준의 학생들로부터 만들어지는 학생 네트워크

다음은 필자가 올 초 어떤 학생으로부터 받은 메일이다. 그냥 조금 딱하다는 생각이 들었기에 공유한다.
안녕하세요. 저는 제가 고등학생이던 파비 블로그에 댓글에 열려있던 때부터 최소 일주일에 한 번씩 대표님의 블로그에 들어가 글을 보고 있는 20학번 대학생입니다. 대표님의 글을 고등학교의 다소 늦은 시기에 접한 탓에 경영학과로 대학에 입학했으나, 대학에 들어와 수학과와 통계학과를 복수전공하고 있습니다. 제가 재학 중인 학교는 전과가 불가하여 불가피하게 3전공을 하고 있습니다. 제가 이렇게 이메일을 드리는 이유는 기성의 학부에서도 대표님께서 중시하시는 지식을 쌓는 게 가능하다는 하나의 사례가 되고자 함과 함께 그것을 가능케 해주신 대표님께 감사를 표하고자 함입니다.
안녕하세요. 저는 제가 고등학생이던 파비 블로그에 댓글에 열려있던 때부터 최소 일주일에 한 번씩 대표님의 블로그에 들어가 글을 보고 있는 20학번 대학생입니다. 대표님의 글을 고등학교의 다소 늦은 시기에 접한 탓에 경영학과로 대학에 입학했으나, 대학에 들어와 수학과와 통계학과를 복수전공하고 있습니다. 제가 재학 중인 학교는 전과가 불가하여 불가피하게 3전공을 하고 있습니다. 제가 이렇게 이메일을 드리는 이유는 기성의 학부에서도 대표님께서 중시하시는 지식을 쌓는 게 가능하다는 하나의 사례가 되고자 함과 함께 그것을 가능케 해주신 대표님께 감사를 표하고자 함입니다.

신입 개발 면접을 보는 중에, 가끔 특정 학원 출신들을 연속적으로 보게되는 경우가 있다.
포트폴리오 만들어 놓은걸 보면 엄청 화려한데, 거의 대부분, 매우 심각하게 지식이 없는 상태고,
질문을 해도 고민하는 느낌이 전혀 없는, 암기한 내용을 그대로 읊고 있다.
어디 SI회사 가거나, 아예 개발자 구직하는거 포기해야겠다 싶은 생각이 든다.
첫 지원자한테 그렇게 속았다가, 포트폴리오가 판박이인 지원자가 둘 셋 늘어나면서,
"아, XYZ 학원에서 소스코드 주고 복붙시켰구나"는 결론을 얻는다.
다시는 그 학원 출신들을 면접보지 않게 된다.
딱히 포트폴리오를 만들어주는 방식으로 학원 형태의 구직 활동 지원 시스템을 안 갖추고 있고,
갖출 계획도 없는 Data Science 전문 과정을 담은 대학 학부, 대학원 레벨 교육을 하고 있는데,

작년 이맘때쯤의 일이다.
SIAI 학교 설립, 인가, 강의 등등으로 정신없이 바빠 회사 운영에 거의 손을 놓고 있던 무렵이었는데,
우연히 어느 커뮤니티 게시판에 우리 회사, 정확하게는 내가 운영하는 학교 관련된 비방 글이 잔뜩 올라와 있다는 제보를 받았다.
온갖 음해가 떠돌아 다니고, 자기들끼리 과대망상으로 헛소리들을 늘어놨던데,
그 중 어이가 없었던 멘트 중 기억나는게
파비클래스 듣고 나면 석사 학위 주는거 아냐? 개꿀인데? 그 딴 석사 그거 해 봐야 쓰레기지라는 내용이었다. 공개한 시험 문제를 보고도 저런 평가 밖에 못 내리는 수준들은 아마 MBA AI/BigData 과정이나 BSc Data Science 편입과정 첫 학기 시험문제는 커녕, 아예 첫 학기, 첫 수업, 첫 과제의 연습문제도 못 푸는 수준일 것이다.

국내 대학원들이 고급 지식을 전달하고 학문적 연구를 위한 곳이 아니라,
학생 숫자를 채워서 돈을 벌기 위해 '학벌 세탁' 전용으로 돌아가고 있다는 강도높은 비난을 여러차례 해 왔다.
이 블로그를 오래 읽은 분들은 이젠 귀에 못이 박힐 정도로 들었을 것이다.
나의 '구린 학부 학벌'을 숨길 수 있는 '명문대 대학원 학벌'이 반드시 필요하다면 그들의 사정이겠지만,
현실적으로 봤을 때, 아무도 당신의 학벌이 세탁되었다고 생각하지 않을 것이다.
한국 교육 시스템이 '서열화'를 매우 잘 하는 시스템이라, 어지간해서는 당신의 잠재력을 제대로 평가했을 것이라는 믿음이 강하기 때문이다.
이렇게까지 맹폭격을 해서 미안하지만, 이게 대기업 인사팀이라는 곳에서 갖고 있는 기준 값으로 알고 있다.
이런 시스템에서 재수까지는 억울한 케이스가 있으니 이해될지 몰라도 3수, 4수까지 해 가며, 아예 10수까지 해가며 대학을 바꿔 가봐야 세상은 녹록치 않다.

지난 봄에 받은 MBA AI/BigData 학생들 중 일부만 Machine Learning 수업시간에 살아남은 성적표를 받은 날,
한국 애들이 어차피 절망적인 상태인걸 뻔히 알고 있고, 직장이다 뭐다 공부할 시간 없다는 것도 아는데,
그냥 무리하지 말고 아예 접을까, 나도 학교 운영하기 귀찮은데... 돈도 안 되고... 진짜 이거 왜 하지... 이런 생각을 하던 무렵이었다.
일전에 한번 공유했었는데, S대 데이터 사이언스 석사 과정에 들어갔던 우리 학교 학생 하나의 증언대로,
제대로 가르치면 3명만 남고 40명 이상이 도망가버리는 그런 석사 과정이 한국 사회의 냉정한 현실이니만큼,
아예 학위 장사하라고 안타까운 눈빛을 보여주시던 많은 분들의 소리없는 응원도 생각나고 그렇더라.
학교 게시판에 올리고, Global MBA (or Associate) 프로그램 만들어야 될 것 같다고 그랬더니,