Books

Questions Answers Signage

한국식 주입식 교육과 데이터 사이언스 교육의 절망적인 결합이 낳은 한국의 데이터 사이언스 업계

논문을 쓸 수 없는 학생들, 논문을 이해하지도 못하는 학생들직장에서 해야하는 업무를 상세하게 알려줘야만 따라가는 직장인들한국사회의 주입식 교육이 낳은 폐해비단 데이터 사이언스 분야 뿐만 아니라, 국내 기업 사회 전체에 뿌리 내린 후진성 낳아 지난 몇 년간 한국인들을 대상으로 직업 교육수준부터 학부, 석사까지 다양한 수준으로 AI/Data Science 교육을 하다 얼마 전부터 한국 교육 시장 자체를 포기했다. 가장…

Stanford AI Index 2024

‘AI≠IT개발’을 상징적으로 보여준 스탠퍼드 대학의 한국 AI역량 평가를 보면서

스탠퍼드 대학 인간중심AI연구소, AI Index에서 한국 AI역량 이집트, UAE와 동급 취급’AI=IT개발’이라고 착각했던 정부 관계자들의 어리석은 예산 집행이 낳은 정책 실패돈만 투입하면 해결되는 인프라, 건설 사업 아냐, 늦었지만 인재 양성부터 천천히10년, 20년이 걸리더라도 A급 인재 길러낼 수 있도록 고교, 대학 교육 시스템부터 개선해야 지난 16일(현지시간), 미국 명문 스탠퍼드 대학의 인간중심AI연구소에서 발표한 2024년 전세계 AI지표(AI Index)에서 한국이…

Computational efficiency

계산 비용 최소화를 위한 ‘Trinity’, 하드웨어 – 소프트웨어 – 수학 모델

비싼 하드웨어만 도입한다고 무조건 AI를 도입한 것 아냐고급 하드웨어는 계산 속도 개선을 위한 하나의 도구일 뿐AI는 반복 계산의 자동화가 필요한 구간에서 인간의 수고를 덜어주는 프로그램에 불과자동화 연산에 필요한 계산 비용 최소화는 하드웨어 뿐만 아니라 소프트웨어 최적화도 필수근간에는 데이터 변형, 데이터에 맞춘 수학 모델 변형 등이 깔려있어 ‘브라운 운동(Brownian motion)’은 1827년 스코틀랜드 식물학자 로버트 브라운이 발견한…

20240406_142314

AI교육의 미래와 AI채용 시장의 미래

지난 4월 6일을 끝으로 2023~2024년 졸업 기수들에 대한 논문 지도를 끝냈다. 5월 중에 데이터 사이언스 경영학회 세미나 발표를 거쳐 9월까지 논문을 제출하면 이제 졸업이다. 논문에 합격(Pass)를 받은 분들이 그렇게 많지 않고, 최선을 다한 분들이 집에서 혼자 울었다는 이야기도 들었다. 합격이라고 이야기를 못 해줘서 마음이 무겁고, 내 가슴에 박힌 못들이 다시 한번 날 찌르는 느낌이 들어서…

20240330_130513

고급 교육과 졸업 논문과 졸업장의 무게

지난 2022학년도 입학생이 2년 학위 과정 끝에 졸업 논문 마무리에 한참이다. 2021학년도 입학생 중에 논문을 못 냈던 분들도 괴로운 마음을 다잡고 지난해 9월부터 재도전에 나섰다. 지난 3월 30일, 오는 4월 6일 양일간 1차로 심사를 진행하고, 합격하면 작년처럼 ‘데이터 사이언스 경영 학회(Managerial Data Science Association, MDSA)’ 세미나에서 졸업 논문을 발표하게 된다. 발표 후 남은 몇 달간…

한국인 대상 SIAI 3년 교육을 정리하면서 (3)

대학을 설립해서라도 제대로 된 AI/Data Science 교육을 해야지, 이렇게 황당한 코딩 교육 수준의 학위 과정만 돌아다녀서는 안 된다며 목소리를 높이던 시절, 식견 있는 선배님들은 어지간하면 무리하지 말고 차라리 미국으로 돌아갈 방법을 찾거나, 한국에서 정부 프로젝트나 따며 조용히 살아라고 충고하셨다. 저렇게 심각한 통계문맹이면서 코드 몇 줄로 인공지능 전문가라고 현혹하고 정부 및 기업 프로젝트들을 갖고가고 있던데, 마케팅…

한국인 대상 SIAI 3년 교육을 정리하면서 (2)

지난 몇 년간 한국에서 AI/Data Science 교육을 하며 느낀 점이 많지만, AI 교육과 직접 관련 있는 수학적 사고력 부족 부분 말고, 한국 학생들의 ‘무모한 욕심’에 대한 부분도 글로 남겨 둘 필요가 있는 것 같다. 나 스스로도 ‘무모한 욕심’을 못 이기고 글로벌 최상위권의 Research school 수준의 교육을 한국 땅에서 해보겠다고 무리수를 뒀지만, SIAI를 찾아왔던 학생들, 오고…

한국인 대상 SIAI 3년 교육을 정리하면서

그간 SIAI로 받은 학생들에 대한 교육만 마무리하고 국내 교육은 이제 완전히 접는 절차를 밟는 중이다. 올해도 신입생을 받겠다고 수요조사는 진행 중이지만, 지금까지처럼 수익성이 안 나와도 한국 AI/Data Science 교육을 어떻게든 살려보겠다며 또 다시 손해를 감수할 계획은 없다. SIAI 설립 이전에 AI/DS 교육을 했던 3년을 포함하면 대략 6년간 한국 시장에서 최대한 고급 교육을 공급하기 위해 노력했는데,…

온라인 대학

왜 온라인 학위 과정은 오프라인 학위 과정보다 수준이 떨어진다고 생각할까?

온라인 학위 저평가 원인은 대학들이 오프라인보다 입학 난이도 및 교육 난이도를 가볍게 운영하기 때문 장기간 온라인 교육에 대한 평가 절하 인식이 퍼져 있어 편견 확대되는 효과도 난이도 높이면 결국 학생들의 기초 실력과 열정에 따라 성취도 구분되는 효과 나와 지난 코로나19 기간을 겪으며 한국 사회에서도 온라인 교육 과정에 대한 편견이 많이 사라지는 했지만, 여전히 온라인 교육은…

2023 10 31 093103

홍대 앞 상권이 청년을 불러모았을까? 청년들이 상권을 만들었을까?

상권과 특정 세대 소비자 집중도 관계 분석시 동시성의 오류 발생할 가능성 높아 도구 변수를 이용해 둘 간의 복합 상관관계를 단순 상관관계로 분리해야 실제 기업 사례에서도 잘못된 계산 후 잘못된 결론 얻는 경우 많아 데이터 사이언스 관련 프로젝트를 하다보면, 비일비재하게 발생하는 사안이 인과관계 오류다. 원인이라고 생각했던 변수가 사실은 결과였고, 반대로 결과라고 생각했던 변수가 원인인 경우들이 상당히…

SNS 202312

SNS를 많이 쓰는 사람들의 연봉은 낮다는 속설은 사실일까?

1변수 분석은 큰 오류 낳을 수 있어, 항상 다양한 변수 간 복합 관계 이해해야 데이터 사이언스는 다양한 변수 간 복합 관계를 찾아내는 모델 연구 작업 1변수 집착은 과거 방식, 빅데이터 시대에 맞춰 사고 방식 개선해야 데이터 사이언스 교육을 하거나, 직원들이 잘못된 결론을 갖고 왔거나, 외부에 강의를 나갔을 때 항상 강조하는 부분이 ‘1변수 회귀분석(One-variable regression)’을 하지…

WebNovel WebToon

웹소설이 웹툰으로 바뀌는 과정과 데이터 사이언스

웹소설이 웹툰으로 바뀌는 구조는 ‘자본의 논리’만 작동하는 것 아냐 ‘작가의 의지’가 반영되는 비중 높으면 외부 알려진 단순 시장 변수로는 예측 불가능 데이터 사이언스 모델링은 언제나 시장 상황에 대한 이해부터 시작해야 SIAI의 MBA AI/BigData 졸업 논문 쓰느라 고생 중인 학생 하나가 잡은 주제가 웹소설이 웹툰으로 바뀌는 조건이다. 일반적으로 생각하기에는 조회수가 많고, 웹소설 판매량이 많은 경우에 웹툰…

UniversalApproximationTheorem_SIAI_20240124

Neural Network 모델은 Borel-measurability가 충족되는 데이터에서만 쓸 수 있다

Neural Network 계산법이 만능이라는 오해가 퍼져 있으나 수학적 조건 따져가며 적용해야 Borel-measure 조건을 충족시키지 못하는 계산에서는 ‘학습 실패’ 사건이 벌어지기도 오차 많은 시계열 데이터에서 빈번하게 발생, 데이터 전처리 고민 필수 우리 SIAI 학생 중 한 명의 미국 대학원 추천서를 쓰면서, SIAI에서 가르친 내용, 방향, 수준, 응용 방식을 잘 보여주면서, 동시에 그 학생의 역량을 쉽게 이해할…

pexels thisisengineering 3861969

공대는 학부만해도 되는데, 통계학은 대학원을 가야된다 – ②

공대는 학부 교육이 불필요한 저(低)기술 직장이 매우 많았던 반면 통계학은 학부 고학년 교육이 실패하면 경제·경영 등의 문과보다 경쟁력이 떨어짐 그러나 공대생을 채용하던 기업들이 글로벌 시장에서 중국, 동남아, 동유럽에 단가 싸움에서 밀리는 상황이 됐음 10년 후에도 공대 출신들이 지난 40년 만큼 쉬운 취직이 될 것이라는 기대하기 어려워 지난 2022년 봄에 학생들의 질문을 받고 통계학 전공자들이 왜…

YieldCurve_FinancialTimes_20231219

미 연준은 기다리는데 매일 시중 금리가 떨어지는 이유와 비트코인 가격이 계속 오르는 이유

모두가 같은 기대치를 갖고 있으면 기대치는 빠르게 시장에서 현실화 되는 경향 미 연준 금리도 내년 3월 예정 금리가 벌써부터 시중은행에 확산되는 중 중앙은행 금리 결정이 시중보다 늦게 이뤄지는 사후 정책이 될 가능성 높아 코인가격도 상품의 본질보다 가격이 오를 것이라는 믿음을 이용한 마케팅이 효과를 보는 것 미국 연방준비제도(이하 연준)는 대략 1.5개월에 1번, 1년에 8번 기준 금리를…

STA501 Mock exam – F2023

STA501 Mock exam – F2023

아무리 시험 문제를 미리 다 풀어주고 시험을 쳐도 적응하는데 힘들어하길래 F2023 기수들부터는 아예 Mock exam이라고, 실제 시험 대신 성적에 안 들어가는 예비 시험을 치뤘다. 뭔가 잔뜩 재밌는 문제를 만들었다가 아껴놔야 1월 초에 치를 진짜 시험에 쓸 수 있을 것 같기도 했고, 그냥 재밌는거 만들겠다고 하다가 너무 어렵다고 느끼면 안 될 것 같아서 양보하는 마음에 셋팅만…

artificialintelligence 202310

인공지능 석·박사 학위 과정은 실제로 임금 상승에 도움을 줄 수 있을까?

국내 대기업 급여 산정 방식은 학위를 연차로 전환 계산해 모델 의미 없어 해외 방식 급여 산정시 학위 별 더미 변수 설정, 급여 성장률과 결합으로 분석 가능 더미 변수 설정 없이 단순 ‘인공지능 계산’으로는 잘못된 결론 얻을 수 있어 보통은 새로운 모임에 가면 공부를 많이 하고 왔다는 사실을 숨기는데, 본의 아니게 전문성이 담긴 발언을 꺼낼 수밖에…

‘예/아니오’ 잘 맞추는 모델이 무조건 좋은 모델일까?

‘예/아니오’ 잘 맞추는 모델이 무조건 좋은 모델일까?

고분산 데이터에는 0/1 맞추기 모델 무의미, 새로운 데이터에서 같은 정확도 내기 힘들어 해석 가능한 인공지능은 결국 기초 통계학 모델로 돌아가는 것 무조건 ‘인공지능’=’고급모델’=’정확한 모델’ 아냐, 잘못된 모델 쓸 경우 잘못된 해석 밖에 나오지 않아 5년 전의 일이다. 보스턴 지역의 주거지 관련 데이터를 이용해, 방 크기, 방 숫자 등의 정보를 이용해 집 값, 혹은 월세를 맞추는…

한국이 고급 인재를 못 살리는 나라가 된 이유 – 당신들이 고급 인재가 아니니까

한국이 고급 인재를 못 살리는 나라가 된 이유 – 당신들이 고급 인재가 아니니까

수학, 통계학에 기반한 Data Science 교육이 이뤄져야 하는데, 단순 부트캠프 수준의 코딩 교육만 이뤄진다는 비판을 시작한지 6년이 됐다. 비판을 꺼내니 온갖 비판을 맞는 중인데, 그 중 가장 안타까운 내용이 대기업가는데 저런 거 필요없다. 코테만 통과하면 된다 라는 표현이다. (코테=코딩 테스트)   난 미국서 직장 찾을 때 나같은 수리 모델링 훈련을 받은 사람들을 코딩 테스트로 거르려는…

MicrosoftTeams image 110

챗GPT, 언어 기반 노동시장엔 고급 인력만 남기고 다 내보내게 될 것

지난 12일, 데이터 사이언스 경영학회 세미나에서 최근 이슈가 된 챗GPT가 기반하고 있는 대형언어모델(Large Language Model, LLM)의 방법론을 풀어내는 설명과 함께, 활용법이 노동 시장을 바꾸는 부분에 대한 예상을 정리했었다. 구글 검색을 해보니 챗GPT가 출시된 지난해 11월부터 올해 5월 초까지 무려 433,000개의 뉴스 기사가 ‘chatgpt’라는 검색어에 걸렸다. 뉴스 업계에서 광고 기사 1개 내는데 지불해야하는 비용을 감안하면 수십조원의…