Skip to main content

중국에서 만들었다는 LLM 모델이 전세계 시장을 강타하고 있다. 서비스 이름은 '딥시크(DeepSeek)'다.

그간 LLM 분야에서 가장 선두주자였던 오픈AI가 이름만 '오픈'이지 실제로는 소스 코드도 공개 안 하고, 누적 투자금 178억 달러 (2024년 12월 기준)에 달하는 천문학적인 투자금만 들어간 상태에서 수익성을 못 낸다고 각종 비난을 받았는데, 딥시크는 오픈AI의 GPT4 대비 1/18의 비용만으로 만들었다고 말들이 많다.

그간 LLM 모델 학습의 필수라고 알려진 그래픽 카드 기업 엔비디아의 주가는 하루 아침에 17%나 빠졌고, 장기적으로는 더 추락할 것이라는 이야기들이 나온다. 그간 엔비디아에 HBM을 공급한다는 이유로 덩달아 주가 부양이 됐었던 한국의 SK하이닉스 및 협력사들도 동반 주가 폭락을 경험할 가능성이 높다.

그럼 이제 그래픽 카드로 LLM 훈련 시키는 시대는 끝났을까?

요즘 생성형 AI가 뜨면서 신입 개발자, 혹은 실력이 부족한 개발자들을 안 뽑는다는 이야기가 많다.

진작에 개발팀을 없애고 모든 개발을 내 손으로 직접하게 된 내 입장에서 이젠 더 새로운 이야기가 아니기는 하지만, 생성형 AI가 주는 노동시장 충격이라는 관점에서 언론에서 평가하는 이야기를 들어보면 크게 2가지 능력에 대한 요구가 눈에 띄게 강조된다는 걸 확인할 수 있다.

  1. 단순 개발이 아니라 시스템 설계, AI/DS 지식 등등 올라운드 멀티 플레이어를 요구한다
  2. 회사의 다른 업무들과 연계할 수 있는 의사 소통 능력이 매우 강조된다

회사마다 경험치가 다르겠지만, 내 입장에서도 매우 많이 공감이 되는 이야기다. 난 위의 2가지를 묶어서 이렇게 정리하고 싶다.

ChatGPT is to replace not jobs but tedious tasks
For newspapers, 'rewrite man' will soon be gone
For other jobs, the 'boring' parts will be replaced by AI,
Data Science can find correlation but not causality
In stat, no causal but high correlation is called 'Spurious regression'
Hallucinations in LLMs are repsentative examples of spurious correlation

Imagine two twin kids living in the neighborhood. One prefers to play outside day and night, while the other mostly sticks to his video games. After a year later, doctors find that the gamer boy is much healthier, thus conclude that playing outside is bad for growing children's health.

Math in AI/Data Science is not really math, but a shortened version of English paragraph.