[해외 DS] 스탠퍼드대 'AI 인덱스 2024' 발표, 대규모 기반 모델의 개발 열풍으로 2023년 8배나 급증한 생성형 AI 투자

지난해 생성형 AI 252억 달러 유치, 기존과는 차원이 다른 투자 규모 기록해
주로 기반 모델 학습 비용 증가와 고성능 컴퓨팅 자원에 대한 수요 증가에 대응하기 위해 사용돼
미국 주요 분야에서 압도적인 우위를 점하고 있지만, 중국 일부 영역에서 빠르게 추격하고 있어

미국 스탠퍼드대학의 인간중심 인공지능연구소(HAI) 2024 AI 인덱스 보고서에 의하면, 지난해 생성형 AI 기업들의 펀딩이 8배 증가하여, 총 252억 달러에 달했다고 한다. 오픈AI와 코히어 등 주요 AI 기업들이 대규모 투자 유치에 성공한 까닭이다.

작년의 주요 투자 사례로는 마이크로소프트의 100억 달러 규모의 오픈AI 계약, 코히어의 2억 7천만 달러 투자 유치, 미스트랄의 4억 1천5백만 달러 투자 유치 등이 있다. 또한 이 보고서에 따르면 2023년 전체 AI 관련 민간 투자의 4분의 1 이상을 생성형 AI가 차지한 것으로 나타났다.

Standford HAI 1 20240429 — 사진=Standford HAI

그러나 AI에 대한 기업들의 지출이 지난해 20% 감소한 1,892억 달러였다고 보고서는 지적했다. 2022년 대비 31.2% 줄어든 인수합병 감소가 그 원인으로 꼽혔는데, 이러한 감소에도 불구하고 포춘 500대 기업의 실적발표 중 80%가 AI를 언급한 바 있다.

미국 AI 투자 우위 확실, 반도체는 중국 추격 속도 빨라져

투자는 미국 기업들이 주도했다. 중국이 78억 달러를 투자한 것과 비교할 때, 미국은 거의 9배 많은 672억 달러를 투자하였다. 아울러 2022년 대비 2023년에는 중국과 EU의 AI에 대한 민간 투자는 감소한 반면, 미국은 22.1% 증가했다.

Standford HAI 2 20240429 — 출처=Standford HAI

안면 인식을 제외한 모든 AI 기술 부문에서 가장 많은 지출을 한 국가 역시 미국이었지만, 중국은 안면 인식 분야에 1억 3천만 달러를 투자해 미국의 9천만 달러를 크게 앞서며 압도적인 1위를 차지했다.

반도체 부문 지출 또한 미국이 7억 9,000만 달러를 기록하면서 1위를 차지했지만, 중국이 6억 3,000만 달러로 미국 뒤를 바짝 쫓고 있다. 특히 중국은 미국의 대중 반도체 수출 통제 규제 강화에 맞서 반도체 지출을 크게 늘리고 있는 것으로 보인다.

미국의 AI 투자는 급여에도 영향을 미쳤다. HAI의 보고서는 개발자 전용 질의응답 사이트 ‘스택오버플로'(Stack Overflow)의 설문조사 수치를 인용했는데, 이 조사에 따르면 AI 직무의 연봉이 다른 나라에 비해 미국에서 상당히 높은 것으로 나타났다.

예를 들어 지난해 미국 하드웨어 엔지니어의 평균 연봉은 14만 달러지만, 전 세계 평균 연봉은 8만 6,000달러였다. 클라우드 인프라 엔지니어의 글로벌 평균은 10만 5,000달러인 반면, 미국에서는 18만 5,000달러를 기록했다.

한편 글로벌 관점에서 2023년에 가장 많은 투자를 유치한 분야는 AI 인프라, 연구 및 거버넌스로 183억 달러였다. 이 중 상당액은 오픈AI와 엔트로픽과 같은 기업들이 ‘GPT-4 터보’와 ‘클로드 3’ 같은 대규모 애플리케이션을 개발하는 데 사용됐다고 한다.

자연어 처리와 고객 지원에 81억 달러를 지출한 것이 두 번째로 큰 비용 분야로, 많은 기업들이 고객 센터 자동화와 같은 반복적인 작업을 효율적으로 관리할 수 있는 솔루션에 관심을 기울이고 있다.

자금의 주 사용처, 대규모 기반 모델 구축

AI 인덱스 보고서에 따르면 오픈AI와 같은 회사가 수백만 달러의 자금을 조달해 새로운 모델을 훈련하는 데 막대한 비용을 지출하고 있다고 한다.

특히 고급 AI 모델 학습 비용이 지난해부터 많이 증가했는데, 스탠퍼드의 연구원들은 이 증가가 대규모 기반 모델(foundation model) 구축에 대한 투자 때문이라고 밝혔다.

예를 들어 오픈AI는 GPT-4 모델을 훈련하는 데 약 7,800만 달러, 구글의 주력 모델인 제미나이는 약 1억 9,100만 달러가 필요했다.

Standford HAI 3 20240429 — 출처=Standford HAI

이전 모델들의 개발 비용과 비교하면 충격적인 수치다. 2017년에 출시된 트랜스포머 모델은 훈련 비용이 약 900달러, 2019년 출시된 페이스북의 RoBERTa 대형 시스템은 약 160,000달러였다.

물론 모델 개발자는 모델 훈련 비용에 대한 구체적인 수치를 거의 공개하지 않는다. 이에 따라 HAI는 미국 AI 연구기관 에포크(Epoch)와의 협력을 통해 훈련 비용의 추정치를 산출했으며, 이는 관련 기술 문서와 보도 자료에 나타난 정보를 기반으로 훈련 기간, 사용된 하드웨어의 종류, 품질 및 사용 정도를 분석하여 얻은 결과라고 전했다.

학습 비용이 증가했을 뿐만 아니라, 컴퓨팅 자원에 대한 수요도 덩달아 상승했다. 2017년 구글의 트랜스포머 모델은 훈련에 약 7,400페타플롭이 필요했지만, 7년 후 제미나이 울트라는 500억 페타플롭이 필요했다.

Standford HAI 4 20240429 — 출처=Standford HAI

이렇게 자본과 전력 집약적인 시스템의 발전은 학계에 새로운 문제를 야기하고 있다. 제미나이 울트라와 같은 시스템을 운영하는 데 드는 막대한 비용으로 인해 학계에서 접근이 점점 더 어려워지고 있기 때문이다.

“선도적인 AI 모델에 대한 산업 지배력 증가는 작년 AI 지수 보고서에서 처음 강조됐다. 올해에는 그 격차가 다소 좁혀지긴 했지만, 이러한 추세는 여전히 지속되고 있다”고 보고서는 명시했다.

텍스트 넘어 이미지·동영상까지, 멀티모달 AI 시대 도래

구글은 2019년부터 40개의 모델을 발표해 가장 많은 기반 모델을 공개한 기업이 되었다. 오픈AI는 20개로 2위를 차지했고, 비서구권 기관 중에서는 중국의 칭화대학교가 7개의 AI 모델을 공개하며 가장 많았다.

또한 지난해 공개된 대규모 AI 시스템의 대부분은 미국에서 109개로 가장 많았다. 중국 기관이 2위를 차지했지만 20개에 불과했다. 스탠퍼드대 보고서는 2019년을 기점으로 미국이 AI 모델 생산을 선도하고 있다고 한다.

마지막으로 보고서에서 강조된 한 가지 중요한 성장 추세는 텍스트뿐만 아니라 이미지나 동영상을 처리할 수 있는 멀티모달 AI 모델·시스템의 수가 증가하고 있다는 점이다.

이에 HAI의 연구 프로그램 책임자 바네사 팔리(Vanessa Parli)는 “올해에는 다양한 분야에서 활약할 수 있는 모델들이 더욱 많아질 것으로 예상된다”고 말했다. “이 모델들은 텍스트를 입력받아 오디오를 생성하거나, 이미지에 대한 설명을 만들어낼 수 있다. 개인적으로 가장 흥미로운 AI 연구 분야는 이러한 대규모 언어 모델을 로봇이나 자율 에이전트와 결합해, 로봇이 현실 세계에서 더욱 효율적으로 작동하도록 하는 데 있어 중대한 발전을 이루는 것이다”고 그녀는 덧붙였다.

[해외 DS] 고대 헤르쿨레니움 두루마리를 해독한 AI 경진대회 ②, 베수비오 챌린지의 주요 과제와 어려움

Kwangjae Kim 2024-03-25 17:142024-04-19 해외AI/DS소식

베수비오 챌린지에서 가장 중요한 두 작업, 분할과 잉크 감지 분할 과제의 어려움, 깨끗한 표면 추출에 많은 시간 할애 잉크 감지 모델의 한계, 양질의 학습 데이터 부족 [해외 DS] 고대 헤르쿨레니움 두루마리를 해독한 AI 경진대회 ①, 베수비오 챌린지의 시작과 그 비하인드에서 이어집니다. 기원 79년 베수비오 화산 폭발로 손상되고 변형된 헤르쿨라네움의 수백 개의 파피루스 두루마리는 고대로부터 현재까지…

[해외 DS] 워런 버핏의 특이한 주사위 게임, “아니야 네가 먼저 던져”

Senior Analyst Taesun Lee 2023-09-20 09:002024-04-28 해외AI/DS소식

[해외DS]는 해외 유수의 데이터 사이언스 전문지들에서 전하는 업계 전문가들의 의견을 담았습니다. 저희 데이터 사이언스 경영 연구소 (MDSA R&D)에서 영어 원문 공개 조건으로 콘텐츠 제휴가 진행 중입니다. 워런 버핏은 빌 게이츠에게 특이한 주사위 게임을 제안한 적이 있다. 버핏은 테이블 위에 주사위 4개를 놓고 규칙을 설명했다. 각자 주사위를 하나씩 골라 여러 번 굴려서 더 높은 숫자가 많이…

[해외 DS] AI 챗봇의 불가피한 환각 문제, 사실 확인 시스템과 맞춤형 AI 모델 개발로 대응해야

Senior Analyst Taesun Lee 2024-04-08 18:202024-04-19 해외AI/DS소식

AI 환각, 모델은 현실과 일치하지 않는 응답을 생성할 수 있어기술적 문제, 개발 방식, 기대치 차이 등이 원인사실 확인 시스템 개발 및 전문화된 시스템 구축 등이 방법 [해외DS]는 해외 유수의 데이터 사이언스 전문지들에서 전하는 업계 전문가들의 의견을 담았습니다. 저희 데이터 사이언스 경영 연구소(GIAI R&D Korea)에서 콘텐츠 제휴가 진행 중입니다. 생성형 AI 모델이 현실과 일치하지 않는 응답을 생성하는…

[해외 DS] AI와 인간의 예술 콜라보, 관객 참여᛫몰입 강화한다 (3)

Kwangjae Kim 2023-10-27 09:002024-04-19 해외AI/DS소식

레픽 아나돌은 NFT 시장을 단순히 유통 채널로 취급하지 않았다. 관객 참여와 몰입의 연속성을 위해 작품을 만들었고 NFT 작품으로써 최초로 유네스코 세계 문화유산에 등재됐다. 유구한 역사와 전통이 있는 한국도 RAS와 같은 아트 프로젝트를 만들 가능성이 무궁무진하다. 이미 여러 채널로 증명된 K-콘텐츠의 잠재력에 힘입어 K-아트도 널리 퍼져나가길 고대한다.

[해외 DS] 인공지능이 의식을 갖게 되면 무엇으로 판별할 수 있을까?

Senior Analyst Taesun Lee 2023-08-31 09:002024-05-15 해외AI/DS소식

[해외DS]는 해외 유수의 데이터 사이언스 전문지들에서 전하는 업계 전문가들의 의견을 담았습니다. 저희 데이터 사이언스 경영 연구소 (MDSA R&D)에서 영어 원문 공개 조건으로 콘텐츠 제휴가 진행 중입니다. SF 소설에서는 인공지능이 의식을 갖는 설정을 오랫동안 다뤄왔다. 1968년 영화 ‘2001 스페이스 오디세이’에서 슈퍼컴퓨터 악당 HAL 9000이 대표적인 예다. 인공지능의 급속한 발전으로 이러한 가능성은 점점 더 현실화하고 있으며, 업계 리더들도…

[해외 DS] MIT·Google, ‘합성 이미지’를 사용하여 이미지 생성 모델 훈련

Kwangjae Kim 2023-11-28 17:092024-04-19 해외AI/DS소식

텍스트-이미지 생성 모델을 합성 이미지로 학습시키면 더 현실적인 이미지를 생성할 수 있다는 연구 결과가 발표됐다. MIT와 구글 연구팀은 ‘다중양성대조학습’ 방법을 사용하여 StableRep이라는 모델을 개발했다. StableRep은 이미지넷 분류에서 76.7%의 선형 정확도를 달성했으며, CLIP보다 우수한 성능을 보였다. 단점으로는 이미지 생성 속도가 느리고 데이터에 내재한 편견을 여전히 해결하지 못한다는 점들을 꼽을 수 있다.