‘머신러닝계 깃허브’ 허깅페이스, 구글·아마존 등 투자 안고 ‘6조원 가치’ 급성장

구글·엔비디아·아마존 등 줄줄이 눈독, 허깅페이스 3,100억원 대규모 투자 유치 AI 오픈 소스 제공하며 고객 끌어모아, MS 등 유료 서비스 고객사도 ‘쟁쟁’ ‘8조원’ 대박 친 깃허브 연상케 하는 모델, 줄줄이 실리는 시장 기대

160X600_GIAI_AIDSNote
사진=허깅페이스

오픈 소스 인공지능(AI) 플랫폼을 운영하는 허깅페이스가 2억3,500만 달러(약 3,100억원) 규모의 투자를 유치했다. 미국 정보기술(IT) 매체 테크크런치는 24일(현지 시간) 허깅페이스가 최근 구글과 엔비디아, 아마존, 퀄컴, 세일즈포스, 인텔, AMD, IBM 등이 참여한 투자 유치에 성공했다고 보도했다. 최근 들어 허깅페이스가 ‘머신러닝계 깃허브(GitHub)’라고 불리며 이름을 알리고 있는 만큼, 투자자들 역시 깃허브와 유사한 형태의 성공을 기대하고 있는 것으로 풀이된다.

AI ‘오픈 소스’의 중심지?

허깅페이스는 오픈 소스 기반의 12만 개 이상의 AI 모델과 코드, 2만 개 이상의 데이터셋을 공유하고, AI 모델을 쉽게 실행할 수 있는 다양한 도구를 제공한다. 특히 올해 메타의 ‘라마2’, UAE의 ‘팰컨’ 등 인기 모델이 줄줄이 공개되고, 이를 미세 조정한 소규모 LLM(sLLM)이 업로드된 이후 허깅페이스는 ‘오픈 소스 AI의 메카’로 주목받기 시작했다.

지난해부터는 ‘엔터프라이즈 허브(Enterprise Hub)’ 플랫폼을 이용해 유료 서비스를 제공 중이며, 마이크로소프트(MS), 인텔, 이베이 등 1,000개 이상의 기업 고객을 유치하는 데 성공했다. 기업은 엔터프라이즈 허브를 이용해 내부 허깅페이스 환경을 구축할 수 있다. 개발자는 해당 환경에서 AI 모델 및 관련 도구에 액세스할 수 있으며, 상용 서비스인 ‘오토트레인(AutoTrain)’를 사용해 프로젝트에 가장 적합한 오픈소스 AI 모델을 자동으로 찾을 수 있다. 이렇게 생성한 AI 모델을 AI 모델 호스팅을 위한 관리형 클라우드 ‘인퍼런스 엔드포인트(Inference Endpoints)’에 업로드할 수도 있다.

이외에도 허깅페이스는 오픈소스 언어모델을 구축하기 위한 ‘빅사이언스(BigScience)’ 프로젝트를 통해 다국어 언어모델 ‘블룸(Bloom)’을 내놨으며, 서비스나우와 협력해 오픈소스 코드 생성 AI 모델 ‘스타코더(StarCoder)’를 출시했다. 이 밖에도 엔비디아와의 협력을 통해 LLM과 AI 애플리케이션을 구축하는 개발자에 ‘DGX 슈퍼컴퓨팅 클라우드’를 제공하는 등 서비스 범위를 점차 확장해나가는 추세다.

사진=허깅페이스

구글, 엔비디아, 아마존 등 줄줄이 투자

오픈AI, 코히어 등 주요 글로벌 AI 스타트업이 AI 기술을 영업비밀로 보호하고 고객들에게 이용료를 부과하는 가운데, 허깅페이스는 과감히 ‘오픈 소스’ 원칙을 내세우며 소비자의 이목을 끌었다. 오픈AI의 챗GPT, 메타의 라마 등 대부분의 대규모 언어 모델이 텍스트 생성에 초점을 두고 있는 반면, 허깅페이스는 △음악·이미지를 생성 △번역 △이미지 내 물체 식별 등 폭넓은 AI 모델을 서비스하고 있다는 점도 특징이다.

허깅페이스는 현재까지 총 3억9,520만 달러(약 5,232억원) 규모 투자를 유치하며, 코히어(4억3,500억 달러), 어뎁트(4억1,500만 달러)의 뒤를 잇는 신예 강자로 떠올랐다. 기업가치는 45억 달러(약 6조원)까지 뛰었으며, ‘거물급’ 투자자 라인업을 구축하는 데에도 성공했다. 실제 구글과 엔비디아, 아마존, AMD, 인텔, IBM, 퀄컴, 세일즈포스 등 AI 개발에 열을 올리는 테크 기업들이 줄줄이 허깅페이스의 가능성에 주목하고 있다.

지난 2월에는 아마존과 파트너십을 구축하기도 했다. 당시 아마존 클라우드 사업부는 인공지능 스타트업 허깅 페이스(Hugging Face Inc)와 파트너십을 확대, ‘챗GPT의 라이벌’을 개발 중에 있다고 전했다. 실제 아마존 웹 서비스(AWS)는 오픈AI의 챗GPT 기술과 경쟁할 수 있는 언어 생성 도구가 포함된 허깅 페이스의 제품을 자체 애플리케이션의 구성 요소로 추가했다.

사진=허깅페이스

제2의 깃허브 될 수 있을까?

이외에도 허깅페이스는 트랜스포머 기반의 다양한 모델(transformer.models)과 학습 스크립트(transformer.Trainer)를 구현해 놓은 모듈을 제공한다. 쉽게 사용할 수 있는 형태의 오픈소스로 개발자의 업무 부담을 덜고, 허깅페이스를 통해 업무 효율성을 제고할 수 있도록 지원하는 것이다.

이 같은 사업 모델은 세계 최대 오픈소스 코드 공유 플랫폼 ‘깃허브’를 연상케 한다. 실제 업계에서 허깅페이스를 ‘머신러닝을 위한 깃허브’라고 칭할 정도다. 깃허브는 세계 각지의 개발자들이 소프트웨어를 만들기 위한 소스코드를 공유·저장하는 클라우드 공간으로, 2018년 MS가 75억 달러(약 8조원) 상당의 MS 주식을 지급하는 조건으로 인수한 바 있다.

MS는 깃허브 인수를 통해 윈도우 운영체제(OS)를 오픈소스 위주로 전환할 동력을 얻었으며, AI 제품 개발 과정에서도 깃허브 데이터의 도움을 받을 수 있게 됐다. ‘IT 거물’들이 줄줄이 허깅페이스에 대해 기대를 거는 점 역시 역시 깃허브의 성공과 관련돼 있는 것으로 보인다. 쏟아지는 대규모 투자는 차후 허깅페이스가 AI 시장에서 깃허브와 유사한 입지를 확보할 것이라는 일종의 기대인 셈이다.