처참했던 실패 딛고 다시 ‘생성형 AI’ 시장 뛰어든 IBM, 불붙은 경쟁
고비용 문제로 처참히 실패했던 ‘왓슨’ 살리기, IBM이 택한 방법은 ‘LLM’ 파운데이션 모델 ‘왓슨X’, 특화 모델을 통한 비용 절감으로 재도약 노린다 점차 치열해지는 AI 시장 경쟁, 쟁쟁한 글로벌 빅테크 ‘기술 확보’에 총력
한때 ‘AI 강자’로 불렸던 IBM이 생성형 AI 시장에 뛰어들었다. 9일(현지 시간) IBM은 연례 기술 콘퍼런스인 ‘씽크 2023’에서 AI 및 데이터 플랫폼 ‘왓슨X(WatsonX)’를 발표했다. 과거 고비용 문제로 실패했던 AI 사업 ‘왓슨’, ‘왓슨 헬스’ 등을 뒤로 하고, LLM(거대언어모델) 및 특화 모델을 통해 비용을 절감하며 재도약에 나선 것이다.
AI를 통한 ‘비상’을 꿈꾸는 것은 왓슨뿐만이 아니다. 쟁쟁한 글로벌 빅테크 기업들이 생성형 AI 시장에 뛰어들며 시장 경쟁은 꾸준히 심화하는 추세다. 구글은 최신 LLM을 공개를 예고하고 나섰으며, 메타는 이미지뿐만 아니라 소리·심도·움직임 등 6가지 정보를 결합할 수 있는 멀티모달 AI 모델 ‘이미지바인드'(ImageBind)을 공개했다.
IBM, LLM으로 왓슨에 ‘산소호흡기’ 달았다
‘챗GPT’ 열풍 이후 생성형 AI를 둘러싼 경쟁이 치열해지는 가운데, 기술 발전으로 LLM이 가시적인 성과를 보이기 시작했다. LLM은 방대한 양의 텍스트 데이터를 학습해 대화, 자연어 입력 등에 대해 인간과 유사한 응답을 생성하는 모델이다. LLM이 AI 시장에서 본격적으로 두각을 드러내자, 이를 활용해 기존 실패를 겪은 AI 모델에 ‘산소호흡기’를 달아주는 기업도 등장했다. IBM의 왓슨X가 대표적인 사례다.
과거 IBM은 자체 개발 인공지능 왓슨을 선보이며 AI 시장의 선두 주자로 떠오른 바 있다. 당시 왓슨은 2011년 미국 퀴즈쇼 ‘제퍼디’에서 인간 챔피언을 꺾고 우승하는 등 세간의 주목을 한 몸에 받기도 했다. 하지만 IBM은 고비용 문제 등에 부딪혀 수익성을 확보하지 못했고, 결국 왓슨은 ‘돈 먹는 하마’라는 오명을 쓰며 상용화에 실패했다. 이어 2015년 출시 후 약 40억 달러의 비용이 투입된 의료용 AI 사업부 왓슨 헬스도 지난해 초 매각 절차를 밟았다.
그러나 IBM은 AI 사업의 ‘희망의 끈’을 놓지 않았다. 챗GPT로 시작된 생성형 AI 열풍을 딛고 왓슨의 부활을 선언한 것이다. IBM이 최근 발표한 왓슨X는 인공지능(AI) 모델을 훈련하고 사용할 수 있는 기업용 AI 플랫폼이다. 회사 내부 정보 유출 방지를 위해 자체 구축한 AI 모델을 적용하고자 하는 대기업 고객의 수요를 본격적으로 겨냥했다.
IBM은 기업의 AI 모델 구축에는 신뢰할 수 있는 데이터, 속도, 거버넌스를 기반으로 AI 모델을 학습·조정할 수 있는 기술과 서비스가 필요하다고 설명했다. 왓슨X는 이 같은 과정 전반을 지원하는 ‘파운데이션 모델’이다. 파운데이션 모델은 다양한 서비스에 사용하기 위해 개발되고, 방대한 양의 데이터를 사용하여 학습된 다목적 모델을 일컫는 용어다. 아직 명확하게 수행해야 할 작업이 특정되지 않은 상태로 배포되어 수요자들이 필요에 맞게 조정·사용할 수 있다는 특징이 있다.
‘특화 모델’로 비용 절감, 재도약 꿈꾼다
IBM이 다시 한번 AI 시장에 도전할 수 있었던 배경으로는 LLM과 특정 분야 데이터로 훈련된 ‘특화 모델’이 꼽힌다. 최근 시장의 화제가 된 챗GPT처럼 광범위한 데이터를 학습시키고 처리할 수 있는 모델을 개발하기 위해서는 대규모의 기술 비용이 필요하다. 하지만 특정 분야 데이터로 훈련된 특화 모델의 경우 비교적 적은 비용으로 특정 수요에 맞춘 고성능의 서비스를 제공할 수 있다.
실제 크리슈나 IBM 회장 겸 CEO는 “왓슨X의 파운데이션 모델을 통해 AI 도입을 훨씬 더 쉽게 확대할 수 있을 뿐만 아니라 효율적인 비용으로 구축해 제공할 수 있다”고 설명했다. 거대 언어모델을 채택하고 특화 모델을 마련해 왓슨X에 투입되는 비용을 줄인 만큼, 고비용 문제로 인해 고배를 마셨던 왓슨과 왓슨 헬스 대비 성공 가능성이 크다고 판단한 것이다.
IBM의 왓슨X는 언어, 코딩, 지구공간 정보 등 총 7개 분야에서 사전에 훈련한 모델을 지원한다. 언어 모델(fm.model.NLP)은 화학 산업 분야에 특화한 자연어처리 도구이며, 코딩 모델(fm.model.code)은 깃허브의 ‘코파일럿’과 유사하게 사용자가 자연어로 명령하면 코드를 생성하는 도구다. 지구공간 정보 모델(fm.model.geospatial)은 미 항공우주국의 데이터를 기반으로 구축되어 자연재해 패턴 및 생물 다양성 분석 등에 특화돼 있다.
IBM뿐만 아니라 수많은 기업이 특정 분야에 특화된 AI 모델을 제공하고 있다. 일례로 미국 블룸버그(Bloomberg)는 광범위한 금융 데이터를 기반으로 특별히 트레이닝된 ‘BloombergGPT’를 개발 중이다. 금융 영역에 AI 기술을 도입하기 위해서는 금융 시장 특유의 복잡성과 고유한 용어를 이해할 수 있는 특화 모델이 필요하다고 판단한 것이다. 미국 법률 소프트웨어 전문업체인 패스트케이스는 100개 이상의 국가에서 수집한 10억 개 이상의 법률 관련 문서로 라이브러리를 구축, 법률 분야에 특화한 LLM을 개발해 110만 명에 달하는 미국 변호사에게 제공할 계획이라고 밝히기도 했다.
치열해지는 빅테크 기업의 ‘생성 AI 경쟁’
AI 기술 경쟁이 점차 치열해지는 가운데, 글로벌 빅테크 기업들도 기술 확보에 박차를 가하는 추세다. 메타는 새로운 오픈소스 AI 모델 ‘이미지바인드'(ImageBind)의 연구 논문을 공개했다. 이미지바인드는 △시각적 데이터(이미지·비디오) △열화상(적외선 이미지) △텍스트 △오디오 △3D 심도 △관성측정장치(Inertial Measurement Units, IMUs) 등 6가지 유형의 데이터를 하나의 임베딩 공간에 결합하는 최초의 AI 모델이다.
일례로 메타의 AI 이미지 생성 도구 ‘메이크어신’은 이미지바인드를 활용해 열대 우림 소리나 혼잡한 시장 음성을 기반으로 이미지를 생성하는 등 ‘오디오가 포함된 이미지’를 만들 수 있다. 향후 메타는 촉각, 화법, 후각, 뇌 fMRI(자기공명영상) 신호 등 다양한 감각을 연결해 AI가 인간처럼 다양한 정보를 동시에 학습할 수 있도록 하겠다는 계획이다. 메타는 “(이미지바인드는) 모든 유형의 데이터로부터 학습하는 멀티모달 AI 시스템을 만들기 위한 노력의 일환”이라며 “3D 및 IMU 센서를 결합해 몰입형 가상 세계를 설계하는 등 새로운 시스템을 개발할 수 있다”고 설명했다.
구글은 10일~11일(현지 시간) 개최되는 개발자 대회(I/O)에서 오픈AI의 GPT-4에 대항할 차세대 LLM ‘팜2(PaLM2)’를 공개한다. 팜2는 지난해 4월 출시된 팜(PaLM)’의 업그레이드 버전으로, 광범위한 코딩 작업을 수행하거나 복잡한 수학 문제를 해결하는 등 한층 고도화된 기능을 갖춘 것으로 전해졌다. 또한 구글은 바드의 멀티모달 버전인 ‘멀티바드’ 개발을 진행 중이며, 마이크로소프트의 ‘MS 365 코파일럿’에 대항할 업무용 AI 도구 ‘구글 워크스페이스 AI 콜라보레이터(collaborator)’의 발표도 앞두고 있다.
챗GPT 열풍 이후 생성 AI 시장은 빠른 속도로 발전해 나가는 양상이다. 스타트업은 물론 글로벌 빅테크 기업까지 시장 흐름에 편승하기 위해 기술 개발에 총력을 기울이는 가운데, 과거 AI 강자로 불리던 IBM의 참전은 시장에 또 다른 긴장감을 불러일으켰다. 점차 치열해지는 생성 AI 경쟁의 승기를 붙잡는 것은 과연 누구일까. 업계는 하루가 다르게 급변하는 시장 상황에 촉을 바짝 곤두세우고 있다.