[기자수첩] LLM 모델 오픈 소스화 결정한 메타, 개발자들이 좋아할까?
메타, 챗GPT 경쟁자인 LLaMA 모델 오픈소스로 푼다 일반 사용자는 늘어나도 기업 사용자들 오히려 줄어들 것이라는 전망 AI 업계 관계자들, 사실상 MS, 구글에 패배 선언한 것으로 봐야 한다
15일(현지 시간) 페이스북과 인스타그램을 운영하는 대형 SNS기업인 메타가 자사의 대형언어모델(LLM)인 라마(LLaMA)를 오픈소스로 풀겠다고 발표했다.
오픈AI를 낀 마이크로소프트(Microsoft, MS)가 챗GPT로 선풍적인 인기를 끌고, 이어 구글이 바드(Bard)를 출시하면서 경쟁이 격화된 상황이지만, 메타는 자사의 모델로 MS와 구글과 수익성 경쟁에 뛰어드는 대신 오픈소스 전략을 취하겠다는 것이다.
오픈소스 전략, 성공을 위한 척도는 일반 사용자가 아니라 기업 사용자
올해 초부터 챗GPT의 성공으로 LLM 모델이 선풍적인 인기를 끌자 메타는 오픈소스 전략을 고수해 왔다. MS와 구글이 많은 비용을 들여 영어 이외의 다른 언어에 대응할 수 있도록 모델을 학습시키고, 대응할 수 있는 주제를 다양화하기 위해 데이터 입력에 주력했던 반면, 메타는 학계에서 LLM 모델을 이용해 학술적인 활동이 확장되는 데 도움을 주겠다는 태도를 취해 왔다.
오픈소스화를 선언했던 올해 2월부터 6월까지 학계에서 나온 대부분의 논문은 모두 메타의 LLM 모델을 활용했고, 개발자 커뮤니티에서 활용되는 예시도 메타의 LLM 모델을 기반으로 하고 있다. 오픈소스로 서비스를 공개한 덕분에 사용자를 모으는 데는 성공한 것이다.
그러나 IT 개발자들은 서비스 운영에 들어가는 수익성이 나지 않는 오픈소스들이 결국에는 상용 소프트웨어에 뒤처쳤던 각종 사례들과 경험담으로 공유하면서, 결과적으로는 사용자만 많고 기업에서는 쓰지 않는 서비스로 전락할 것이라 우려하는 분위기다.
실제로 이미지 편집 소프트웨어 중 유명세를 타고 있는 김프(Gimp)보다 포토샵(Photoshop)의 서비스가 더 좋고, 블렌더(Blender)보다 3D맥스, 모도(Modo) 등의 고가 서비스들이 훨씬 더 뛰어나다. 게임 개발에 쓰이는 유니티(Unity) 엔진도 고도(Godot) 엔진과 비교 대상이 아니다. 명품에 비유하자면 그럴싸하게 흉내 낸 모조품과 진품의 차이만큼 격차가 난다는 것이다. 메타가 내놓은 LLaMA도 영어에 제한돼 있는 데다, 학습시킨 지식의 범위도 좁다.
일반 대중을 위해 풀어놨다는 관점에서 응원해야 할 것이 아니라, 경쟁에서 뒤처진 상태에서 추격을 포기하고 회사 홍보에 쓰는 도구로 활용했다는 것이 더 적절한 분석이 될 것이다.
오픈소스 이용에 따른 각종 피해는?
개발자 커뮤니티들에서는 메타가 대기업인 만큼 오픈소스 유지 관리에 들어가는 인건비를 당분간은 부담할 수 있겠지만, 장기간 부담하지 않을 경우 결국에는 오픈소스로 만들어진 시스템을 나중에 다시 챗GPT나 바드 등을 이용해 만들어야 한다는 점을 지적한다. 인력 투입이 적은 만큼 기술 지원도 부족하고, 코드가 공개된 탓에 보안이 취약할 수밖에 없는 점도 지적된다. 이어 지적재산권이 없는 서비스가 되는 탓에 오픈소스를 기반으로 만든 자사의 서비스에 대한 지적재산권도 주장할 수 없게 된다.
오픈소스 세계에는 엄격한 제약이나 감독이 존재하지 않기 때문에 개발자를 관리할 관리자도, 실력 있는 인재를 뽑을 수 있는 면접도 없다. 이렇다 보니 개발자들 사이에서는 오픈소스 커뮤니티에서 유명한 인사는 오히려 실력이 없는 개발자일 가능성이 높다고 백안시하는 분위기다. 주류가 되지 못한 ‘숙련 개발자’들이 ‘기여’할 수는 있지만, 실제 상용 서비스와는 엄청난 격차가 있을 수밖에 없다는 것이다.
각종 문제가 산적한 만큼, 기업들이 오픈소스를 일시적으로는 쓸 수 있을지 몰라도 장기적으로는 오픈소스를 피할 것이라는 분석도 나온다. 메타가 오픈소스화를 성공시키기 위해서는 홍보 관점을 넘어 시장 장악을 위해 막대한 비용을 들여 현재의 LLaMA 모델을 챗GPT나 바드를 따라잡는 수준으로 끌어올려야 할 것이라는 언급이 나오는 이유이기도 하다.
사실상 메타의 LLM 시장 패배 선언?
메타가 시장에 오픈소스로 공급해 개발자들 사이에서 인기 플랫폼으로 자리 잡은 경우는 자바스크립트(JavaScript)를 기반으로 한 프론트 엔드 개발용 언어인 리액트(React)가 거의 유일하다. 리액트의 성공에 힘입어 안드로이드폰과 아이폰 모두에서 동작 가능한 크로스 플랫폼 개발 언어인 리액트 네이티브도 시장에 공급했으나, 각자의 플랫폼에서 만든 것 대비 문제가 발생해 개발자들 사이에서 선호되는 플랫폼이 아니다. 개발자들은 리액트의 성공을 고급 기능과 다양한 종류의 예시 코드 공급이라고 입을 모은다. 결국 개발자들 사이에서 하나의 플랫폼 언어가 인기를 얻기 위해서는 기존 플랫폼으로 할 수 없는 고급 기능을 ‘무료’로, 그것도 수많은 경우의 수를 다 대응해 줘가면서 풀어야 하는 셈이다.
업계에서는 메타가 LLM 시장에서 패배했다는 선언을 돌려서 표현한 것이라는 주장도 나온다. 수익성 모델을 확보하고 시장에서 경쟁할 수 있는 인력, 홍보 등의 관점에서 따라잡는 데 필요한 비용을 투입하기 어렵다는 판단 아래 학문적인 이용을 위해 쓴다는 방식으로 회사의 이미지 홍보에 쓰겠다는 전략으로 볼 수 있기 때문이다.
실제로 메타는 2016년에 시계열 예측을 위해 쓰이는 ‘프로펫(Prophet)’ 알고리즘을 공개해 한 차례 주목을 받은 바 있으나, 대학교 학부 고학년 수준 정도의 시계열 모델 코드에 불과하다는 지적을 받았고, 일반 활용도가 매우 낮은 탓에 시장에서 더 이상 쓰이지 않게 됐다. 데이터 과학 업계 전문가들은 SPSS 등의 고가 상용 프로그램들도 일반화된 시계열 예측을 지원할 수 없어 결국에는 고급 통계학 훈련을 받은 인력이 작업해야 하는 사안을 단순히 코드로만 풀어낼 수 있다는 안이한 생각을 한 것 자체가 당시 메타의 기술 역량을 보여주는 것이라는 뼈아픈 지적을 한 적도 있었다. AI 업계 관계자들은 이번 오픈소스 선언 이후 LLM 시장은 MS와 구글의 격전장으로 압축될 것으로 전망한다.