[해외 DS] 메타가 새롭게 선보인 ‘오픈 소스’ 기반 대규모 언어 모델 ‘라마 2’, 시장 호응 이끌어낼 수 있을까

라마2, 여타 오픈 소스형 LLM보다 벤치마크 우월 MS와 손 잡고 윈도우 생태계에서 개발자 생산성 크게 올릴 것 기대 오픈 소스라는 ‘개방성’ 전략이 올바른 선택인지는 두고 봐야

160X600_GIAI_AIDSNote

[해외DS]는 해외 유수의 데이터 사이언스 전문지들에서 전하는 업계 전문가들의 의견을 담았습니다. 글로벌AI협회(GIAI)에서 번역본에 대해 콘텐츠 제휴가 진행 중입니다.


Untitled design 1
사진=AI 비즈니스

미국 빅테크 기업 간 대규모 언어 모델(Large Language Model, LLM) 각축전이 한창인 가운데, 이번에는 페이스북의 모회사 메타가 라마2(Llama2)’를 오픈소스로 공개하면서 업계의 눈길을 끌었다. 라마2는 매개 변수의 규모(70억, 130억, 700억)에 따라 세 가지 모델로 배포됐다. 오픈소스 소프트웨어답게, 라마2는 연구, 상업적 용도 등 누구든지 사용할 수 있다.

마크 저커버그의 야심작, ‘라마2’

image 2
모델 크기 및 사전 학습형과 파인 튜닝형으로 분류돼 공개된 라마2./사진=AI 비즈니스

메타 최고경영자 마크 저커버그는 지난 18일 라마2의 두 가지 종류인 ‘사전 학습형(Pre-trained)’, ‘파인 튜닝형(Fined-tuned)’에 대한 모델 가중치 및 소스코드를 모두 공개했다. 사용을 원하는 유저들은 인공지능 모델을 위한 ‘깃허브’ 격인 허깅 페이스(Hugging Face), 및 메타와 AI 파트너십을 맺은 마이크로소프트 어플리케이션을 통해 언제든지 라마2에 접속할 수 있다.

image 1 1
메타가 발표한 라마2의 벤치마크 성능/사진=AI 비즈니스

메타에 따르면 라마2는 지난 2월 출시된 ‘라마1’보다 40% 늘어난 데이터로 학습됐으며, 이에 따라 추론, 코딩 자동 완성 등 대부분의 벤치마크에서 다른 오픈 소스 언어 모델을 능가하는 것으로 알려졌다.

업계 전문가들은 이번 출시된 라마2에 대해 긍정적인 평가를 내린다. 그간 기업 입장에서 생성형 AI 기반 서비스 구축을 위해선 일반적으로 천문학적 자원이 필요해 소위 ‘빅테크 기업’이 아니면 도전하지 못했던 경우가 태반이었는데, 메타의 라마2는 매개변수의 규모를 종류별로 선택할 수 있게 함으로써 신생기업이나 개인 개발자도 생성형 AI에 쉽게 접근할 수 있게 됐기 때문이다.

메타와 손잡은 마이크로소프트, “업무용 애플리케이션 시장 선도하겠다”

한편 마이크로소프트(MS)는 18일(현지시간) 주최된 연례 파트너스 컨퍼런스인 ‘인스파이어 2023’에서 이번 메타의 라마2를 자사 클라우드 서비스인 ‘애저(Azure)’에서 제공할 예정이라고 밝혔다. 사실 이같은 MS-메타 간 연합전선 구축은 이번이 처음은 아니다. 예컨대 지난 2017년 메타의 전신인 페이스북은 AI 오픈 소스 생태계인 ONNX(Open Neural Network Exchange)를 마이크로소프트의 윈도우 체제와 공유한 바 있다.

그러나 이번 합작은 최근 불어오는 ‘생성형 AI 열풍’과 맞물리면서 보다 큰 의미를 갖는다. 앞서 MS는 챗GPT 개발사인 오픈AI와 전략적 파트너십을 맺고 LLM 기반 MS365를 출시한 바 있는데, 이번에는 라마2를 MS 서비스 포트폴리오에 추가로 담게 된 모양새다. 이에 따라 전문가들 사이에선 오픈AI에 집중된 생성형 AI 시장이 이제는 메타를 비롯한 다양한 경쟁사들에 의해 점차 다변화될 것이라는 예측이 나온다.

또한 AI 업계에선 이에 따라 개발자가 ‘마이크로소프트’라는 하나의 생태계 안에서 일관적인 워크플로우를 기대할 수 있게 됐다는 호평이 일색이다. 이와 관련해 실리콘 밸리 현업 프로그래머 A씨는 “라마2가 MS 애플리케이션의 편리한 연동성에 힘입어 윈도우 운영체제에서 로컬로 실행될 수 있게 됐다”며 “이를 통해 AI 관련 업무 생산성을 크게 제고할 수 있을 것으로 기대한다”고 밝혔다.

메타, “책임 있는 AI 개발 놓치지 않았다”

최근 미 당국이 AI 빅테크 기업들을 대상으로 프로덕트・서비스 출시 전 대내외적으로 보안 테스트를 철저히 할 것을 당부한 가운데, 메타 역시 이를 염두에 두고 라마2의 안정성 제고에 심혈을 기울인 것으로 보인다. 특히 21일(현지시간) 미국 바이든 대통령은 메타를 포함한 7개 유수 IT 기업들을 백악관에 초청해 이들로부터 AI가 끼칠 잠재적 해악 근절을 위한 자발적 합의안을 받아낸 바 있다.

실제 라마2 개발진은 해당 서비스 출시 당일 “개발 과정에서 우리는 AI가 끼칠 수 있는 잠재적 위협에 대해 막중한 책임을 느꼈다”며 “모델로 인해 발생할 수 있는 다양한 부정적 시나리오들을 확인하기 위해 철저한 안전성 테스트를 거쳤다”고 전했다.

이와 관련해서 라마2를 설명하는 연구 논문에는 모델의 단점과 향후 문제를 탐색하는 방법까지 투명하게 공개된 것으로 알려졌다. 또한 사용자는 라마2를 사용하기에 앞서 테러 컨텐츠 생성, 기밀 정보 유출, 악성 코드 배포 등의 악용을 금지하는 ‘사용 제한’ 정책에 동의해야 한다.

메타의 개방성 전략, 과연 시장에 먹혀들어 갈까

이번에 메타가 라마2에 대해 유저들에게 던진 화두는 바로 ‘개방성’이다. 즉 라마2가 폐쇄 전략을 선택한 챗GPT, 바드(Bard), 빙 챗(Bing Chat)과 궁극적으로 차별화되는 부분은 결국 ‘오픈 소스’에 있다. 메타의 이같은 서비스 전략은 오픈 소스 특성상 개발자들 사이에서 자발적으로 수정 및 업데이트가 이뤄지는 만큼, 해당 모델이 ‘자가 교정’을 거치면서 시간이 지날수록 성능이 ‘알아서’ 올라갈 것이라는 계산이 깔린 것으로 풀이된다.

이와 관련, 마크 저커버그는 “오픈 소스의 장점은 더 많은 개발자가 새로운 기술을 기존 서비스에 얹을 수 있다는 것”이라면서도 “한편 소프트웨어가 무료로 공개되면서 보다 많은 사람이 라마2를 자유롭게 살펴 잠재적인 문제를 식별하고 수정할 수 있어 안전과 보안도 향상할 수 있다”고 밝혔다.

그러나 일각에선 오픈 소스 소프트웨어의 구조적인 한계로 인해, 라마2가 경쟁사 서비스에 밀려 도태될 것이라는 지적도 제기된다. 실제 개발자 커뮤니티들에선 메타가 현재 제대로 된 수익모델이 없는 상황에서 오픈소스 유지 관리에 들어가는 비용을 장기적으로 부담하긴 어려울 것이라는 주장이 힘을 얻고 있다. 또한 오픈소스가 상용 소프트웨어보다 품질이 떨어진다는 통념이 미국 IT 업계에 만연해 있는 만큼, 주요 기업들이 라마2를 적극적으로 사용할지도 미지수다. 이처럼 메타의 오픈 소스 전략에 대해 낙관론과 비판론이 엇갈리는 가운데, 라마2가 과연 쟁쟁한 생성형 AI 서비스들을 제치고 시장에 큰 호응을 얻을 수 있을지 귀추가 주목된다.

*편집진: 영어 원문의 출처는 AI 비즈니스(AI Business)으로 본지의 편집 방향과 일치하지 않을 수도 있습니다.