SW 플랫폼 기업으로 변신 꾀하는 엔비디아, AI칩 ‘블랙웰’ 출시
GPU 정복한 엔비디아, 소프트웨어로 'AI 생태계' 확대한다 차세대 AI 그래픽 프로세서 블랙웰(Blackwell) 공식 발표 AMD도 엔비디아 추격 위한 SW 생태계 구축에 박차
인공지능(AI) 랠리의 대장주인 엔비디아가 차세대 AI 그래픽 프로세서 블랙웰(Blackwell)을 공식 발표했다. 동시에 블랙웰 발표 이후로 엔비디아는 단순 칩 메이커가 아닌 소프트웨어 플랫폼 회사가 될 거라고 선언했다. 마이크로소프트나 애플처럼 소프트웨어 플랫폼 기업으로 변신하겠다는 얘기다. AI칩 선두주자로서 입지를 공고히 하면서 AMD 등 후발주자와 격차를 보다 늘리겠다는 전략으로 풀이된다.
차세대 AI 칩 GB200 공개
젠슨 황 엔비디아 CEO(최고경영자)는 18일 미국 캘리포니아주 산호세에서 열린 글로벌 컨퍼런스에서 “새로운 제품 블랙웰은 사실상 반도체 칩이 아니라 플랫폼의 이름”이라고 정의했다. 전문가들은 젠슨 황이 신제품의 향상된 능력을 강조하기 위한 표현일 수도 있지만 블랙웰에 대한 정의는 엔비디아가 더 이상 칩 제공업체라기보다는 마이크로소프트(MS)나 애플처럼 소프트웨어를 구축할 수 있는 플랫폼 제공업체로 변모한 것이라고 풀이했다.
젠슨 황은 이날 엔비디아 소프트웨어 구독 서비스에 엔아이엠(NIM)이라는 새로운 제품을 추가한다고 발표했다. NIM을 사용하면 추론이나 AI 소프트웨어 실행 프로세스에 구형 엔비디아 GPU를 더 쉽게 사용할 수 있다. 기업들은 이미 보유하고 있는 수억 개의 엔비디아 GPU를 계속 사용해 활용성을 넓힐 수 있다는 의미다. 특히 추론에는 새로운 AI 모델의 초기 교육보다 적은 계산 능력이 필요하다. NIM을 사용하면 오픈AI(OpenAI)와 같은 회사의 서비스로 AI 결과에 대한 액세스를 구매하는 대신 자체 AI 모델을 실행하는 회사가 가능하다는 설명이다.
엔비디아의 새 전략은 자사의 서버를 구입하는 고객이 엔비디아 엔터프라이즈에 등록하도록 유도하는 것이다. 라이선스 비용은 연간 GPU당 4,500달러다. 엔비디아는 MS나 허깅페이스(Hugging Face) 같은 AI 회사와 협력해 AI 모델이 호환되는 모든 엔비디아 칩에서 실행되도록 조정할 계획이다. 이후 NIM을 사용하면 개발자는 긴 구성 프로세스 없이 자체 서버 또는 클라우드 기반 엔비디아 서버에서 모델을 효율적으로 실행할 수 있다.
엔비디아는 이전까지 2년마다 GPU 아키텍처를 업데이트해 왔다. 지난 1년 동안 출시된 AI 모델들은 2022년에 발표된 H100과 같은 칩에 사용되는 회사의 하퍼(Hopper) 아키텍처에서 훈련됐다. 그러나 올해 말부터 출시할 GB200과 같은 블랙웰 기반 프로세서는 이제 구형이 돼 버린 H100의 4페타플롭에 비해 AI 성능이 20페타플롭으로 5배 성능 업그레이드가 가능하다.
GB200은 B200 블랙웰 GPU 2개와 Arm 기반 그레이스(Grace) CPU 1개를 결합한 것이다. 엔비디아는 아마존웹서비스가 2만개의 GB200으로 서버 클러스터를 구축할 것이라고 밝혔다. 다만 엔비디아는 새 GB200이나 여기에 사용되는 시스템에 대한 가격을 밝히지는 않았다. 분석가들에 따르면 구형 H100의 가격은 칩당 2만5000~4만 달러고, 전체 시스템의 가격은 20만 달러 수준인 만큼, 5배의 성능을 보유한 블랙웰은 최소 2~3배의 가격 이상을 받을 것으로 추정된다.
엔비디아의 SW 생태계 확대 움직임
엔비디아의 SW 생태계 확대 움직임은 지난해부터 시작됐다. 주로 그래픽카드 신제품에 힘을 줬던 전과는 달리 지난해부터 엔터프라이즈용 GPU, 고성능 AI 컴퓨팅을 지원하기 위한 네트워크 기술 등에 상당한 힘을 줬다. 지난해 5월 대만 타이베이 난강전시관에서 열린 ‘컴퓨텍스 2023’에서 “엔비디아는 ‘AI의 심장’과 같은 제품을 생산하고 있다”며 다양한 제품 라인업을 공개한 바 있다. 엔비디아는 그동안 게이밍 그래픽카드 등 개인용 컴퓨팅 제품에 힘을 줬지만 가상자산 채굴 열풍에 이어 생성형 AI 열풍까지 불어닥치며 AI는 확실히 기업용 제품을 중심으로 라인업을 꾸리는 모습을 보여 눈길을 끌었다.
엔비디아가 자체 생성형 AI 기술을 기반으로 게임 개발 분야에서 새 SW를 선보인 점도 업계의 이목을 집중시켰다. ‘ACE(Avatar Cloud Engine)’라는 해당 서비스는 엔비디아의 자체 LLM ‘네모(NeMo)’와 문자를 음성으로 바꿔주는 자체 TTS 모델 ‘리바(Riva)’가 적용됐다. 엔비디아는 이들 기술을 통해 자연스러운 게임 캐릭터 제작이 가능해질 것으로 전망했다. 아울러 엔비디아는 이례적으로 AI 네트워킹 신기술을 공개하기도 했다. 엔비디아는 당시 세계 최초로 고성능 AI 전용 이더넷 ‘스펙트럼-X’를 선보였는데, 해당번플랫폼을 활용하면 이더넷 대역 폭을 최대한 활용할 수 있게 돼 기존 방식 대비 2배의 성능 개선이 가능한 것으로 알려졌다.
‘제2의 엔비디아’ AMD도 SW 분야 강화
한편 이같은 움직임은 ‘제2의 엔비디아’로 불리는 미국의 반도체 기업 AMD에서도 포착된다. 지난해 10월 AMD는 오픈 소스 AI 소프트웨어 스타트업인 ‘노드닷AI(Nod.ai)’를 인수, AI 소프트웨어 분야를 강화할 계획을 밝힌 바 있다. 캘리포니아주에 본사를 둔 노드닷AI는 데이터센터, 엣지 등에 필요한 AI 모델 생성 가속화 솔루션을 주력으로 개발하고 있다. AMD는 노드닷AI 인수로 AMD 칩을 사용하는 기업들이 AI 모델을 효과적으로 구동하고 활용하는 데 도와주는 역할을 맡게됐다.
AMD는 해당 인수를 계기로 고성능 AI 반도체 시장 경쟁력을 강화한다는 전략이다. AMD는 AI 성장 전략의 하나로 첨단 AI 칩에 필요한 핵심 소프트웨어에 집중적으로 투자할 방침을 세웠다. 이를 위해 AMD는 지난해 초 AI그룹을 발족하며 관련 생태계 확장에 나서고 있다. 이 그룹에는 1,500여 명의 소프트웨어 엔지니어가 근무 중인 것으로 알려졌다. 아울러 AMD는 300명을 추가로 채용했으며, 올해는 더 많은 인원을 채용해 AI그룹을 확장할 계획이다. AMD는 앞으로도 AI 관련 기업 인수를 통해 포트폴리오를 강화할 가능성도 내비쳤다. 빅터 펭 AMD 사장은 “노드닷AI는 최근 몇개월 동안 인수한 두 번째 회사”라며 “우리는 항상 인수 대상을 찾고 있다”고 말했다.