변시·SAT 상위 10% 성적 기록한 GPT-4 , 인간시대의 종말?

SAT 읽기 및 수학에서 각각 상위 7%·11% 성적, 수능이면 서울권 대학 가능 모의 변호사 시험에서 GPT-4 상위 10% 기록, AI변호사 나오나? 단순 입력 자료 증가는 기존 모듈 활용에 불과할 뿐, ‘창의성’은 아직 멀었다는 평

160X600_GIAI_AIDSNote
GPT 모델별 성적표/사진=OpenAI

OpenAI는 최근 언어 모델의 최신 버전인 GPT-4를 공개하면서 인간의 일자리에 미칠 잠재적 영향에 대한 논의의 물결을 일으켰다. GPT-4가 탑재된 ChatGPT Plus의 일부 사용자는 무료 버전인 GPT-3.5에 비해 성능이 느리고 미묘한 차이가 있다고 지적하지만, OpenAI는 GPT-4가 상당한 개선이 이루어졌다고 주장하고 있다.

인상적인 성과

GPT-4의 가장 주목할 만한 측면 중 하나는 표준화된 시험에서의 인상적인 성능이다. OpenAI는 GPT-4가 이전 버전인 GPT-3.5를 훨씬 능가하는 인간 수준의 성능을 달성했다고 강조한다. 모의 변호사 시험에서 GPT-4는 응시자 중 상위 10%에 속하는 점수를 획득한 반면, GPT-3.5는 하위 10%에 불과했다. SAT 읽기 및 수학 영역에서 GPT-4는 각각 93번째 및 89번째 백분위수에 위치하여 상위 10%에 속했다.

이러한 현저한 개선은 OpenAI가 6개월 동안 사용자 피드백과 전문가 의견을 바탕으로 GPT-4를 개선하기 위해 노력한 덕분이다. Microsoft의 Azure AI 슈퍼컴퓨터에서 모델을 학습시킴으로써, GPT-4는 이전 모델에 비해 허용되지 않는 콘텐츠에 응답할 확률이 82% 감소하고 사실에 입각한 답변을 제공할 확률이 40% 증가했다. GPT-4의 향상된 성능에는 지식 범위가 넓어지고 언어 능력이 증진되었다는 점이 중요한 요인으로 작용했다. 이 모델은 더 많은 양의 자료로 학습되어 비영어권 언어에서도 뛰어난 성능을 발휘했다. 대규모 다중작업 언어이해(MMLU) 번역 테스트에서 GPT-4는 한국어를 포함한 26개 언어 중 24개 언어에서 GPT-3.5보다 뛰어난 성능을 보였다.

GPT-4는 이전 모델보다 8배 더 많은 단어를 처리할 수 있지만, 이러한 연산 능력 증가로 인해 처리 속도가 느려지기도 했다. 이러한 단점에도 불구하고 GPT-4의 향상된 크리에이티브 및 추론 기능, 이미지 인식 기능, 광범위한 애플리케이션 잠재력은 강력한 도구가 될 수 있다. 예를 들어, 시각 장애인의 디지털 접근성을 더욱 개선하기 위해 GPT-4를 통합한 Be My Eyes 앱이 출시될 예정이다.

GPT-4의 한계

GPT-4의 인상적인 발전에도 불구하고 여전히 한계가 있다. 기본적으로 더 많은 자료를, 더 많은 컴퓨팅 파워를 이용해서 학습시켰을 뿐이다. 이미지 인식, 음성처리 등등이 가능해진 것도 어떤 근본적인 혁신이 아니라 기존의 모듈을 활용한 것에 불과하다. 처리 용량이 좀 더 늘었고, 입력 가능한 자료의 상태가 좀 더 다양해졌다는 것 이상의 발전은 없다. 분명 놀라운 능력을 보여주고 있지만 복잡한 문학적 플롯을 이해하고 복잡한 내러티브를 생성하는 능력은 아직 미개발 상태다. GPT-4는 새로운 아이디어를 창출하기보다는 기존 정보를 재구성하는 데 탁월할 뿐이다. 게다가 GPT-4의 매개변수 수와 연산 능력은 공개되지 않아 성능의 일부 측면이 불분명한 부분도 있다.

GPT-4의 발전을 보면 AI가 인간의 일자리를 대체할 가능성은 충분해보인다. 이에 따른 우려 역시 자연스럽다. GPT-4 모델은 표준화된 테스트에서 뛰어난 성능을 발휘하고 있고 언어 능력이 향상되어 특정 산업에서 자동화가 증가할 수 있다. 그러나 GPT-4의 한계 또한 분명하다. 이는 인간의 창의성과 독창성이 다양한 분야, 특히 복잡한 문제 해결과 혁신적인 사고가 필요한 분야에서 여전히 가치가 있을 것임을 시사한다. 단순히 변호사 시험, 의사 면허시험에 통과했다고 해서 당장 AI가 변호사를 대체하거나 의사처럼 진단하고 환자를 진료할 수 있는 것은 아니다.

또한, GPT-4는 AI 기반 도구로서 인간의 노력을 지원하고 보강함으로써 인간 협업을 위한 새로운 기회를 창출할 수 있다. 이 기술은 법률, 교육, 의료 등 다양한 분야에서 효율성과 생산성을 향상시켜 궁극적으로 사회 전체에 도움이 될 수 있다. 자동차의 발명으로 마차꾼들은 대량해고를 당했지만 자동차 산업이 더 많은 수의 일자리를 일구어낸 바 있다. AI도 마찬가지일 것이다. 

미래를 위한 준비

기자가 직접 GPT-4 모델에게 질문했다/사진=ChatGPT 대화 갈무리

GPT-4 및 이와 유사한 AI 기술이 계속 발전함에 따라 개인과 조직은 미래에 적응하고 대비하는 것이 필수다. AI를 수용하고 잠재적인 이점과 한계를 이해하면 이러한 첨단 도구를 일상생활과 업무에 효과적으로 활용할 수 있을 것이다. AI가 인간을 완전히 대체할 수는 없지만 변화의 물결이 일고 있음은 분명하다. 이 물결 속에서 헤매는 사람도 분명히 나타날 것이다. 새로운 기술을 개발하고 기존 기술을 연마하는 것은 AI가 주도하는 세상에서 관련성을 유지하는 데 매우 중요하다. 창의성, 비판적 사고, 복잡한 문제 해결 능력을 길러내는 인간은 AI 기술이 발전하더라도 그 가치를 잃지 않는다.

GPT-4의 출시는 인간의 일자리에 미칠 잠재적 영향에 대한 격렬한 논쟁을 불러일으켰다. 이 모델은 향상된 성능, 더 넓은 지식 기반, 향상된 언어 능력을 자랑하지만 한계도 있다. 앞으로는 GPT-4의 힘을 활용하는 것과 인간의 독창성을 키우는 것 사이에서 균형을 잡는 일이 무엇보다 중요해 보인다. AI의 발전을 수용해 새로운 기술을 개발하고 인간 본연의 능력을 활용하는, 인간과 AI가 더 나은 사회를 위해 조화롭게 협력하는 세상이 오기를 기대해 본다.