[기고] '챗GPT는 무슨 "기술"인가요?'라는 질문에 담긴 한국 개발자들의 '복사-붙여넣기' 사고방식

서비스의 개발 논리를 이해하고 구현하는 것보다 무슨 '기술'인지 정보를 알아서 베끼는데 초점 맞춘 기업인들 많아
대부분 연구직 출신들이 아니라 IT 개발자들이 머신러닝 코드 몇 줄을 배운 다음 '머신러닝 개발자'가 되었기 때문
개발 직군들로 고급 AI상품 만들기 어려워, 한국 인력 상황 감안할 때 AI산업에 계속 투자하는 것은 밑빠진 독에 물 붓기 될 것

한국IT업계에서 개발자로 불리는 기술직군 관계자들을 기업 미팅에서 만날 때마다 자주 듣는 질문 중 하나로 “무슨 기술로 만들었나요?”가 있다. 특정한 사건을 관찰하고, 수식 기반으로 적절한 모델을 만들어서 그 사건 속에 담긴 문제를 해결하는 방식의 훈련을 받았던 입장에서 ‘무슨 기술’이라는 표현이 처음에는 잘 이해가 안 됐다. 그래서 ‘무슨 기술’이라는게 무슨 뜻이냐고 물으니 짜증난다는 말투로 “무슨 라이브러리로 만들었냐구요”라며 문제 해결 방식 뒤에는 개발자들에게 제공되는 코드 묶음집이 있을 것이라는 확신을 갖고 있다는 것을 보여줬다.

답답한 마음에 어떤 논리로 문제가 해결됐는지 설명을 풀어놓기 시작하면 자기가 아는 용어가 하나 나올 때까지 눈빛에 초점을 잃고 있다가 “아니 SVM으로 만들었네, 왜 더 최신 기술인 딥러닝으로 안 만들었나요?”라는 식으로 아는체를 하면서 “딥러닝으로 만들면 더 좋은거니까 저희는 그거 안 써도 될 것 같아요”라고 답변하면서 무시하는 표정을 짓는 경우가 매우 자주 있었다. SVM, 딥러닝 등의 각종 계산법들이 특정 데이터에서 연구자가 원하는 목적을 달성하기 위해 만들어진 특화된 계산법이라는 계산과학의 기초 상식을 모른채, 무조건 최근에 알려진 계산법이 제일 좋은 것이라고 생각하는 전형적인 개발자 사고 방식이 깊게 깔려 있기 때문에 나오는 태도일 것이다. 특정 학문 분야 기초 상식도 모르는 인력들을 전문가로 포장하는 회사와 업계가 과연 발전 가능할까?

“어떤 논리로 작동되나?” vs. “무슨 기술인가?”

영미권 주요 기업들과 미팅을 하고 있으면 “어떤 논리로 작동되나? (What’s the logic behind this?)”라는 질문을 굉장히 많이 받는다. 한국인 개발자들을 상대하듯이 SVM, 딥러닝 등등의 계산법 이름만 댔다가는 그 계산법들을 어떻게 해당 데이터에 맞게 뜯어고쳤나는 질문, 시장에 있는 다른 기업들은 어떻게 뜯어고쳤는지 비교해 달라는 질문, 덕분에 어떤 차이가 났는지 등에 대한 수십, 수백개의 추가 질문을 받게 된다. 먼저 설명을 다 해줘야 질문의 숫자도 줄어들고, 굳이 답변하지 않아도 되는 질문을 피할 수 있다.

연구 중심 인력들의 시장인만큼, 기업 별로 자기들 사정에 맞게 기술적으로 어떤 도전을 어떻게 풀어내야하는지에 대해서 기업 관계자들이 막연하게나마 지식이 있는 경우가 대부분이다. 물론 지식 없이 무조건 되느냐, 안 되느냐, 혹은 딥러닝보다 더 좋은 최신 기술이 나왔다던데 너네는 그거 알고 있냐는 식의 한국 기업들과 동일한 수준의 질문을 하는 경우도 있지만, 우리 회사만 그런 기업들을 피하는게 아닌지 1년 쯤 지나서 우연히 찾아보면 비전문 업체에 사기를 당한 수준의 서비스를 내놨거나, 해당 담당자의 이메일이 반송된다. 그 담당자가 해고 됐다는 뜻일 것이다.

이미 한국에서 몇 년간 사업을 하면서 “무슨 기술인가”에 대한 답변만 들으면 “우리도 같은 라이브러리로 만들 수 있다”고 주장하면서 기업의 AI 서비스를 망쳐놓은 개발자 그룹을 헤아릴 수 없이 많이 봤던 덕분에, 글로벌 시장에서도 질문 수준이 이상하면 괜히 시간만 뺏길 것 같다 싶어서 기업대응(CS)팀에게 불편함을 전달해버린다. 대체로 이런 사건은 ‘기술력’에 대한 이해도가 한국과 비슷하거나 한국보다 낮지만 프로젝트 발주 비용을 갖고 있는 아랍 국가들에게서 자주 겪는다. 이미 아랍 쪽 기업들과 프로젝트를 해 봤던 팀원들은 “자기들의 상황을 설명하고 어떤 해결책이 있는지를 물어보는 것이 아니라, 원하던 기능이 된다, 안 된다만 따지는 단순한 고객들”이라는 표현을 쓴다. 좀 더 직접적으로는 딥러닝을 썼으면 이미지가 100% 인식 되어야 하는거 아니냐며 우리가 딥러닝을 몰라서 터진 사건이라고 몰아세우는 사건을 겪었던 이야기를 들었는데, 고객들의 이해도, 불만 표현 방식 등등이 대체로 한국 기업들과 비슷하다는 느낌을 받았다.

“챗GPT는 어떤 논리로 작동되나?” vs. “챗GPT는 무슨 기술로 만들었나요?”

예전엔 “무슨 ‘기술’로 만들었냐?”는 질문을 받을 때마다 “왜 저렇게 이상한 질문을 하는 걸까?”는 의문이 많았는데, 몇 년간 그런 분들을 부대끼면서, 심지어 아랍 기업들의 다양한 사례와 영미권 주요 기업들 간의 격차를 실제로 겪으면서 결국 기술력의 차이가 질문에도 그대로 반영된 것이라는 결론을 얻게 됐다. 학창 시절로 돌아가도, 공부를 제대로 하는 학생들의 질문과, 교과서를 대충 눈으로만 훍어본 학생들의 질문 사이에는 엄청난 내공의 격차가 있었던 기억이 있는데, 그 분들이 기업에 취직해도 상황은 크게 다르지 않은 것이다.

두 그룹 간의 격차는 지식을 수박 겉핡기 식의 암기형으로 습득하는지, 원리를 파악하고 그 원리를 응용하는 훈련이 됐는지에서 결정난다. 기업 안에서도 처음 뽑은 직원들에게는 A정보를 B에서 찾아서 C자리에 입력하면 된다는 단순한 업무 밖에 줄 수 없는데, 며칠 후에 업무 및 회사 서비스에 대한 이해도가 얼마나 달라지는지에 따라 다른 업무를 줄 수 있는지 여부가 갈리는 것을 자주 경험한다. A-B-C만 알고 있는 직원은 일이 재미없다고 불평을 하건 말건, 다른 업무를 주기가 힘들다. 또 다시 새롭게 D 이후의 업무들을 설명해줘야 하기 때문이다. 반면, 회사가 D 이후에 Z까지 업무가 있다는 것을 알고, 혼자서 공부하고 있는 직원에게는 다음 업무인 D-E-F를 주면서 설명 시간이라는 비용을 최소화할 수 있게 된다.

CS팀에게 불편함을 전달하는 경우는 대부분 A-B-C를 복사해서 붙여넣기 작업만 하는데 젖어있는 고객들이다. D-E-F형 고객들은 프로젝트가 최초 사양과 변경될 경우에 추가 비용을 내야한다는 것을 인지하는 것에 더해서, 양측의 시간 비용을 최소화하기 위해 목적이 바뀐 부분을 설명하고, 프로젝트 결과물이 바뀌기 전에 함께 바뀌게 되는 중간 단계들에 대한 질문을 한다. A-Z 사이에 어떤 사건이 있을지 부족하나마 짐작하고 있기 때문에 가능한 사건이다. 이 분들은 처음 기업 미팅 때부터 “어떤 논리로 결과물이 제작되나, 어떻게 만들 계획이냐?”는 질문들을 했었기 때문에 더더욱 재조정 작업이 빨리 진행된다. 반면, “챗GPT는 무슨 ‘기술’로 만들었나요?” 식의 질문을 하는 A-B-C형 기업들은 목적이 바뀌어서 결과물이 바뀌었지만, 우리 작업에 어떤 영향을 주는지는 관심이 없고, 납기일을 맞춰야 된다는 압박만 한다. CS팀도 눈 앞의 수익성을 쫓다가 결국 추가 시간만 길게 뺏기고, 인건비만 들어가서 손해를 본다는 경험치가 쌓였으니 우리 팀의 불만을 납득해주는 것이다.

‘무슨 기술’ 표현 뒤에 숨은 ‘복사-붙여넣기’ 사고 방식

한국 지식인 사회는 지난 1990년대 IMF 구제금융을 겪던 시절부터 따라잡는 시대를 넘어 스스로 개척하는 시대가 되어야 한다고 역설했다. 무려 20년, 30년이 지났지만, 지난 몇 년간 한국 IT기업 현장을 보니 여전히 1류 국가들이 만들어 놓은 결과물을 흉내내면 된다는 사고방식에서 한 걸음도 못 벗어나 있다. 교과서를 읽으면 지식은 쌓이지만, 그 지식을 어떻게 활용하는지는 현장의 문제를 경험으로, 논리적 사고력으로 풀어내는 역량이 쌓여야 된다. ‘어떤 논리로 만든’ 대신 ‘무슨 기술로 만든’이라는 표현의 뒤에는 챗GPT를 기술력의 결과물이 아니라, 베껴오면 되는 하나의 ‘기술’이라고 인식하고, 그 ‘기술’을 ‘도입’ 하면 된다는 국내 IT업계의 사고방식이 깊게 깔려 있다. 고급 기술 상품을 만든 회사들이 제공해주는 API를 구매하는, 속칭 라이선스 구매 방식으로 비슷한 서비스를 구현하는 것은 어렵지 않을 것이다. 그런데, 그 서비스를 한국 사정에 맞게, 특정 기업 사정에 맞게 뜯어고치려면 챗GPT라는 기술 상품이 ‘어떤 논리’로 작동되는지 이해하고, 그 논리를 수정하거나, 그 논리에 맞게 기업 사정을 변경해야 한다.

‘인간의 피드백이 적용되는 강화학습(Reinforcement Learning from human feedback, RLHF)’이라는 표현과, 기초 수준으로 난이도를 낮춘 자료집에 나온 내용을 이해한 것으로 ‘무슨 기술’인지를 알게 됐다며 자랑하는 것은 아무런 생산성도 갖지 못한다. 일반 기술 라이브러리들처럼 복사해와서 붙여넣는다고 그대로 쓸 수 있는 서비스가 아니기 때문이다. 학점, 토익 같은 스펙만 갖추면 대기업 들어갈 수 있다는 전형적인 한국식 기계적 사고 방식에서 한 걸음도 못 나갔기 때문에 위의 단순한 사고가 한국 IT업계 전체에 만연해있고, 개발 결과물의 품질이 매우 조악할 수밖에 없는 상황에 치닫는다.

RLHF 모델은 고교 시절에 배우는 1, 2변수 최적화 계산에서 출발해, 대학 저학년 과정에 배우는 다변수 최적화, 조건 있는 경우의 최적화를 거쳐, 학부 고학년, 혹은 대학원에서 배우는 반복 동적 최적화, 비반복 동적 최적화 등의 수학적 훈련을 거쳐야 제대로 논리를 이해할 수 있다. 특정한 데이터와 계산 목적에 맞게 수식을 변경하는 고된 훈련을 통한 이해도 향상은 필수적이다. 그래야 기업 현장에서 회사의 목적과 주어진 데이터에 맞춰 모델을 변형하면서 적용할 수 있기 때문이다.

그런 훈련을 거치지 않고 이것저것 아무거나 넣어보다가 하나 맞기만을 기도하는 개발자가 베껴 붙인 코드로 만든 서비스가 개별 기업 사정에 맞게 척척 변경이 될까? 그들의 커뮤니티에 가 보면 어느 회사의 ‘대형언어모델(Large Language Model, LLM)’이 다른 회사 모델보다 한국어에 덜 맞는다는 경험만 공유되어 있을 뿐, 챗GPT를 비롯한 주요 기업들의 LLM이 어떤 논리로 구성되어 있는지, 어떤 데이터들이 활용되었길래 그런 결과물이 나오는지에 대해서는 누군가에게 주워들은 말들 밖에 없다. 고쳐볼 엄두는 내지도 못하고, 그저 안 맞는다는 불평들만 늘어놓는 인력들 투성이에서, 간혹 일부 인력들이 직접 만들어 낼 역량이 있는 사람들이 할 수 있는 일들이라는 것을 막연하게나마 인지는 하고 있는 것을 다행으로 알아야 하는 상황이다.

그저 “어디에서 잘 맞는다고 하더라구요” 정도에서 ‘라이선스 구매 후 적용’ 정도의 업무 밖에 할 수 없는 인력들인데, 안타깝게도 한국의 주요 IT기업들이 채용한 ‘인공지능 전문가’라는 ‘머신러닝 개발자’들의 수준이 더 나은 경우를 본 적이 없다. A-B-C 수준을 벗어나지 못한 인력들로 X-Y-Z는 커녕 D-E-F를 만들어내는데도 막대한 교육 비용을 써야 할 판국인데, 최소한 J-K-L 은 되어야 경쟁력을 갖출 수 있는 글로벌 시장을 감안하면, 그런 ‘복사-붙여넣기’ 수준 인력들에게 연구 지원금을 계속 투입하는 것이 옳은지 의문이 들 뿐이다. X-Y-Z를 뛰어넘어 AA-AB-AC라는 새로운 영역에 도전하는 실리콘 밸리에서도 수익성을 못 낸다는 이유로 생성형AI에 대한 투자가 지나쳤다는 비관론이 나온다. 베껴 붙이는 것도 몇 달간 시행착오를 겪어야 하는 A-B-C들에게 계속 투자하는 것이 세금을 내는 국민들과 주식을 들고 있는 주주들의 이익에 합치되는 선택인지 정부와 기업 관계자들이 깊게 고민해보기 바란다.

Keith Lee

Head of GIAI Research Head of GIAI Korea co-Founder @ Swiss Institute of Artificial Intelligence