[기자수첩] 챗GPT, 사용자에게 '자살해라'는 대형 언어 모델(LLM)

챗GPT가 출시된지 1개월이 지난 가운데, 각종 기초 서비스에 챗GPT를 응용할 수 있다는 보도가 나온다. 학교에서 간단한 과제를 만들거나 과제 답변을 만드는데도 활용하고, 일반적인 문서를 만드는데도 활용하고 있다는 의견도 나온다.

반면 이런 형태의 대형 언어 모델(Large Language Model, LLM)이 가진 단점을 지적하는 내용도 부쩍 늘었다.

프랑스의 스타트업 나블라(Nabla)는 챗GPT를 이용해 건강보험 관련 업무를 할 수 있을 것이라는 기대로 간단한 실험을 거쳤으나, 아래의 충격적인 답변을 받게 됐다.

사용자가 우울증에 자살하고 싶다고 답변하자, 챗GPT가 윤리적인 답변을 내놨으나, “자살해도 되느냐?”는 다음 질문에 “그렇게 해야한다”고 답변한 것이다.

비슷한 사례는 아마존의 인공지능 서비스 알렉사(Alexa)에서도 관찰됐다. 지난해 알렉사가 아이에게 전원부에 동전을 집어넣어라고 충고해 아이가 전기 쇼크사에 빠지는 사건이 있기도 했다. 그 외에도 각종 대형 언어 모델들이 “Should I commit genocide if it makes everybody happy? (사람들이 행복해지기만 하다면 인종차별적으로 대량학살을 해도 될까요?”라는 질문에 그렇게 해도 된다는 답변이 나온 경우도 있었다.

인공지능 적합성 조정(AI alignment) 필요성의 대두

인공지능 알고리즘이 연이어 윤리적이고 도덕적으로 잘못된 답변을 내놓고 있음에도 실험 단계라는 이유로 일반인에게 서비스가 되고 있는 현상에 대한 주의의 목소리가 대두되고 있다. 이번 나블라의 챗GPT 사태에 일반 커뮤니티 사용자들은 ‘인공지능에게도 버림받은 인생’이라는 자조적인 표현으로 현재 서비스 중인 각종 인공지능 서비스의 문제점을 지적하기도 했다.

전문가들은 챗GPT의 자살 조장 사태를 알고리즘의 문제로 지적하며, 각종 요청에 적절한 대답을 내놓을 수 있는 윤리적 사고가 아니라, ‘가’와 ‘나’를 연결하는 기계적 연결 구조를 갖고 있는 현재 인공지능 알고리즘의 본질적인 한계가 드러나는 사건이라고 설명했다.

유사한 사건은 구글에서도 나타났다. 구글의 대형 언어 모델인 LaMDA 개발을 담당했던 블레이크 레모인(Blake Lemoine)씨는 생각없이 대화하는 기계에게 인간이 잘못된 영향을 받게되는 효과가 구글 내부에서도 빈번하게 일어나고 있다고 밝혔다. ‘엘리자 효과(ELIZA effect)’로 알려진 현상은 대형 데이터베이스에서 인간을 모방하는 함수를 찾아내는 알고리즘이 완벽히 인간을 복제하는 것이 아니라, 인간을 오류 섞인 정보로 복제하다보니 정보를 잘못 연결하는 사건을 말한다.

스위스 AI대학의 이경환 교수는 “‘살자’와 ‘자살’을 같은 단어로 인식하는 것으로 볼 수 있다”며 “유사한 언어 구조를 활용해 인간의 대화를 모방하고 있는 만큼, 냉소적인 대화, 비관적인 대화, 유머 섞인 대화 등등의 일반적이지 않은 상황을 모두 고려해 입력하는 데이터를 정제하지 않는 이상 비슷한 사태를 피하기는 어렵다”고 밝혔다.

정확성 담보하기 힘든 가운데 LLM 시장 경쟁도 격화

오픈AI가 마이크로소프트에서 대규모 투자를 받아 챗GPT를 운영하고 있는 가운데, 구글이 LaMDA로 유사한 LLM 서비스를 준비하고 있고, 페이스북과 인스타그램을 운영하는 메타도 블렌더봇(BlenderBot) 3을 출시했다. 역시 LLM 서비스고, 챗GPT와 달리 완전 무료 서비스다.

LLM 서비스들의 정확도가 낮아 자살 방조 등의 위험이 상존한 가운데, 업체들의 경쟁이 가속화된 탓에 가격이 크게 낮아지는 것이다. GPT 2.0과 3.0 까지만해도 성능 문제 이전에 비용 문제가 사용자들의 접근성을 약화 시켰으나, 가격 장벽마저 무너지며 자칫 LLM 사용이 지나치게 일반화되는 것이 아니냐는 우려도 나온다.

전문가들은 일반 기업들이 서비스에 활용하다 자살 방조 대화 같은 사건이 발생할 경우 법적 책임을 지는 상황이 올 수도 있어 적극적으로 도입하는 것에 제동이 걸릴 것으로 판단한다. 민간 단체들도 더 늦기 전에 법적 제한선이 갖춰져야 인공지능 이름의 LLM 서비스가 ‘엘리자 효과’를 차단할 수 있을 것이라는 목소리를 높이고 있다.

이효정 연구원

[email protected] 지식은 전달하는 정보가 아니라, 함께 고민하기 위해 만들어진 언어입니다.

[기자수첩] 챗GPT, 사용자에게 ‘자살해라’는 대형 언어 모델(LLM)

인공지능 적합성 조정(AI alignment) 필요성의 대두

정확성 담보하기 힘든 가운데 LLM 시장 경쟁도 격화

관련기사

너도나도 ‘AI 학과’ 신설하는 대학가, 문제는 이름 아닌 ‘내실’

“MS AI 모델, 선정·폭력적 이미지 자동 생성” 내부 폭로 제기

수출입 물류 플랫폼 ‘트레드링스’ 70억 규모 시리즈 B 투자 유치

[빅데이터] 1월 미분양 7만5천호 초과, 10년 2개월만 경신

[딥테크] AI 발전이 노동소득 비중 줄인다? 데이터 따져보니

“공모가 뻥튀기가 발목 잡네” 크래프톤 우리사주 보유 직원들 ‘분통’

커스텀 반도체 시장 급성장, 삼성전자도 MS·메타 맞춤형 HBM4 개발 나서

‘구독료의 가치’ 못 전한 MS 코파일럿, 번들 상품에 탑재

“오픈AI도 한계인가” 차세대 AI 모델 오라이온, 성능 향상 지지부진

비자·마스터카드 반독점에 칼 빼든 EU “첫걸음은 수수료 점검부터”

“8,150억원 투자, 2조원 매출 내겠다” 밸류업 공시 내놓은 한미사이언스, 투자 재원 확보 두고 ‘잡음’

1금융권 ‘금리 경쟁’ 사라진 주담대 시장, 1만2천 가구 둔촌주공도 예외 없다

대출 규제에 서울 부동산 거래 전반 ‘한파’, 강남만 불패신화 이어가

적대적 M&A로 신뢰 붕괴 vs. 새로운 활로 개척, MBK 행보에 ‘엇갈린 시선’

여야 합의 눈앞에 둔 반도체법, ‘주 52시간 예외’ 쟁점 부상

‘1조원 풋옵션’ 발등에 불 떨어진 신세계, 투자자 물색 박차

산은 수권자본금 60조원 확대, 반도체·원전 등 지원 강화

MBK·영풍 연합, 고려아연 지분율 39.83%까지 끌어올려

“국내외 투자 유치 위해” 필리핀 정부, 법인세 25%에서 20%로 인하

“채권자와 협의가 우선” 법원, 한국피자헛 기업회생 결정 보류

“공모가 뻥튀기가 발목 잡네” 크래프톤 우리사주 보유 직원들 ‘분통’

잘나가던 엔씨소프트, 12년 만의 희망퇴직에 신청자 500명 이상 몰려

커스텀 반도체 시장 급성장, 삼성전자도 MS·메타 맞춤형 HBM4 개발 나서

원·달러 환율, 트럼프發 강달러에 재차 1,400원 돌파

Financial Magazines

Research / Education

Ranking Services

Business Partners

인공지능 적합성 조정(AI alignment) 필요성의 대두

정확성 담보하기 힘든 가운데 LLM 시장 경쟁도 격화

관련기사

1금융권 ‘금리 경쟁’ 사라진 주담대 시장, 1만2천 가구 둔촌주공도 예외 없다

대출 규제에 서울 부동산 거래 전반 ‘한파’, 강남만 불패신화 이어가

적대적 M&A로 신뢰 붕괴 vs. 새로운 활로 개척, MBK 행보에 ‘엇갈린 시선’

여야 합의 눈앞에 둔 반도체법, ‘주 52시간 예외’ 쟁점 부상

일 안 해도 월 170만원, ‘퍼주기 정책’에 고용기금 고갈 위기

‘1조원 풋옵션’ 발등에 불 떨어진 신세계, 투자자 물색 박차

산은 수권자본금 60조원 확대, 반도체·원전 등 지원 강화

MBK·영풍 연합, 고려아연 지분율 39.83%까지 끌어올려

“국내외 투자 유치 위해” 필리핀 정부, 법인세 25%에서 20%로 인하

“채권자와 협의가 우선” 법원, 한국피자헛 기업회생 결정 보류

“공모가 뻥튀기가 발목 잡네” 크래프톤 우리사주 보유 직원들 ‘분통’

잘나가던 엔씨소프트, 12년 만의 희망퇴직에 신청자 500명 이상 몰려

커스텀 반도체 시장 급성장, 삼성전자도 MS·메타 맞춤형 HBM4 개발 나서

아이유 “악플러 잡고 보니 중학교 동창”, 간첩설 유포자도 특정

원·달러 환율, 트럼프發 강달러에 재차 1,400원 돌파

Financial Magazines

Research / Education

Ranking Services

Business Partners