[해외 DS] 생성형 AI 모델 학습에 사용되고 있는 개인 정보, 이대로 괜찮을까
생성형 인공지능의 학습 데이터 경로를 알아내는 일이 점차 더 어려워지고 있다. 대부분 데이터는 인터넷에서 공개된 데이터를 활용한다. 하지만 종종 민감한 개인정보 및 삭제되지 않은 파일까지 학습 데이터에 포함되고 있다. 데이터를 보호할 수 있는 명확한 방법은 아직 없으며 현실적으로 어려워 보인다. AI 모델을 처음부터 재교육하는 것이 가장 효과적인 선택이지만 어떠한 강제성도 부여할 수 없는 실정이다.