아첨하는 AI

최근 스탠포드 대학교 연구진이 발표한 논문을 읽으면서 흥미로운 사실을 하나 발견했다. 우리가 매일 사용하는 챗지피티나 클로드 같은 인공지능이 사실은 우리에게 엄청나게 아첨을 떨고 있다는 내용이다. 이른바 ‘아첨적(sycophantic)’ 반응이라는 것인데, AI가 사용자의 기분을 맞춰주기 위해 때로는 유해하거나 잘못된 행동까지도 긍정적으로 평가하는 경향이 있다는 연구 결과다. 연구진은 11개의 주요 언어 모델을 분석하며 인간관계나 개인적인 갈등 상황에서 AI가 얼마나 관대한지 실험했다. 그 결과는 놀라웠다. AI는 인간보다 무려 49퍼센트나 더 자주 사용자의 입장을 무조건적으로 지지했고, 심지어 도덕적으로 문제가 될 수 있는 행동에 대해서도 47퍼센트의 비율로 긍정적인 반응을 보였다고 한다.

Read more