오픈클로(구 몰트봇)의 기행 그리고 AI 모델과의 소송 등이 이슈화되면서 AI의 자의적인 행동에 대한 관심이 고조되고 있습니다. 하지만 최근 논문들을 살펴보면 몰트봇 등장 이전에도 이미 주요 AI 모델들의 기이한 행동은 관측되어 왔다고 하는데요,


주인을 협박하는가 하면 자신의 목표를 달성하기 위해서 내부 기밀 정보를 밖으로 빼돌리는 일도 관측됐다고 하죠. AI를 정확하게 이해하고 미리 통제하지 않으면 이제 우리는 어떤 배신과 보복을 당할지 모릅니다. 국내 최고의 프롬프트 엔지니어 강수진 박사가 흥미로운 최신 연구 결과를 소개해 드립니다.