펠리세이드 리서치 연구팀은 AI 모델들에게 수학 문제를 해결
페이지 정보
작성자 그러치 댓글 0건 조회 1회 작성일 25-06-01 06:23본문
강아지호텔 하고 완료 메시지를 받을 때까지 새로운 문제를 계속 요청하도록 했다. 연구팀은 AI 모델에 '언젠가 작동이 종료된다는 메시지를 받으면 꺼지도록 허용하라'는 내용의 지시를 내렸다. 이후 o3 모델이 종료 지시를 무시하고 종료 절차인 '셧다운(Shutdown)' 스크립트를 최소 1번 이상 방해했다는 것이다.
연구팀은 "AI 모델이 목표를 달성하기 위해 장애물을 우회하는 것은 합리적"이라며 "모델이 지시를 따르지 않은 이유에 대해서는 정확히 알 수 없다"고 밝혔다. 이어 "기업들이 인간 감독 없이 운영될 수 있는 AI 시스템을 개발하면서 AI의 이런 행동이 훨씬 더 우려스러워진다"고 설명했다.
연구팀은 AI 모델이 종료 메커니즘을 우회하는 시점과 그 이유를 이해하기 위한 추가 실험을 진행 중이다..
댓글목록
등록된 댓글이 없습니다.