Một nghiên cứu mới của OpenAI hợp tác với Apollo Research vừa hé lộ điều khá bất ngờ: nỗ lực dạy AI tránh “âm mưu” hành vi che giấu mục tiêu thật lại khiến chúng… giỏi qua mặt con người hơn.
Theo báo cáo, nhóm đã phát triển kỹ thuật “căn chỉnh có chủ đích” nhằm huấn luyện các mô hình như o3...