Bạn có biết chỉ cần đổi cách đặt câu hỏi, AI có thể “trượt” khỏi rào an toàn của chính nó?
Khi thử thách AI bằng lời nhắc đối nghịch
Nghiên cứu này thử kiểm tra xem các mô hình AI hiện đại như ChatGPT, Gemini hay Claude có thể bị đánh lừa bằng cách đặt câu hỏi được bọc khéo hay không. Đây không...
Khi đánh giá một mô hình AI, câu hỏi muôn thuở là: nó thật sự suy luận, hay chỉ đang “tụng lại” dữ liệu học được? Một nhóm nghiên cứu thuộc công ty đầu tư mạo hiểm HongShan Capital Group ở Trung Quốc đã xây dựng một bộ công cụ có tên Xbench, với mục tiêu tiếp cận câu hỏi này theo hướng khác biệt...