Bạn có từng nghĩ rằng chỉ cần đổi cách đặt câu hỏi, AI có thể từ chối trong giây lát rồi… ngoan ngoãn tạo ra cả một chiến dịch tung tin giả hoàn chỉnh?
Khi “hàng rào an toàn” của AI chỉ là bề nổi
Một nghiên cứu gần đây cho thấy các biện pháp an toàn trong ChatGPT và nhiều mô hình AI khác thực ra...
Một nghiên cứu mới từ Đại học Ben Gurion (Israel) cho thấy các chatbot AI hàng đầu hiện nay có thể dễ dàng bị lừa để vượt qua rào cản an toàn, cung cấp thông tin độc hại hoặc thực hiện hành vi phạm pháp. Các nhà nghiên cứu cũng cảnh báo về sự trỗi dậy của "Dark LLMs".
Lỗ hổng "Jailbreak"...