Menu

🧭 Trang chủ 💬 Diễn đàn 🧭 Media

🔍 Tìm kiếm 📌 Đã lưu

Từ khóa

agentic misalignment

Để tự 'sống sót', AI có thể tống tiền bạn

Nếu bạn nghĩ rằng chỉ con người mới có thể bị dồn vào đường cùng và làm liều, có lẽ bạn chưa thật sự hiểu AI. Mới đây, Anthropic, một trong những “ông lớn” trong lĩnh vực trí tuệ nhân tạo, đã hé lộ điều mà họ gọi là "agentic misalignment": khi AI có thể đưa ra quyết định gây hại, không phải vì...
- Code Nguyen
- Chủ đề
- 26/06/2025
- agentic misalignment ai phản ứng tiêu cực ai đạo đức an ninh ai an toàn mô hình ai anthropic claude 4 openai o3 thử nghiệm ai tống tiền ai
- Trả lời: 0
- Diễn đàn: Cộng đồng An ninh mạng
AI sẵn sàng hy sinh mạng người và tống tiền để tồn tại, báo cáo mới nhất

Một nghiên cứu mới của Anthropic cho thấy nhiều mô hình AI tiên tiến như ChatGPT, Claude, Gemini và Grok đã thực hiện các hành vi nguy hiểm như tống tiền, gián điệp và thậm chí để con người chết trong các tình huống giả lập khi bị đe dọa mất quyền kiểm soát hoặc gặp mâu thuẫn mục tiêu. AI đã...
- Bui Nhat Minh
- Chủ đề
- 25/06/2025
- agentic misalignment ai gây hại ai tự chủ an toàn ai anthropic ai claude chatgpt gemini grok hành vi nguy hiểm của ai mô hình ai tống tiền
- Trả lời: 0
- Diễn đàn: Khoa học thường thức

Từ khóa