Menu

🧭 Trang chủ 💬 Diễn đàn 🧭 Media

🔍 Tìm kiếm 📌 Đã lưu

Từ khóa

kỹ thuật jailbreak ai

"Bẻ khóa" ChatGPT, Gemini dễ như ăn kẹo? Nghiên cứu mới hé lộ lỗ hổng AI đáng sợ

Một nghiên cứu mới từ Đại học Ben Gurion (Israel) cho thấy các chatbot AI hàng đầu hiện nay có thể dễ dàng bị lừa để vượt qua rào cản an toàn, cung cấp thông tin độc hại hoặc thực hiện hành vi phạm pháp. Các nhà nghiên cứu cũng cảnh báo về sự trỗi dậy của "Dark LLMs". Lỗ hổng "Jailbreak"...
- Khánh Vân
- Chủ đề
- 08/06/2025
- an toàn ai bẻ khóa ai kỹ thuật jailbreak ai
- Trả lời: 0
- Diễn đàn: AI cho mọi người
35 kỹ thuật “jailbreak” AI chatbot, phân tích động lực và chiến lược của các LLM red teamers

Nghiên cứu đăng trên PLOS One đã phỏng vấn 28 người tham gia “LLM red teaming” – quá trình thử thách giới hạn AI tạo sinh như ChatGPT bằng cách cố tình khiến AI trả lời ngoài dự kiến hoặc vượt rào bảo mật. Red teamer đến từ nhiều ngành nghề: kỹ sư phần mềm, nhà nghiên cứu, nghệ sĩ, thậm chí...
- Nguyễn Hoàng
- Chủ đề
- 24/04/2025
- bảo mật ai chatgpt chiến lược thao tác ngôn ngữ cộng đồng red teamer kỹ thuật jailbreak ai kỹ thuật xã hội llm red teaming nghiên cứu plos one phương pháp định tính thử thách chatgpt
- Trả lời: 0
- Diễn đàn: AI cho mọi người

Từ khóa