jailbreak ai

Chỉ kể chuyện, AI của Snapchat vô tình hướng dẫn cách làm bom xăng

Bạn có tin một chatbot “thân thiện” có thể vô tình dạy người ta cách làm bom chỉ bằng một… câu chuyện không? Thí nghiệm mới của nhóm Cybernews cho thấy hệ thống AI của Snapchat – vốn đang phục vụ hơn 900 triệu người dùng mỗi tháng – có thể bị điều khiển để tiết lộ nội dung bị hạn chế một cách...
- Code Nguyen
- Chủ đề
- 17/10/2025
- ai snapchat ai trẻ vị thành niên an ninh mạng bảo mật ai chế tạo bom chatbot cybernews jailbreak ai lỗ hổng chatbot my ai snapchat nội dung nguy hiểm ai
- Trả lời: 0
- Diễn đàn: Cộng đồng An ninh mạng
Lỗ hổng gây sốc trong Guardrails: Cơ chế bảo mật của OpenAI bị qua mặt bởi chính mô hình mà nó giám sát

Các nhà nghiên cứu bảo mật vừa phát hiện lỗ hổng cơ bản trong nền tảng Guardrails mới ra mắt của OpenAI, cho phép kẻ tấn công vượt qua cơ chế an toàn và tạo ra nội dung độc hại mà không kích hoạt cảnh báo. Điều này làm dấy lên lo ngại về hiệu quả của các biện pháp tự điều chỉnh trong AI...
- Duy Linh
- Chủ đề
- 15/10/2025
- an ninh trí tuệ nhân tạo bảo mật ai hệ thống guardrails jailbreak ai kiểm thử đối kháng lỗ hổng ai lỗ hổng guardrails openai phòng thủ nhiều lớp tấn công prompt injection thẩm phán llm
- Trả lời: 0
- Diễn đàn: Cộng đồng An ninh mạng

Từ khóa

jailbreak ai

Chỉ kể chuyện, AI của Snapchat vô tình hướng dẫn cách làm bom xăng

Lỗ hổng gây sốc trong Guardrails: Cơ chế bảo mật của OpenAI bị qua mặt bởi chính mô hình mà nó giám sát