tấn công prompt injection

Vì sao hộp thoại phê duyệt AI trở thành điểm yếu nghiêm trọng?

Các nhà nghiên cứu bảo mật tại Checkmarx đã phát hiện một lỗ hổng nghiêm trọng trong cơ chế Human-in-the-Loop (HITL) của các tác nhân AI vốn được thiết kế để tăng cường an ninh bằng cách yêu cầu người dùng phê duyệt trước khi thực thi hành động. Thay vì đóng vai trò là tuyến phòng thủ cuối cùng...
- Duy Linh
- Chủ đề
- 25/12/2025
- an ninh tác nhân ai checkmarx nghiên cứu bảo mật claude code bảo mật human-in-the-loop ai lies-in-the-loop lỗ hổng hitl ai microsoft copilot lỗ hổng owasp llm top 10 rủi ro trợ lý lập trình ai tấn công prompt injection
- Trả lời: 0
- Diễn đàn: Cộng đồng An ninh mạng
Lỗ hổng gây sốc trong Guardrails: Cơ chế bảo mật của OpenAI bị qua mặt bởi chính mô hình mà nó giám sát

Các nhà nghiên cứu bảo mật vừa phát hiện lỗ hổng cơ bản trong nền tảng Guardrails mới ra mắt của OpenAI, cho phép kẻ tấn công vượt qua cơ chế an toàn và tạo ra nội dung độc hại mà không kích hoạt cảnh báo. Điều này làm dấy lên lo ngại về hiệu quả của các biện pháp tự điều chỉnh trong AI...
- Duy Linh
- Chủ đề
- 15/10/2025
- an ninh trí tuệ nhân tạo bảo mật ai hệ thống guardrails jailbreak ai kiểm thử đối kháng lỗ hổng ai lỗ hổng guardrails openai phòng thủ nhiều lớp tấn công prompt injection thẩm phán llm
- Trả lời: 0
- Diễn đàn: Cộng đồng An ninh mạng
Đây là bằng chứng AI có thể bị lợi dụng để phát triển ransomware

Công ty an ninh mạng ESET vừa phát hiện một biến thể ransomware mới có tên mã PromptLock, được hỗ trợ bởi trí tuệ nhân tạo (AI). Chủng mã độc này được viết bằng Golang và sử dụng mô hình gpt-oss:20b của OpenAI thông qua API Ollama để tạo ra các tập lệnh Lua độc hại theo thời gian thực. Đây là...
- Nguyễn Tiến Đạt
- Chủ đề
- 28/08/2025
- ai và an ninh mạng anthropic claude ai eset cảnh báo ransomware gpt-oss:20b promisqroute ransomware ai ransomware promptlock ransomware thế hệ mới tấn công prompt injection
- Trả lời: 0
- Diễn đàn: Cộng đồng An ninh mạng
Chỉ một tài liệu độc có thể khiến ChatGPT lộ sạch dữ liệu?

Tại hội nghị hacker Black Hat ở Las Vegas, hai nhà nghiên cứu Michael Bargury và Tamir Ishay Sharbat đã chứng minh một điều đáng sợ: chỉ cần một tài liệu được “tẩm độc” là có thể đánh cắp dữ liệu riêng tư từ ChatGPT, nếu nó được kết nối với các dịch vụ lưu trữ bên ngoài như Google Drive hay...
- Code Nguyen
- Chủ đề
- 08/08/2025
- agentflayer an ninh mạng bảo mật ai black hat chatgpt dữ liệu bị đánh cắp github google drive tài liệu tẩm độc tấn công prompt injection
- Trả lời: 0
- Diễn đàn: Cộng đồng An ninh mạng

Từ khóa

tấn công prompt injection

Vì sao hộp thoại phê duyệt AI trở thành điểm yếu nghiêm trọng?

Lỗ hổng gây sốc trong Guardrails: Cơ chế bảo mật của OpenAI bị qua mặt bởi chính mô hình mà nó giám sát

Đây là bằng chứng AI có thể bị lợi dụng để phát triển ransomware

Chỉ một tài liệu độc có thể khiến ChatGPT lộ sạch dữ liệu?