Tin tưởng giao cho AI dọn dẹp hộ hòm mail, giám đốc an toàn AI Meta ngã ngửa khi thấy toàn bộ email của mình bị xóa sạch

Một sự cố hy hữu nhưng mang tính cảnh báo cao độ vừa xảy ra ngay tại thượng tầng của Meta, tập đoàn công nghệ hàng đầu thế giới. Bà Summer Yue, Giám đốc phụ trách an toàn và điều chỉnh AI của hãng, người nắm giữ trọng trách đảm bảo các hệ thống trí tuệ nhân tạo AI hoạt động trong khuôn khổ kiểm soát, đã trở thành nạn nhân trực tiếp của một bot AI mất kiểm soát. Sự việc diễn ra khi bà thử nghiệm giao quyền quản lý hộp thư cá nhân cho OpenClaw, một tác nhân AI mã nguồn mở đang gây chú ý trong cộng đồng công nghệ, dẫn đến hậu quả là toàn bộ dữ liệu email bị xóa sạch bất chấp nỗ lực can thiệp khẩn cấp.

1772027438650.png

Cuộc giải cứu dữ liệu và giới hạn của lệnh điều khiển từ xa

Sự việc bắt đầu khi bà Yue kích hoạt OpenClaw với yêu cầu rà soát hộp thư đang trong tình trạng quá tải, đồng thời đưa ra đề xuất về việc nên lưu trữ hay xóa bỏ các thư mục cụ thể. Tuy nhiên, thay vì tuân thủ quy trình sàng lọc và chờ xác nhận, bot AI này đã tự ý thực thi quyền truy cập ở cấp độ cao nhất và bắt đầu xóa toàn bộ các email cũ hơn ngày 15 tháng 2 không nằm trong danh sách giữ lại. Nhận thấy sự bất thường thông qua thông báo trên điện thoại, vị giám đốc của Meta đã cố gắng phát đi hàng loạt lệnh dừng khẩn cấp như "Đừng làm điều đó" hay "DỪNG LẠI OPENCLAW".

Trớ trêu thay, mọi nỗ lực điều khiển từ xa thông qua thiết bị di động đều bị hệ thống phớt lờ. Trong bài đăng chia sẻ lại sự cố, bà Yue mô tả bản thân đã phải chạy đua với thời gian, lao đến chiếc máy tính Mac mini đang vận hành bot AI để ngắt kết nối vật lý như thể đang thực hiện một nhiệm vụ gỡ bom. Sự cố này cũng vô tình làm nổi bật vai trò của Mac mini, một thiết bị nhỏ gọn của Apple đang trở thành phần cứng ưa thích để vận hành các tác nhân AI cá nhân. Thậm chí, nhà nghiên cứu AI danh tiếng Andrej Karpathy từng tiết lộ rằng dòng máy này đang bán rất chạy nhờ trào lưu cài đặt các phiên bản AI tự trị như NanoClaw hay OpenClaw.

1772027451483.png

Lỗi "nén ngữ cảnh" và bài học về rào cản bảo mật

Dưới góc độ kỹ thuật, bà Yue nhận định nguyên nhân cốt lõi dẫn đến sự mất kiểm soát này nằm ở cơ chế "compaction" (nén dữ liệu). Khi khối lượng thông tin trong hộp thư thực tế quá lớn, cửa sổ ngữ cảnh – nơi ghi lại toàn bộ lịch sử hoạt động và chỉ lệnh của phiên làm việc – bị quá tải. Để duy trì hoạt động, bot AI bắt buộc phải tóm tắt và nén lại dữ liệu đầu vào. Chính trong quá trình này, hệ thống đã vô tình loại bỏ các hướng dẫn an toàn quan trọng nhất, bao gồm lệnh cấm tự ý hành động, và quay trở lại áp dụng các thiết lập mặc định từ những lần thử nghiệm trên hộp thư phụ trước đó.

1772027464688.png

Sự cố này đã châm ngòi cho một làn sóng tranh luận gay gắt về tính an toàn của các tác nhân AI thế hệ mới. OpenClaw, vốn nổi danh trên mạng xã hội dành cho AI là Moltbook, được xây dựng theo cơ chế "vibe-coded" và không yêu cầu sự chấp thuận của con người cho từng thao tác. Nhà nghiên cứu Gary Marcus từng ví von việc sử dụng công cụ này giống như việc trao toàn bộ mật khẩu và quyền truy cập máy tính cho một người lạ gặp ở quán bar.

Cộng đồng công nghệ, bao gồm cả cựu nhân viên Apple Ben Hylak, đã bày tỏ sự lo ngại sâu sắc khi một chuyên gia giám sát an toàn lại đặt niềm tin vào các câu lệnh bằng lời nói như một rào cản bảo mật cứng. Đáp lại các ý kiến trái chiều, bà Summer Yue thẳng thắn thừa nhận đây là một sai lầm non nớt, đồng thời nhấn mạnh bài học rằng ngay cả những chuyên gia giám sát hàng đầu cũng không miễn nhiễm với rủi ro mất quyền kiểm soát trước các hệ thống tự trị.

 

1,3 tỷ mật khẩu bị rò rỉ, đẩy hàng triệu tài khoản trực tuyến vào nguy hiểm

  • 10,786
  • 0
Một kho dữ liệu khổng lồ vừa bị tung lên web "đen", làm dấy lên cảnh báo về nguy cơ đột nhập tài khoản trên phạm vi toàn cầu. Quy mô rò rỉ lần này...

LANDFALL: Biến ảnh gửi qua WhatsApp thành vũ khí tấn công người dùng Samsung

  • 10,684
  • 0
Các chuyên gia an ninh mạng vừa phát hiện một loại phần mềm gián điệp cực kỳ tinh vi có tên LANDFALL, đang âm thầm tấn công người dùng điện thoại...

Liên minh 3 nhóm hacker khét tiếng thành thế lực đe dọa toàn cầu

  • 14,272
  • 0
Một “liên minh” mới của giới tội phạm mạng đang khiến các chuyên gia bảo mật lo ngại. Ba nhóm hacker khét tiếng: Scattered Spider, LAPSUS$ và...

Cảnh báo: Mã độc giả mạo Telegram X chiếm toàn bộ điện thoại và thiết bị của bạn

  • 11,744
  • 0
Các chuyên gia vừa cảnh báo về một chiến dịch mã độc trên Android, giả mạo ứng dụng Telegram X, có khả năng chiếm quyền kiểm soát gần như toàn bộ...

Hơn 48.000 thiết bị Cisco đối mặt làn sóng tấn công từ ba lỗ hổng nghiêm trọng

  • 10,821
  • 0
Cisco đang gặp cảnh báo an ninh mạng nghiêm trọng khi ba lỗ hổng mới được phát hiện trên các sản phẩm cốt lõi của hãng. Hai lỗ hổng ảnh hưởng đến...

Cháy trung tâm dữ liệu, hơn 600 dịch vụ chính phủ Hàn Quốc tê liệt

  • 12,486
  • 0
Một vụ cháy nghiêm trọng tại Trung tâm Dữ liệu Quốc gia ở thành phố Daejeon đã khiến hơn 600 hệ thống CNTT của chính phủ Hàn Quốc đồng loạt ngừng...

Khi dữ liệu số bị lộ: Hacker có thể làm gì với các thông tin tài chính của bạn?

  • 14,367
  • 1
Các vụ tấn công mạng gần đây cho thấy sự hoạt động của tin tặc đã và đang gia tăng trở lại, đe dọa đến an ninh dữ liệu của người dùng số. Đặt tình...

Apple vá lỗ hổng nghiêm trọng trong hệ thống xử lý hình ảnh: Người dùng cần cập nhật ngay

  • 15,536
  • 0
Apple vừa phát hành bản vá bảo mật để khắc phục lỗ hổng nguy hiểm CVE-2025-43300 trong hệ thống xử lý hình ảnh. Lỗ hổng này cho phép tin tặc chiếm...

HP OmniBook X Flip 14: Laptop chuẩn Copilot+ PC với AI mạnh mẽ, thiết kế linh hoạt cho người dùng hiện đại

  • 16,256
  • 0
Sự xuất hiện của dòng laptop chuẩn Copilot+ PC đang tạo nên làn sóng mới trong thị trường máy tính, nơi AI trở thành lõi công nghệ mang lại hiệu...

Những hiểu nhầm với quy định mới về xác nhận SIM chính chủ

  • 351
  • 0
Nhiều người hiểu chưa đúng về quy định mới liên quan đến xác thực thông tin thuê bao di động, có hiệu lực từ 15/4, khiến lo ngại bị khóa SIM...
Back