Đầu độc dữ liệu: cách tin tặc có thể "dạy hư" và đánh lừa trí tuệ nhân tạo AI

Khi các hệ thống trí tuệ nhân tạo (AI) ngày càng được ứng dụng rộng rãi trong các lĩnh vực quan trọng như tài chính, y tế và giao thông, một loại hình tấn công mạng mới cũng đang nổi lên, có khả năng gây ra những hậu quả nghiêm trọng: tấn công đầu độc dữ liệu (data poisoning). Bằng cách lén lút đưa thông tin sai lệch vào bộ dữ liệu huấn luyện, tin tặc có thể làm suy giảm hoặc thậm chí là kiểm soát hành vi của một mô hình AI.

1755700221709.jpeg

Đầu độc dữ liệu hoạt động như thế nào?


Một mô hình AI chỉ có thể thông minh và chính xác bằng chính chất lượng của dữ liệu mà nó được "học". Đầu độc dữ liệu là một loại tấn công nhắm vào chính giai đoạn "học" này. Kẻ tấn công sẽ tìm cách đưa các thông tin sai lệch hoặc độc hại vào tập dữ liệu huấn luyện, từ đó làm sai lệch "nhận thức" của mô hình.

Hãy tưởng tượng một hệ thống AI quản lý hoạt động tại một nhà ga xe lửa, sử dụng camera để xác định khi nào một sân ga còn trống. Kẻ tấn công có thể sử dụng một tia laser màu đỏ, có hình dạng giống đèn phanh của tàu hỏa, để đánh lừa camera. Nếu hệ thống AI "học" được rằng tín hiệu laser này có nghĩa là sân ga đang có tàu, nó có thể sẽ đưa ra các quyết định sai lầm, gây ra sự chậm trễ hoặc thậm chí là các tai nạn nghiêm trọng.

Một ví dụ nổi tiếng trong quá khứ là trường hợp của chatbot Tay do Microsoft ra mắt vào năm 2016. Chỉ trong vòng vài giờ, bằng cách liên tục "dạy" cho chatbot này những bình luận không phù hợp, người dùng trên mạng xã hội đã biến Tay từ một AI thân thiện thành một cỗ máy phát ngôn phân biệt chủng tộc, buộc Microsoft phải vô hiệu hóa nó chỉ sau chưa đầy 24 giờ.

1755700231708.jpeg

Các biện pháp phòng thủ mới


Để chống lại mối đe dọa tinh vi này, các nhà nghiên cứu đang phát triển những biện pháp phòng thủ tiên tiến. Tại Đại học Quốc tế Florida, phó giáo sư M. Hadi Amini và các cộng sự đang tập trung vào hai công nghệ chính.

Phương pháp thứ nhất là học liên kết (federated learning). Thay vì tập trung toàn bộ dữ liệu huấn luyện vào một nơi duy nhất, phương pháp này cho phép một mô hình AI có thể học từ nhiều nguồn dữ liệu phi tập trung. Điều này giúp giảm thiểu rủi ro, bởi dữ liệu bị đầu độc từ một nguồn sẽ không ngay lập tức ảnh hưởng đến toàn bộ mô hình.

Phương pháp thứ hai là ứng dụng blockchain. Công nghệ sổ cái kỹ thuật số không thể thay đổi của blockchain có thể được sử dụng để tạo ra một bản ghi minh bạch và được bảo mật về toàn bộ quá trình huấn luyện của một mô hình AI. Bất kỳ sự thay đổi bất thường nào trong dữ liệu đầu vào đều có thể được phát hiện và truy vết một cách dễ dàng.

Bên cạnh đó, các nhà nghiên cứu cũng đang phát triển các bộ lọc có khả năng rà soát và loại bỏ các dữ liệu đáng ngờ trước khi chúng được đưa vào huấn luyện.

Trong bối cảnh AI ngày càng đóng một vai trò quan trọng trong các hệ thống hạ tầng trọng yếu, việc đảm bảo tính toàn vẹn và an toàn của dữ liệu huấn luyện không còn là một vấn-đề-kỹ-thuật đơn thuần, mà đã trở thành một yêu cầu an ninh cấp thiết.
 

1,3 tỷ mật khẩu bị rò rỉ, đẩy hàng triệu tài khoản trực tuyến vào nguy hiểm

  • 10,786
  • 0
Một kho dữ liệu khổng lồ vừa bị tung lên web "đen", làm dấy lên cảnh báo về nguy cơ đột nhập tài khoản trên phạm vi toàn cầu. Quy mô rò rỉ lần này...

LANDFALL: Biến ảnh gửi qua WhatsApp thành vũ khí tấn công người dùng Samsung

  • 10,684
  • 0
Các chuyên gia an ninh mạng vừa phát hiện một loại phần mềm gián điệp cực kỳ tinh vi có tên LANDFALL, đang âm thầm tấn công người dùng điện thoại...

Liên minh 3 nhóm hacker khét tiếng thành thế lực đe dọa toàn cầu

  • 14,272
  • 0
Một “liên minh” mới của giới tội phạm mạng đang khiến các chuyên gia bảo mật lo ngại. Ba nhóm hacker khét tiếng: Scattered Spider, LAPSUS$ và...

Cảnh báo: Mã độc giả mạo Telegram X chiếm toàn bộ điện thoại và thiết bị của bạn

  • 11,744
  • 0
Các chuyên gia vừa cảnh báo về một chiến dịch mã độc trên Android, giả mạo ứng dụng Telegram X, có khả năng chiếm quyền kiểm soát gần như toàn bộ...

Hơn 48.000 thiết bị Cisco đối mặt làn sóng tấn công từ ba lỗ hổng nghiêm trọng

  • 10,821
  • 0
Cisco đang gặp cảnh báo an ninh mạng nghiêm trọng khi ba lỗ hổng mới được phát hiện trên các sản phẩm cốt lõi của hãng. Hai lỗ hổng ảnh hưởng đến...

Cháy trung tâm dữ liệu, hơn 600 dịch vụ chính phủ Hàn Quốc tê liệt

  • 12,486
  • 0
Một vụ cháy nghiêm trọng tại Trung tâm Dữ liệu Quốc gia ở thành phố Daejeon đã khiến hơn 600 hệ thống CNTT của chính phủ Hàn Quốc đồng loạt ngừng...

Khi dữ liệu số bị lộ: Hacker có thể làm gì với các thông tin tài chính của bạn?

  • 14,367
  • 1
Các vụ tấn công mạng gần đây cho thấy sự hoạt động của tin tặc đã và đang gia tăng trở lại, đe dọa đến an ninh dữ liệu của người dùng số. Đặt tình...

Apple vá lỗ hổng nghiêm trọng trong hệ thống xử lý hình ảnh: Người dùng cần cập nhật ngay

  • 15,535
  • 0
Apple vừa phát hành bản vá bảo mật để khắc phục lỗ hổng nguy hiểm CVE-2025-43300 trong hệ thống xử lý hình ảnh. Lỗ hổng này cho phép tin tặc chiếm...

HP OmniBook X Flip 14: Laptop chuẩn Copilot+ PC với AI mạnh mẽ, thiết kế linh hoạt cho người dùng hiện đại

  • 16,256
  • 0
Sự xuất hiện của dòng laptop chuẩn Copilot+ PC đang tạo nên làn sóng mới trong thị trường máy tính, nơi AI trở thành lõi công nghệ mang lại hiệu...

Những hiểu nhầm với quy định mới về xác nhận SIM chính chủ

  • 350
  • 0
Nhiều người hiểu chưa đúng về quy định mới liên quan đến xác thực thông tin thuê bao di động, có hiệu lực từ 15/4, khiến lo ngại bị khóa SIM...
Back