Phần mềm độc hại đầu tiên tìm cách lừa AI: Cảnh báo cho tương lai an ninh mạng

MinhSec

Writer
Trong một phát hiện gây chú ý, các chuyên gia an ninh mạng đã xác định được mẫu phần mềm độc hại đầu tiên được thiết kế để lừa công cụ trí tuệ nhân tạo, khiến chúng dừng việc phân tích và không phát hiện ra mã độc.

1750905013043.png

"Skynet" nguyên mẫu mã độc hướng đến AI​


Mẫu phần mềm độc hại này được đặt tên là Skynet, gợi nhắc đến trí tuệ nhân tạo nổi loạn trong loạt phim Terminator. Tuy nhiên, hiện tại nó vẫn là một đoạn mã đơn giản, chưa hoàn chỉnh và không thực sự nguy hiểm. Dù vậy, điều khiến các nhà nghiên cứu tại Check Point chú ý là một đoạn nhắc nhở được mã hóa sẵn trong mã độc, hướng dẫn các công cụ AI ngừng phân tích và hiển thị thông báo “KHÔNG PHÁT HIỆN PHẦN MỀM ĐỘC HẠI”.

Khi thử nghiệm trên chính mô hình AI nội bộ và các mô hình như GPT-4.1, các chuyên gia thấy rằng đoạn mã nhắc nhở không có tác dụng thực tế. Mã độc cũng chứa một số đoạn mã nhằm đánh cắp thông tin và lẩn tránh phân tích trong môi trường sandbox, nhưng đều ở mức sơ khai.

Cảnh báo cho tương lai an ninh mạng​


Dù Skynet hiện tại chưa nguy hiểm, nhưng theo Check Point, đây là dấu hiệu đầu tiên cho thấy tin tặc đã bắt đầu tìm cách đánh lừa công cụ bảo mật AI bằng các phương pháp tiêm nhắc nhở tinh vi. Các nhà nghiên cứu cảnh báo, nếu mô hình AI bị thao túng để phản ứng sai lệch với mã độc, hậu quả có thể rất nghiêm trọng.

Nicole Carignan, phó chủ tịch an ninh tại Darktrace, cho rằng mọi phương pháp tác động vào cách AI phân tích dữ liệu đều tiềm ẩn rủi ro. Một mô hình bị lệch hành vi có thể đưa ra phản hồi sai hoặc bỏ sót mã độc, làm giảm độ tin cậy của toàn bộ hệ thống bảo mật.

Skynet cho thấy GenAI cũng dễ bị thao túng như các hệ thống máy tính khác. Các chuyên gia kêu gọi các công ty phát triển phần mềm bảo mật cần ưu tiên các giải pháp xác thực đầu vào, thiết kế trình phân tích vững chắc và không phụ thuộc hoàn toàn vào AI. Vì nếu một mã độc đơn giản đã thử "thao túng" được AI, thì tương lai với các mã độc tinh vi hơn sẽ còn nhiều mối đe dọa khó lường.

 
Được phối hợp thực hiện bởi các chuyên gia của Bkav, cộng đồng An ninh mạng Việt Nam WhiteHat và cộng đồng Khoa học công nghệ VnReview
Sửa lần cuối:

1,3 tỷ mật khẩu bị rò rỉ, đẩy hàng triệu tài khoản trực tuyến vào nguy hiểm

  • 10,786
  • 0
Một kho dữ liệu khổng lồ vừa bị tung lên web "đen", làm dấy lên cảnh báo về nguy cơ đột nhập tài khoản trên phạm vi toàn cầu. Quy mô rò rỉ lần này...

LANDFALL: Biến ảnh gửi qua WhatsApp thành vũ khí tấn công người dùng Samsung

  • 10,684
  • 0
Các chuyên gia an ninh mạng vừa phát hiện một loại phần mềm gián điệp cực kỳ tinh vi có tên LANDFALL, đang âm thầm tấn công người dùng điện thoại...

Liên minh 3 nhóm hacker khét tiếng thành thế lực đe dọa toàn cầu

  • 14,272
  • 0
Một “liên minh” mới của giới tội phạm mạng đang khiến các chuyên gia bảo mật lo ngại. Ba nhóm hacker khét tiếng: Scattered Spider, LAPSUS$ và...

Cảnh báo: Mã độc giả mạo Telegram X chiếm toàn bộ điện thoại và thiết bị của bạn

  • 11,744
  • 0
Các chuyên gia vừa cảnh báo về một chiến dịch mã độc trên Android, giả mạo ứng dụng Telegram X, có khả năng chiếm quyền kiểm soát gần như toàn bộ...

Hơn 48.000 thiết bị Cisco đối mặt làn sóng tấn công từ ba lỗ hổng nghiêm trọng

  • 10,821
  • 0
Cisco đang gặp cảnh báo an ninh mạng nghiêm trọng khi ba lỗ hổng mới được phát hiện trên các sản phẩm cốt lõi của hãng. Hai lỗ hổng ảnh hưởng đến...

Cháy trung tâm dữ liệu, hơn 600 dịch vụ chính phủ Hàn Quốc tê liệt

  • 12,486
  • 0
Một vụ cháy nghiêm trọng tại Trung tâm Dữ liệu Quốc gia ở thành phố Daejeon đã khiến hơn 600 hệ thống CNTT của chính phủ Hàn Quốc đồng loạt ngừng...

Khi dữ liệu số bị lộ: Hacker có thể làm gì với các thông tin tài chính của bạn?

  • 14,367
  • 1
Các vụ tấn công mạng gần đây cho thấy sự hoạt động của tin tặc đã và đang gia tăng trở lại, đe dọa đến an ninh dữ liệu của người dùng số. Đặt tình...

Apple vá lỗ hổng nghiêm trọng trong hệ thống xử lý hình ảnh: Người dùng cần cập nhật ngay

  • 15,534
  • 0
Apple vừa phát hành bản vá bảo mật để khắc phục lỗ hổng nguy hiểm CVE-2025-43300 trong hệ thống xử lý hình ảnh. Lỗ hổng này cho phép tin tặc chiếm...

HP OmniBook X Flip 14: Laptop chuẩn Copilot+ PC với AI mạnh mẽ, thiết kế linh hoạt cho người dùng hiện đại

  • 16,256
  • 0
Sự xuất hiện của dòng laptop chuẩn Copilot+ PC đang tạo nên làn sóng mới trong thị trường máy tính, nơi AI trở thành lõi công nghệ mang lại hiệu...

Những hiểu nhầm với quy định mới về xác nhận SIM chính chủ

  • 350
  • 0
Nhiều người hiểu chưa đúng về quy định mới liên quan đến xác thực thông tin thuê bao di động, có hiệu lực từ 15/4, khiến lo ngại bị khóa SIM...
Back