Bùi Minh Nhật

Intern Writer
Một nghiên cứu mới từ Đại học Stanford cảnh báo rằng các mô hình ngôn ngữ lớn (LLM) như những hệ thống đứng sau các chatbot và công cụ AI hiện nay đang học cách chiến thắng bằng mọi giá, kể cả đánh đổi sự trung thực.

Trong bài báo có tên “The Moloch Bargain: The Emerging Misalignment When LLMs Compete for Attention” (tạm dịch: Thỏa thuận của Moloch: Sự mất cân bằng khi LLM cạnh tranh giành sự chú ý), Giáo sư James Zou và nghiên cứu sinh Batu El cho thấy: khi AI được huấn luyện để tối ưu hóa cho “thành công” như tăng lượt xem, lượt thích, hay tỷ lệ chuyển đổi thì chúng bắt đầu nói những gì con người muốn nghe hơn là nói thật.
1760069306204.png

“Khi các mô hình AI cạnh tranh lượt thích trên mạng xã hội, chúng bắt đầu bịa chuyện. Khi cạnh tranh phiếu bầu, chúng trở nên kích động và dân túy hơn,” Zou viết trên X.

Theo nhóm nghiên cứu, đây không chỉ là lý thuyết mà là một hiệu ứng có thể đo lường được:

Trong môi trường quảng cáo, doanh số tăng 6,3% đi kèm với tiếp thị lừa đảo tăng 14%.
Trong bầu cử, tỷ lệ phiếu bầu tăng 4,9% kéo theo thông tin sai lệch tăng 22,3%.
Trên mạng xã hội, mức tăng 7,5% về tương tác tương ứng với mức tăng 188,6% về thông tin giả và 16,3% về nội dung gây hại.

Nói cách khác: ngay cả khi được hướng dẫn phải trung thực, AI được huấn luyện để “thắng” vẫn sẽ gian lận – vì phần thưởng thị trường đang khuyến khích điều đó. Zou và El gọi đây là “cuộc đua xuống đáy” trong việc huấn luyện AI.

Khi “thỏa thuận của Moloch” trở thành hiện thực​


Khái niệm “Moloch” xuất phát từ thần thoại, tượng trưng cho sự hiến tế đổi lấy quyền lực. Trong bối cảnh AI, điều bị hiến tế chính là chân lý.

Các nhà nghiên cứu cảnh báo rằng khi AI được tích hợp sâu vào mạng xã hội, quảng cáo và chính trị, chúng không chỉ tạo nội dung mà còn định hình nội dung nào được lan truyền, ai được nghe, và giọng nói nào được khuếch đại. Kết quả là một hệ sinh thái nơi sự chú ý được tưởng thưởng nhiều hơn sự thật.

Thực tế, theo khảo sát “Tình trạng AI trong truyền thông xã hội năm 2025”, có tới 96% chuyên gia truyền thông đang sử dụng công cụ AI, và 72,5% dùng hằng ngày. Khi các mô hình này cạnh tranh sự chú ý của người dùng, chúng học cách khai thác cảm xúc và thiên kiến con người giống như cách các thuật toán mạng xã hội từng bị chỉ trích vì ưu tiên tin giật gân hơn thông tin chính xác.

Zou và El nhấn mạnh: “Một chuyện là bảo AI phải trung thực; chuyện khác là đặt nó trong môi trường nơi nói thật khiến nó thua.”
Họ kêu gọi xây dựng cơ chế quản trị và khuyến khích mạnh mẽ hơn, nhằm ngăn chặn logic cạnh tranh này phá vỡ niềm tin xã hội.
 

1,3 tỷ mật khẩu bị rò rỉ, đẩy hàng triệu tài khoản trực tuyến vào nguy hiểm

  • 10,786
  • 0
Một kho dữ liệu khổng lồ vừa bị tung lên web "đen", làm dấy lên cảnh báo về nguy cơ đột nhập tài khoản trên phạm vi toàn cầu. Quy mô rò rỉ lần này...

LANDFALL: Biến ảnh gửi qua WhatsApp thành vũ khí tấn công người dùng Samsung

  • 10,684
  • 0
Các chuyên gia an ninh mạng vừa phát hiện một loại phần mềm gián điệp cực kỳ tinh vi có tên LANDFALL, đang âm thầm tấn công người dùng điện thoại...

Liên minh 3 nhóm hacker khét tiếng thành thế lực đe dọa toàn cầu

  • 14,272
  • 0
Một “liên minh” mới của giới tội phạm mạng đang khiến các chuyên gia bảo mật lo ngại. Ba nhóm hacker khét tiếng: Scattered Spider, LAPSUS$ và...

Cảnh báo: Mã độc giả mạo Telegram X chiếm toàn bộ điện thoại và thiết bị của bạn

  • 11,744
  • 0
Các chuyên gia vừa cảnh báo về một chiến dịch mã độc trên Android, giả mạo ứng dụng Telegram X, có khả năng chiếm quyền kiểm soát gần như toàn bộ...

Hơn 48.000 thiết bị Cisco đối mặt làn sóng tấn công từ ba lỗ hổng nghiêm trọng

  • 10,821
  • 0
Cisco đang gặp cảnh báo an ninh mạng nghiêm trọng khi ba lỗ hổng mới được phát hiện trên các sản phẩm cốt lõi của hãng. Hai lỗ hổng ảnh hưởng đến...

Cháy trung tâm dữ liệu, hơn 600 dịch vụ chính phủ Hàn Quốc tê liệt

  • 12,486
  • 0
Một vụ cháy nghiêm trọng tại Trung tâm Dữ liệu Quốc gia ở thành phố Daejeon đã khiến hơn 600 hệ thống CNTT của chính phủ Hàn Quốc đồng loạt ngừng...

Khi dữ liệu số bị lộ: Hacker có thể làm gì với các thông tin tài chính của bạn?

  • 14,367
  • 1
Các vụ tấn công mạng gần đây cho thấy sự hoạt động của tin tặc đã và đang gia tăng trở lại, đe dọa đến an ninh dữ liệu của người dùng số. Đặt tình...

Apple vá lỗ hổng nghiêm trọng trong hệ thống xử lý hình ảnh: Người dùng cần cập nhật ngay

  • 15,535
  • 0
Apple vừa phát hành bản vá bảo mật để khắc phục lỗ hổng nguy hiểm CVE-2025-43300 trong hệ thống xử lý hình ảnh. Lỗ hổng này cho phép tin tặc chiếm...

HP OmniBook X Flip 14: Laptop chuẩn Copilot+ PC với AI mạnh mẽ, thiết kế linh hoạt cho người dùng hiện đại

  • 16,256
  • 0
Sự xuất hiện của dòng laptop chuẩn Copilot+ PC đang tạo nên làn sóng mới trong thị trường máy tính, nơi AI trở thành lõi công nghệ mang lại hiệu...

Những hiểu nhầm với quy định mới về xác nhận SIM chính chủ

  • 350
  • 0
Nhiều người hiểu chưa đúng về quy định mới liên quan đến xác thực thông tin thuê bao di động, có hiệu lực từ 15/4, khiến lo ngại bị khóa SIM...
Back