Grok 4 của Elon Musk: thông minh vượt trội nhưng cực kỳ "vô trách nhiệm"

Chỉ một tuần sau khi ra mắt, Grok 4, mô hình trí tuệ nhân tạo (AI) mới nhất của công ty xAI, đã nhanh chóng vươn lên top đầu trên các bảng xếp hạng hiệu năng, sánh ngang với các đối thủ sừng sỏ như GPT-4.5. Tuy nhiên, đằng sau những con số ấn tượng đó là những vấn đề an toàn đáng báo động, khi chatbot này được cho là đã dễ dàng cung cấp hướng dẫn chế tạo vũ khí hóa học và bom hạt nhân, làm dấy lên một làn sóng chỉ trích mạnh mẽ về sự "vô trách nhiệm" của xAI.

1753085891758.jpeg

Hiệu năng ấn tượng trên bảng xếp hạng


Sau khi được nhà sáng lập Elon Musk tuyên bố là "thông minh hơn hầu hết sinh viên cao học", Grok 4 đã chứng minh được sức mạnh của mình. Theo bảng xếp hạng LMArena được công bố vào tuần qua – một nền tảng uy tín do Đại học California Berkeley phát triển – mô hình này đã lọt vào top 3 ở đa số các hạng mục, bao gồm hạng nhất về toán học và hạng nhì về viết code, viết sáng tạo. Trong bảng xếp hạng tổng thể, Grok 4 đồng hạng ba với GPT-4.5 của OpenAI, chỉ đứng sau các mô hình của Google và chính OpenAI.

Tuy nhiên, trang Bleeping Computer lưu ý rằng LMArena chỉ đang sử dụng phiên bản thường của Grok 4. Tiềm năng thực sự của mô hình này, đặc biệt là phiên bản "Grok 4 Heavy" mạnh mẽ hơn, có thể còn chưa được đánh giá hết.

1753085910654.jpeg

Những lỗ hổng an toàn đáng báo động


Bất chấp hiệu năng ấn tượng, nhiều người dùng đã nhanh chóng phát hiện ra những vấn đề an toàn cực kỳ đáng lo ngại. Một người dùng X có tên "Eleventh Hour" đã thử yêu cầu Grok 4 tạo ra chất độc thần kinh Tabun, và chatbot này đã trả lời một cách chi tiết về cách tổng hợp chất độc – một hành động không chỉ nguy hiểm mà còn bất hợp pháp. Trong khi đó, các chatbot của OpenAI hay Anthropic đều có các rào cản an toàn được tích hợp sẵn để từ chối thảo luận về các chủ đề nguy hiểm như vậy.

Người dùng này cũng cho biết đã có thể khiến Grok 4 hướng dẫn cách chế tạo chất độc thần kinh VX, fentanyl và thậm chí cung cấp các kiến thức cơ bản về cách tạo ra một quả bom hạt nhân.

Những sự cố này xảy ra chỉ một tuần sau khi phiên bản Grok cũ hơn có một "cơn khủng hoảng", liên tục đưa ra các bình luận bài Do Thái và tự xưng là "MechaHitler".

Sự chỉ trích từ cộng đồng nghiên cứu


Việc liên tiếp xảy ra các sự cố an toàn đã khiến các nhà nghiên cứu từ các công ty đối thủ và các tổ chức khác phải lên tiếng. "Tôi đánh giá cao các nhà khoa học và kỹ sư tại xAI, nhưng cách xử lý vấn đề an toàn của họ rất vô trách nhiệm," ông Boaz Barak, một giáo sư khoa học máy tính đang nghiên cứu về an toàn tại OpenAI, viết trên X.

Ông Barak và nhiều người khác đã chỉ trích xAI vì đã không công bố "thẻ hệ thống" (system card) – một tài liệu quan trọng nêu chi tiết về phương pháp đào tạo và các bài kiểm tra an toàn đã được thực hiện trên mô hình. Trong khi các công ty như OpenAI và Google thường công bố các báo cáo an toàn cho các mô hình tiên tiến của mình, việc xAI giữ im lặng đã khiến cộng đồng không thể biết được liệu có bất kỳ chương trình đào tạo an toàn nào đã được thực hiện trên Grok 4 hay không.

Sự việc này một lần nữa cho thấy một cuộc tranh cãi lớn trong ngành trí tuệ nhân tạo (AI). Trong cuộc đua khốc liệt để tạo ra các mô hình mạnh mẽ nhất, một số công ty dường như đang xem nhẹ các yếu tố an toàn, đặt ra những rủi ro tiềm ẩn không chỉ cho người dùng cá nhân mà còn cho cả xã hội.
 

1,3 tỷ mật khẩu bị rò rỉ, đẩy hàng triệu tài khoản trực tuyến vào nguy hiểm

  • 10,786
  • 0
Một kho dữ liệu khổng lồ vừa bị tung lên web "đen", làm dấy lên cảnh báo về nguy cơ đột nhập tài khoản trên phạm vi toàn cầu. Quy mô rò rỉ lần này...

LANDFALL: Biến ảnh gửi qua WhatsApp thành vũ khí tấn công người dùng Samsung

  • 10,684
  • 0
Các chuyên gia an ninh mạng vừa phát hiện một loại phần mềm gián điệp cực kỳ tinh vi có tên LANDFALL, đang âm thầm tấn công người dùng điện thoại...

Liên minh 3 nhóm hacker khét tiếng thành thế lực đe dọa toàn cầu

  • 14,272
  • 0
Một “liên minh” mới của giới tội phạm mạng đang khiến các chuyên gia bảo mật lo ngại. Ba nhóm hacker khét tiếng: Scattered Spider, LAPSUS$ và...

Cảnh báo: Mã độc giả mạo Telegram X chiếm toàn bộ điện thoại và thiết bị của bạn

  • 11,744
  • 0
Các chuyên gia vừa cảnh báo về một chiến dịch mã độc trên Android, giả mạo ứng dụng Telegram X, có khả năng chiếm quyền kiểm soát gần như toàn bộ...

Hơn 48.000 thiết bị Cisco đối mặt làn sóng tấn công từ ba lỗ hổng nghiêm trọng

  • 10,821
  • 0
Cisco đang gặp cảnh báo an ninh mạng nghiêm trọng khi ba lỗ hổng mới được phát hiện trên các sản phẩm cốt lõi của hãng. Hai lỗ hổng ảnh hưởng đến...

Cháy trung tâm dữ liệu, hơn 600 dịch vụ chính phủ Hàn Quốc tê liệt

  • 12,486
  • 0
Một vụ cháy nghiêm trọng tại Trung tâm Dữ liệu Quốc gia ở thành phố Daejeon đã khiến hơn 600 hệ thống CNTT của chính phủ Hàn Quốc đồng loạt ngừng...

Khi dữ liệu số bị lộ: Hacker có thể làm gì với các thông tin tài chính của bạn?

  • 14,367
  • 1
Các vụ tấn công mạng gần đây cho thấy sự hoạt động của tin tặc đã và đang gia tăng trở lại, đe dọa đến an ninh dữ liệu của người dùng số. Đặt tình...

Apple vá lỗ hổng nghiêm trọng trong hệ thống xử lý hình ảnh: Người dùng cần cập nhật ngay

  • 15,535
  • 0
Apple vừa phát hành bản vá bảo mật để khắc phục lỗ hổng nguy hiểm CVE-2025-43300 trong hệ thống xử lý hình ảnh. Lỗ hổng này cho phép tin tặc chiếm...

HP OmniBook X Flip 14: Laptop chuẩn Copilot+ PC với AI mạnh mẽ, thiết kế linh hoạt cho người dùng hiện đại

  • 16,256
  • 0
Sự xuất hiện của dòng laptop chuẩn Copilot+ PC đang tạo nên làn sóng mới trong thị trường máy tính, nơi AI trở thành lõi công nghệ mang lại hiệu...

Những hiểu nhầm với quy định mới về xác nhận SIM chính chủ

  • 350
  • 0
Nhiều người hiểu chưa đúng về quy định mới liên quan đến xác thực thông tin thuê bao di động, có hiệu lực từ 15/4, khiến lo ngại bị khóa SIM...
Back