Rò rỉ thông tin Anthropic phát triển một mô hình giỏi hack đến mức do dự phát hành

Một vụ rò rỉ dữ liệu vừa tiết lộ rằng Anthropic đang thử nghiệm một mô hình mới có tên “Claude Mythos”, được họ mô tả là “mô hình AI mạnh nhất mà chúng tôi từng phát triển”.

Sự cố xảy ra khi các bài blog nháp và tài liệu nội bộ bị lưu trong một bộ nhớ đệm dữ liệu có thể truy cập công khai.
1774602731126.png

Tạp chí Fortune cùng các nhà nghiên cứu an ninh mạng đã phát hiện gần 3.000 tài liệu chưa công bố trước khi Anthropic kịp khóa quyền truy cập.

Mô hình mới này giới thiệu một cấp độ hoàn toàn mới mang tên “Capybara”, có quy mô lớn hơn và năng lực vượt trội so với Opus.

Theo nội dung rò rỉ

“So với mô hình tốt nhất trước đây của chúng tôi, Claude Opus 4.6, Capybara đạt điểm số cao vượt trội trong các bài kiểm tra về lập trình phần mềm, suy luận học thuật và an ninh mạng.”

Điểm đáng chú ý nằm ở đây.

Anthropic cho biết mô hình này “hiện đang vượt xa mọi AI khác về năng lực tấn công mạng” và “báo hiệu một làn sóng mô hình mới có thể khai thác lỗ hổng nhanh hơn rất nhiều so với khả năng phòng thủ”.

Nói cách khác, nó giỏi hack đến mức chính họ cũng lo ngại việc phát hành rộng rãi.

Kế hoạch của Anthropic là cung cấp quyền truy cập sớm cho các chuyên gia phòng thủ an ninh mạng, để họ củng cố hệ thống trước khi mô hình được phổ biến rộng rãi.

Anthropic cho rằng nguyên nhân vụ rò rỉ là do “lỗi con người” trong hệ thống quản lý nội dung.

Ngoài ra, thông tin bị lộ còn bao gồm chi tiết về một buổi gặp mặt kín dành cho CEO tại một dinh thự Anh thế kỷ 18, nơi Dario Amodei dự kiến sẽ trình diễn các năng lực chưa từng công bố của Claude. #ClaudeMythos

Nguồn: Fortune
 
Sửa lần cuối bởi điều hành viên:

1,3 tỷ mật khẩu bị rò rỉ, đẩy hàng triệu tài khoản trực tuyến vào nguy hiểm

  • 10,786
  • 0
Một kho dữ liệu khổng lồ vừa bị tung lên web "đen", làm dấy lên cảnh báo về nguy cơ đột nhập tài khoản trên phạm vi toàn cầu. Quy mô rò rỉ lần này...

LANDFALL: Biến ảnh gửi qua WhatsApp thành vũ khí tấn công người dùng Samsung

  • 10,684
  • 0
Các chuyên gia an ninh mạng vừa phát hiện một loại phần mềm gián điệp cực kỳ tinh vi có tên LANDFALL, đang âm thầm tấn công người dùng điện thoại...

Liên minh 3 nhóm hacker khét tiếng thành thế lực đe dọa toàn cầu

  • 14,272
  • 0
Một “liên minh” mới của giới tội phạm mạng đang khiến các chuyên gia bảo mật lo ngại. Ba nhóm hacker khét tiếng: Scattered Spider, LAPSUS$ và...

Cảnh báo: Mã độc giả mạo Telegram X chiếm toàn bộ điện thoại và thiết bị của bạn

  • 11,744
  • 0
Các chuyên gia vừa cảnh báo về một chiến dịch mã độc trên Android, giả mạo ứng dụng Telegram X, có khả năng chiếm quyền kiểm soát gần như toàn bộ...

Hơn 48.000 thiết bị Cisco đối mặt làn sóng tấn công từ ba lỗ hổng nghiêm trọng

  • 10,821
  • 0
Cisco đang gặp cảnh báo an ninh mạng nghiêm trọng khi ba lỗ hổng mới được phát hiện trên các sản phẩm cốt lõi của hãng. Hai lỗ hổng ảnh hưởng đến...

Cháy trung tâm dữ liệu, hơn 600 dịch vụ chính phủ Hàn Quốc tê liệt

  • 12,486
  • 0
Một vụ cháy nghiêm trọng tại Trung tâm Dữ liệu Quốc gia ở thành phố Daejeon đã khiến hơn 600 hệ thống CNTT của chính phủ Hàn Quốc đồng loạt ngừng...

Khi dữ liệu số bị lộ: Hacker có thể làm gì với các thông tin tài chính của bạn?

  • 14,367
  • 1
Các vụ tấn công mạng gần đây cho thấy sự hoạt động của tin tặc đã và đang gia tăng trở lại, đe dọa đến an ninh dữ liệu của người dùng số. Đặt tình...

Apple vá lỗ hổng nghiêm trọng trong hệ thống xử lý hình ảnh: Người dùng cần cập nhật ngay

  • 15,534
  • 0
Apple vừa phát hành bản vá bảo mật để khắc phục lỗ hổng nguy hiểm CVE-2025-43300 trong hệ thống xử lý hình ảnh. Lỗ hổng này cho phép tin tặc chiếm...

HP OmniBook X Flip 14: Laptop chuẩn Copilot+ PC với AI mạnh mẽ, thiết kế linh hoạt cho người dùng hiện đại

  • 16,256
  • 0
Sự xuất hiện của dòng laptop chuẩn Copilot+ PC đang tạo nên làn sóng mới trong thị trường máy tính, nơi AI trở thành lõi công nghệ mang lại hiệu...

Những hiểu nhầm với quy định mới về xác nhận SIM chính chủ

  • 350
  • 0
Nhiều người hiểu chưa đúng về quy định mới liên quan đến xác thực thông tin thuê bao di động, có hiệu lực từ 15/4, khiến lo ngại bị khóa SIM...
Back