Bê bối Deepseek hớt váng Claude: Vì sao chỉ “hỏi thật nhiều” lại có thể giúp xây dựng AI riêng?

Câu chuyện bắt đầu từ việc Anthropic, công ty đứng sau mô hình AI Claude, cáo buộc một số công ty Trung Quốc như DeepSeek, Moonshot AI và MiniMax đã tạo hơn 24.000 tài khoản giả để truy cập Claude. Theo Wall Street Journal ngày 23/02/2026, các tài khoản này đã gửi khoảng 16 triệu câu hỏi. Họ dùng proxy để che giấu nguồn truy cập vì Claude bị hạn chế tại Trung Quốc.

Vấn đề nằm ở kỹ thuật gọi là “chưng cất mô hình”. Hiểu đơn giản thế này: bạn có một mô hình AI rất mạnh, giống như một giáo viên cực giỏi. Thay vì tự huấn luyện từ đầu bằng cách thu thập khối dữ liệu khổng lồ và tốn kém, bạn đặt hàng triệu câu hỏi cho “giáo viên”, ghi lại câu trả lời, rồi dùng chính những câu trả lời đó để huấn luyện một mô hình nhỏ hơn. Mô hình nhỏ sẽ học nhanh hơn, rẻ hơn, mà vẫn giữ được phần lớn năng lực.
1771927750212.png

Đây không phải ý tưởng mơ hồ. Từ năm 2015, Geoffrey Hinton đã nghiên cứu và phổ biến kỹ thuật này. Sau đó, hàng loạt ví dụ thực tế chứng minh nó hiệu quả. DistilBERT của Hugging Face là phiên bản rút gọn của BERT, nhỏ hơn khoảng 40% nhưng vẫn giữ khoảng 97% hiệu năng. Microsoft từng chưng cất các mô hình Llama cỡ 405 tỷ tham số xuống bản nhỏ hơn mà vẫn giữ được chất lượng. Chính DeepSeek cũng công khai dùng chưng cất để tạo ra phiên bản nhỏ nhưng mạnh từ mô hình lớn của họ.

Vậy việc dùng tài khoản giả có đủ để xây AI không? Nếu chỉ hỏi vài câu thì không có ý nghĩa. Nhưng nếu hỏi hàng triệu câu, đặc biệt là những câu buộc mô hình phải giải thích từng bước suy nghĩ, viết mã phức tạp, sử dụng công cụ, thì bạn đang thu thập một kho dữ liệu cực kỳ giá trị. Kho dữ liệu này có thể rút ngắn đáng kể thời gian và chi phí huấn luyện.

Anthropic cho rằng quy mô truy vấn trong vụ việc này đủ lớn để “trích xuất năng lực” của Claude. Tuy chưa có bằng chứng công khai cho thấy các mô hình của DeepSeek hay Moonshot đã cải thiện trực tiếp nhờ vụ này, nhưng về mặt kỹ thuật, cách làm đó hoàn toàn có thể mang lại lợi thế.

Điểm gây tranh cãi không nằm ở kỹ thuật, vì chưng cất mô hình là phương pháp hợp pháp và phổ biến. Vấn đề nằm ở cách tiếp cận bị cho là vi phạm điều khoản dịch vụ và cố tình né hạn chế truy cập. Ngoài ra, Anthropic còn cảnh báo rằng nếu chỉ sao chép năng lực mà không sao chép các cơ chế an toàn, mô hình mới có thể thiếu rào chắn kiểm soát rủi ro.

Đây không phải chuyện viễn tưởng. Việc dùng tài khoản giả để thu thập lượng lớn câu trả lời từ một mô hình mạnh hoàn toàn có thể giúp tăng tốc xây dựng AI riêng. Nhưng nó kéo theo rủi ro pháp lý, đạo đức và cả nguy cơ về an toàn công nghệ. #DeepSeekĂnCắp
 

1,3 tỷ mật khẩu bị rò rỉ, đẩy hàng triệu tài khoản trực tuyến vào nguy hiểm

  • 10,786
  • 0
Một kho dữ liệu khổng lồ vừa bị tung lên web "đen", làm dấy lên cảnh báo về nguy cơ đột nhập tài khoản trên phạm vi toàn cầu. Quy mô rò rỉ lần này...

LANDFALL: Biến ảnh gửi qua WhatsApp thành vũ khí tấn công người dùng Samsung

  • 10,684
  • 0
Các chuyên gia an ninh mạng vừa phát hiện một loại phần mềm gián điệp cực kỳ tinh vi có tên LANDFALL, đang âm thầm tấn công người dùng điện thoại...

Liên minh 3 nhóm hacker khét tiếng thành thế lực đe dọa toàn cầu

  • 14,272
  • 0
Một “liên minh” mới của giới tội phạm mạng đang khiến các chuyên gia bảo mật lo ngại. Ba nhóm hacker khét tiếng: Scattered Spider, LAPSUS$ và...

Cảnh báo: Mã độc giả mạo Telegram X chiếm toàn bộ điện thoại và thiết bị của bạn

  • 11,744
  • 0
Các chuyên gia vừa cảnh báo về một chiến dịch mã độc trên Android, giả mạo ứng dụng Telegram X, có khả năng chiếm quyền kiểm soát gần như toàn bộ...

Hơn 48.000 thiết bị Cisco đối mặt làn sóng tấn công từ ba lỗ hổng nghiêm trọng

  • 10,821
  • 0
Cisco đang gặp cảnh báo an ninh mạng nghiêm trọng khi ba lỗ hổng mới được phát hiện trên các sản phẩm cốt lõi của hãng. Hai lỗ hổng ảnh hưởng đến...

Cháy trung tâm dữ liệu, hơn 600 dịch vụ chính phủ Hàn Quốc tê liệt

  • 12,486
  • 0
Một vụ cháy nghiêm trọng tại Trung tâm Dữ liệu Quốc gia ở thành phố Daejeon đã khiến hơn 600 hệ thống CNTT của chính phủ Hàn Quốc đồng loạt ngừng...

Khi dữ liệu số bị lộ: Hacker có thể làm gì với các thông tin tài chính của bạn?

  • 14,367
  • 1
Các vụ tấn công mạng gần đây cho thấy sự hoạt động của tin tặc đã và đang gia tăng trở lại, đe dọa đến an ninh dữ liệu của người dùng số. Đặt tình...

Apple vá lỗ hổng nghiêm trọng trong hệ thống xử lý hình ảnh: Người dùng cần cập nhật ngay

  • 15,535
  • 0
Apple vừa phát hành bản vá bảo mật để khắc phục lỗ hổng nguy hiểm CVE-2025-43300 trong hệ thống xử lý hình ảnh. Lỗ hổng này cho phép tin tặc chiếm...

HP OmniBook X Flip 14: Laptop chuẩn Copilot+ PC với AI mạnh mẽ, thiết kế linh hoạt cho người dùng hiện đại

  • 16,256
  • 0
Sự xuất hiện của dòng laptop chuẩn Copilot+ PC đang tạo nên làn sóng mới trong thị trường máy tính, nơi AI trở thành lõi công nghệ mang lại hiệu...

Những hiểu nhầm với quy định mới về xác nhận SIM chính chủ

  • 350
  • 0
Nhiều người hiểu chưa đúng về quy định mới liên quan đến xác thực thông tin thuê bao di động, có hiệu lực từ 15/4, khiến lo ngại bị khóa SIM...
Back