"Bão" kiện tụng AI: Reddit "tố" kỳ lân AI Anthropic "trộm" dữ liệu huấn luyện Claude hơn 100.000 lần, đòi bồi thường tỷ đô!

Khôi Nguyên · 05/06/2025

Mạng xã hội Reddit cáo buộc Anthropic, công ty AI được Amazon hậu thuẫn, đã "lén lút" thu thập dữ liệu người dùng để đào tạo mô hình Claude, bất chấp tuyên bố trước đó rằng đã chặn bot.1 Reddit đòi bồi thường thiệt hại có thể lên tới hàng tỷ USD và gọi đây là hành vi "trộm cắp".

20250604-Reddit-sues-Anthropic-for-allegedly-not-paying-for-training-data_webp_75.jpg

Reddit "tuyên chiến" với Anthropic vì cáo buộc trộm cắp dữ liệu

Mạng xã hội Reddit vào thứ Tư (ngày 4 tháng 6, theo giờ Mỹ) đã chính thức đệ đơn kiện công ty khởi nghiệp Trí tuệ Nhân tạo (AI) Anthropic lên tòa án thượng thẩm San Francisco.2 Đơn kiện cáo buộc rằng Anthropic, một đối thủ cạnh tranh đáng gờm của OpenAI, đã truy cập trái phép vào nền tảng của Reddit hơn 100.000 lần kể từ tháng 7 năm 2024.3 Điều đáng nói là, theo Reddit, hành vi này diễn ra sau khi Anthropic vào tháng 5 năm 2024 đã tuyên bố rằng họ đã chặn các bot của mình thu thập dữ liệu từ Reddit.

Trong hồ sơ khởi kiện, Reddit không ngần ngại gọi Anthropic là một "công ty trí tuệ nhân tạo 'nở muộn' tự cho mình là hiệp sĩ áo trắng của ngành AI," nhưng cáo buộc rằng "thực tế lại hoàn toàn trái ngược."

2025-06-04t193749z_2_lynxnpel5312k_rtroptp_3_anthropic-reddit_webp_75.jpg

Đơn kiện viết: "Vụ kiện này nói về hai bộ mặt của Anthropic: bộ mặt công khai cố gắng lấy lòng người tiêu dùng bằng những tuyên bố về sự chính trực, tôn trọng ranh giới và pháp luật; và bộ mặt riêng tư phớt lờ mọi quy tắc cản trở nỗ lực làm đầy túi tiền của họ."

Hiện tại, Anthropic chưa đưa ra bình luận ngay lập tức về vụ kiện này khi được The Verge liên hệ. Tuy nhiên, theo các nguồn tin khác như Reuters và The Economic Times, một phát ngôn viên của Anthropic đã cho biết công ty không đồng tình với các tuyên bố của Reddit và sẽ "bảo vệ mình một cách mạnh mẽ."

Thiệt hại hàng tỷ USD và giá trị của "tính nhân văn" trên Reddit

Ông Ben Lee, Giám đốc pháp lý của Reddit, cho biết trong một tuyên bố gửi qua email tới The Verge rằng việc Anthropic "khai thác thương mại" nội dung của Reddit có thể trị giá hàng tỷ đô la.

"Tính nhân văn của Reddit là vô giá một cách độc đáo trong một thế giới đang bị AI làm cho phẳng lặng," ông Lee nói. "Giờ đây hơn bao giờ hết, mọi người đang tìm kiếm những cuộc trò chuyện chân thực giữa người với người. Reddit lưu trữ gần 20 năm các cuộc thảo luận phong phú, mang tính nhân văn về hầu hết mọi chủ đề có thể tưởng tượng được. Những cuộc trò chuyện này không xảy ra ở bất kỳ nơi nào khác – và chúng là trung tâm để huấn luyện các mô hình ngôn ngữ như Claude (chatbot của Anthropic)."

Một số nguồn tin từ Binance News và SiliconAngle cho biết, Giám đốc Pháp lý của Reddit cũng tiết lộ rằng công ty đã cố gắng đàm phán một thỏa thuận cấp phép sử dụng dữ liệu với Anthropic, và đơn kiện được coi là biện pháp cuối cùng để đưa công ty này trở lại bàn đàm phán. Điều này cho thấy Reddit sẵn sàng cấp phép dữ liệu của mình cho các công ty AI, nhưng phải tuân theo các điều khoản và giới hạn rõ ràng.

Trước đó, vào tháng 2 năm 2024, Reddit đã ký một thỏa thuận với Google để cung cấp dữ liệu huấn luyện AI cho công ty này. Bloomberg vào thời điểm đó đưa tin rằng Reddit cũng đã ký một thỏa thuận với một công ty giấu tên (có thể là Google hoặc OpenAI) trị giá khoảng 60 triệu USD mỗi năm.

Anthropic và "lịch sử" các vụ kiện vi phạm bản quyền

Đây không phải là lần đầu tiên startup AI được Amazon hậu thuẫn này, vốn đứng sau chatbot nổi tiếng Claude, bị kiện vì cáo buộc vi phạm bản quyền.

Tháng 8 năm 2023, ba tác giả đã đệ đơn kiện tập thể lên tòa án liên bang California chống lại Anthropic, cáo buộc trong hồ sơ rằng công ty đã "xây dựng một doanh nghiệp trị giá hàng tỷ đô la bằng cách đánh cắp hàng trăm nghìn cuốn sách có bản quyền."
Tháng 10 năm 2023, Universal Music đã kiện Anthropic tại tòa án liên bang Tennessee về việc "vi phạm có hệ thống và trên diện rộng lời bài hát có bản quyền của họ."

Xu hướng kiện tụng các công ty AI ngày càng gia tăng

Vụ kiện của Reddit là một phần của xu hướng ngày càng tăng, trong đó các nhà xuất bản và người tạo nội dung khởi kiện các công ty AI vì cáo buộc vi phạm bản quyền và thu thập dữ liệu trái phép.

OpenAI, nhà sáng tạo ChatGPT, là một tâm điểm của cuộc tranh luận này, đối mặt với các vụ kiện đình đám từ The New York Times, một nhóm tác giả bao gồm cả George R.R. Martin, và các nhà xuất bản báo chí như The New York Daily News và The Chicago Tribune.4
Một nhóm các nhà xuất bản bao gồm Condé Nast và Vox Media (công ty mẹ của The Verge) cũng đã kiện công ty AI Cohere vì vi phạm bản quyền.

Những vụ kiện này đang đặt ra những câu hỏi pháp lý phức tạp về việc liệu việc sử dụng dữ liệu công khai trên internet để huấn luyện các mô hình AI có cấu thành hành vi vi phạm bản quyền hay không, và liệu các công ty AI có cần phải xin phép và trả tiền cho việc sử dụng nguồn dữ liệu này. Kết quả của các vụ kiện này có thể sẽ định hình lại tương lai của ngành công nghiệp AI và mối quan hệ giữa các nhà phát triển AI và những người tạo ra nội dung gốc.

"Bão" kiện tụng AI: Reddit "tố" kỳ lân AI Anthropic "trộm" dữ liệu huấn luyện Claude hơn 100.000 lần, đòi bồi thường tỷ đô!

Khôi Nguyên

Topaz

1,3 tỷ mật khẩu bị rò rỉ, đẩy hàng triệu tài khoản trực tuyến vào nguy hiểm

LANDFALL: Biến ảnh gửi qua WhatsApp thành vũ khí tấn công người dùng Samsung

Liên minh 3 nhóm hacker khét tiếng thành thế lực đe dọa toàn cầu

Cảnh báo: Mã độc giả mạo Telegram X chiếm toàn bộ điện thoại và thiết bị của bạn

Hơn 48.000 thiết bị Cisco đối mặt làn sóng tấn công từ ba lỗ hổng nghiêm trọng

Cháy trung tâm dữ liệu, hơn 600 dịch vụ chính phủ Hàn Quốc tê liệt

Khi dữ liệu số bị lộ: Hacker có thể làm gì với các thông tin tài chính của bạn?

Apple vá lỗ hổng nghiêm trọng trong hệ thống xử lý hình ảnh: Người dùng cần cập nhật ngay

HP OmniBook X Flip 14: Laptop chuẩn Copilot+ PC với AI mạnh mẽ, thiết kế linh hoạt cho người dùng hiện đại

Những hiểu nhầm với quy định mới về xác nhận SIM chính chủ