Meta tuyên bố lấy dữ liệu bài viết công khai của người dùng trên Facebook và Instagram để đào tạo AI

Thế Việt
Thế Việt
Phản hồi: 0
Tập đoàn Meta, công ty mẹ của Facebook và Instagram đã chính thức thông báo về kế hoạch sử dụng dữ liệu công khai của người dùng tại châu Âu để phục vụ việc huấn luyện các mô hình trí tuệ nhân tạo (AI) của mình. Đây là một bước đi đáng chú ý, diễn ra sau gần một năm hãng này phải tạm hoãn kế hoạch tương tự do vấp phải những rào cản pháp lý liên quan đến các quy định bảo vệ dữ liệu và quyền riêng tư nghiêm ngặt của Liên minh châu Âu (EU).

cach-su-dung-meta-AI-1_jpg_75.jpg

Những điểm chính
  • Meta (công ty mẹ Facebook, Instagram) chính thức thông báo (14/4) sẽ sử dụng dữ liệu công khai của người dùng châu Âu (từ 18 tuổi trở lên) để huấn luyện các mô hình AI của hãng.
  • Dữ liệu được sử dụng bao gồm bài đăng, bình luận công khai trên Facebook/Instagram và các tương tác với trợ lý Meta AI.
  • Người dùng tại châu Âu sẽ nhận được thông báo và có quyền từ chối (opt-out) việc dữ liệu của mình bị sử dụng cho mục đích này thông qua một biểu mẫu trực tuyến.
  • Meta cho biết mục đích là để AI hiểu rõ hơn về văn hóa và ngôn ngữ châu Âu, và hãng khẳng định đã đáp ứng các yêu cầu pháp lý về quyền riêng tư của EU sau khi phải trì hoãn kế hoạch từ năm 2024.
  • Động thái này diễn ra trong bối cảnh các công ty AI đang rất cần dữ liệu huấn luyện; Meta tự nhận cách làm của mình (thông báo, cho phép từ chối) là "minh bạch hơn" so với các đối thủ.

Theo thông báo, Meta sẽ sử dụng các nội dung được người dùng (từ 18 tuổi trở lên) chia sẻ công khai trên nền tảng Facebook và Instagram, bao gồm bài đăng (post) và bình luận (comment). Ngoài ra, thông tin mà người dùng đã trao đổi với công cụ trợ lý Meta AI cũng sẽ được đưa vào nguồn dữ liệu huấn luyện.

Meta cho biết người dùng tại châu Âu sẽ nhận được thông báo về việc này qua ứng dụng hoặc email. Quan trọng hơn, công ty cung cấp một cơ chế để người dùng có thể phản đối (opt-out) việc dữ liệu của họ bị sử dụng cho mục đích huấn luyện AI, thông qua việc điền vào một biểu mẫu trực tuyến được cung cấp.

Lý giải cho quyết định này, Meta cho rằng việc sử dụng dữ liệu từ châu Âu là cần thiết để các mô hình AI của họ có thể hiểu và phản ánh tốt hơn nền văn hóa, ngôn ngữ và các sắc thái đa dạng của cộng đồng người dùng trong khu vực. "Các mô hình AI tạo sinh của chúng tôi được đào tạo trên nhiều loại dữ liệu để có thể hiểu được những sắc thái và sự phức tạp đáng kinh ngạc và đa dạng, tạo nên các cộng đồng châu Âu," Meta viết trong thông báo, nhấn mạnh rằng điều này sẽ giúp hỗ trợ tốt hơn cho hàng triệu người dùng và doanh nghiệp tại đây.

skynews-meta-facebook-file_6525684_jpg_75.jpg

Thực tế, việc sử dụng dữ liệu người dùng công khai để huấn luyện AI không phải là mới đối với Meta. Công ty đã và đang làm điều này với dữ liệu từ hầu hết các khu vực khác trên thế giới trong nhiều năm (một số điều tra cho thấy dữ liệu có thể được thu thập từ các bài đăng công khai từ năm 2007). Châu Âu là một ngoại lệ lớn do có các quy định bảo vệ dữ liệu chặt chẽ như GDPR. Kế hoạch ban đầu của Meta là bắt đầu sử dụng dữ liệu người dùng châu Âu từ tháng 6 năm 2024 nhưng đã phải hoãn lại. Lần này, Meta khẳng định họ "đã đáp ứng nghĩa vụ pháp lý của mình" trước khi triển khai.

Động thái của Meta diễn ra trong bối cảnh các công ty phát triển AI đang đối mặt với "cơn khát" dữ liệu huấn luyện ("đói dữ liệu") ngày càng tăng. Việc tìm kiếm các nguồn dữ liệu mới, chất lượng cao và hợp pháp là một thách thức lớn. Sử dụng dữ liệu công khai từ người dùng trên các nền tảng của mình là một giải pháp rõ ràng, nhưng cũng làm dấy lên những tranh cãi. Trang tin Gizmodo gọi đây là hành động đưa dữ liệu người dùng vào "máy xay nội dung", một cách ngầm tuyên bố rằng nội dung công khai của người dùng thuộc về nền tảng và có thể được sử dụng cho mục đích thương mại của công ty.

Cuối tuần trước, cuộc tranh luận về dữ liệu huấn luyện AI càng nóng lên khi Jack Dorsey, người sáng lập Twitter, kêu gọi "xóa tất cả luật về sở hữu trí tuệ", và nhận được sự đồng tình từ Elon Musk. Đề xuất cực đoan này phản ánh phần nào sự khó khăn của các nhà phát triển AI trong việc tiếp cận các nguồn dữ liệu có bản quyền.

Trong thông báo của mình, Meta cũng không quên khẳng định vị thế về sự minh bạch: "Chúng tôi tự hào cách tiếp cận của mình minh bạch hơn nhiều so với các đối thủ trong ngành". Việc công khai thông báo và cung cấp cơ chế phản đối cho người dùng châu Âu được Meta xem là bằng chứng cho tuyên bố này.

Dù vậy, quyết định của Meta chắc chắn sẽ tiếp tục được các cơ quan quản lý và các nhà hoạt động về quyền riêng tư tại châu Âu theo dõi sát sao. Việc cân bằng giữa nhu cầu phát triển công nghệ AI với quyền kiểm soát dữ liệu cá nhân của người dùng vẫn là một bài toán phức tạp trong kỷ nguyên số.
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng

Bị coi là quốc gia kém phát triển, Triều Tiên lấy đâu ra tiền phát triển vũ khí khiến phương Tây e ngại?

  • 238
  • 0
Bất chấp việc được biết đến là một trong những quốc gia nghèo nhất châu Á, Triều Tiên trong những năm gần đây lại liên tục khiến thế giới kinh...

Điểm danh 6 tính năng phổ biến nhất của máy lọc không khí hiện nay, ai chuẩn bị mua cần chú ý

  • 122
  • 0
1. Công nghệ lọc không khí HEPA – Chuẩn mực vàng trong lọc bụi mịn HEPA (High-Efficiency Particulate Air) là công nghệ lọc không khí tiên tiến, có...

Không khí tại các thành phố lớn ô nhiễm nặng nề, đây là loại thiết bị được quan tâm nhiều nhất lúc này

  • 146
  • 0
Hiện nay, máy lọc không khí đang được ngày càng nhiều gia đình sử dụng bởi tính năng lọc sạch không khí tuyệt vời, làm thoáng đãng không gian đặc...

Thương hiệu gia dụng nổi tiếng từ Cộng hoà Séc tạo làn sóng trên thị trường Việt Nam

  • 145
  • 0
Elmich là một thương hiệu gia dụng cao cấp đến từ Cộng hòa Séc, được thành lập vào năm 1995 tại thành phố Ostrava. Với gần 30 năm phát triển...

Siêu máy tính tương lai sẽ "ngốn điện" ngang với 1 thành phố

  • 144
  • 0
Theo báo cáo của Epoch AI (viện nghiên cứu tại San Francisco, công bố cuối tháng 4/2025), đến năm 2030, các siêu máy tính hàng đầu dùng để huấn...

LG đồng hành cùng Hòa Minzy, Obito và Hứa Kim Tuyền tung ra MV “Nếp Nhà”

  • 99
  • 0
LG Electronics Việt Nam vừa giới thiệu MV “Nếp Nhà” với sự kết hợp của ca sĩ Hòa Minzy, rapper Obito và nhạc sĩ Hứa Kim Tuyền. Đây là món quà âm...

Lần đầu tiên một đại gia Việt có tài sản hơn 9 tỉ USD, vượt cả chủ tịch Samsung

  • 206
  • 0
Cổ phiếu VIC của Tập đoàn Vingroup tiếp tục tăng mạnh trong phiên ngày 8-5, góp phần nâng quy mô tài sản ròng của ông Phạm Nhật Vượng vượt 9 tỉ...

Đây là cách "xem YouTube" nhanh nhất có thể bạn chưa thử

  • 248
  • 1
Mô hình Gemini 2.5 Flash có thể tóm tắt nội dung video dài trên YouTube, giúp người dùng tiết kiệm thời gian và nắm bắt thông tin nhanh chóng...

Sạc siêu nhanh xe điện: sự tiện lợi phải trả giá bằng tuổi thọ pin

  • 181
  • 0
Năm 2025 được ca ngợi là "năm bùng nổ sạc siêu nhanh" đối với xe điện. Mặc dù sự tiến bộ nhanh chóng của công nghệ sạc nhanh và sạc siêu nhanh đã...

Cách phục hồi ảnh cũ bằng AI miễn phí nhanh gọn, ai cũng làm được

  • 236
  • 0
Phục hồi ảnh cũ bằng AI miễn phí là giải pháp lý tưởng cho những ai muốn tái hiện lại hình ảnh xưa mà không cần biết quá nhiều về Photoshop hay kỹ...
Back
Top