Những gì tìm thấy trong cơ sở dữ liệu Meta sử dụng để đào tạo AI sáng tạo

Thoại Viết Hoàng
Thoại Viết Hoàng
Phản hồi: 0
Các tác giả đoạt giải Nobel, Dungeons and Dragons, văn học Cơ đốc giáo và truyện khiêu *** đều đóng vai trò là điểm dữ liệu cho máy.
Ghi chú của biên tập viên: Bài viết này là một phần trong loạt bài của The Atlantic về Books3.
Những gì tìm thấy trong cơ sở dữ liệu Meta sử dụng để đào tạo AI sáng tạo
Mùa hè này, tôi đã báo cáo về một tập dữ liệu gồm hơn 191.000 cuốn sách được Meta, Bloomberg và những người khác sử dụng mà không được phép để đào tạo các hệ thống Generative AI. “Books3”, như tên gọi của nó, dựa trên một bộ sưu tập sách điện tử lậu bao gồm sách hướng dẫn du lịch, tiểu thuyết khiêu *** tự xuất bản, tiểu thuyết của Stephen King và Margaret Atwood, v.v. Nó hiện là trung tâm của một số vụ kiện chống lại Meta bởi những người viết cho rằng việc sử dụng nó dẫn đến vi phạm bản quyền.
Sách đóng một vai trò quan trọng trong việc đào tạo các hệ thống AI sáng tạo. Các đoạn văn dài, nhất quán theo chủ đề của họ cung cấp thông tin về cách xây dựng các đoạn văn dài, nhất quán theo chủ đề—điều cần thiết để tạo ra ảo giác về trí thông minh. Do đó, các công ty công nghệ sử dụng bộ sách dữ liệu khổng lồ mà thường không được phép, mua hoặc cấp phép. (Các luật sư của Meta đã lập luận trong một hồ sơ tòa án gần đây rằng cả kết quả đầu ra từ AI sáng tạo của công ty cũng như bản thân mô hình đều không “về cơ bản giống” với các cuốn sách hiện có.)
Tham khảo bài viết gốc tại đây:
 
Sửa lần cuối bởi điều hành viên:


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng

Điểm danh 6 tính năng phổ biến nhất của máy lọc không khí hiện nay, ai chuẩn bị mua cần chú ý

  • 121
  • 0
1. Công nghệ lọc không khí HEPA – Chuẩn mực vàng trong lọc bụi mịn HEPA (High-Efficiency Particulate Air) là công nghệ lọc không khí tiên tiến, có...

Không khí tại các thành phố lớn ô nhiễm nặng nề, đây là loại thiết bị được quan tâm nhiều nhất lúc này

  • 145
  • 0
Hiện nay, máy lọc không khí đang được ngày càng nhiều gia đình sử dụng bởi tính năng lọc sạch không khí tuyệt vời, làm thoáng đãng không gian đặc...

Thương hiệu gia dụng nổi tiếng từ Cộng hoà Séc tạo làn sóng trên thị trường Việt Nam

  • 144
  • 0
Elmich là một thương hiệu gia dụng cao cấp đến từ Cộng hòa Séc, được thành lập vào năm 1995 tại thành phố Ostrava. Với gần 30 năm phát triển...

Siêu máy tính tương lai sẽ "ngốn điện" ngang với 1 thành phố

  • 143
  • 0
Theo báo cáo của Epoch AI (viện nghiên cứu tại San Francisco, công bố cuối tháng 4/2025), đến năm 2030, các siêu máy tính hàng đầu dùng để huấn...

LG đồng hành cùng Hòa Minzy, Obito và Hứa Kim Tuyền tung ra MV “Nếp Nhà”

  • 99
  • 0
LG Electronics Việt Nam vừa giới thiệu MV “Nếp Nhà” với sự kết hợp của ca sĩ Hòa Minzy, rapper Obito và nhạc sĩ Hứa Kim Tuyền. Đây là món quà âm...

Lần đầu tiên một đại gia Việt có tài sản hơn 9 tỉ USD, vượt cả chủ tịch Samsung

  • 206
  • 0
Cổ phiếu VIC của Tập đoàn Vingroup tiếp tục tăng mạnh trong phiên ngày 8-5, góp phần nâng quy mô tài sản ròng của ông Phạm Nhật Vượng vượt 9 tỉ...

Đây là cách "xem YouTube" nhanh nhất có thể bạn chưa thử

  • 248
  • 1
Mô hình Gemini 2.5 Flash có thể tóm tắt nội dung video dài trên YouTube, giúp người dùng tiết kiệm thời gian và nắm bắt thông tin nhanh chóng...

Sạc siêu nhanh xe điện: sự tiện lợi phải trả giá bằng tuổi thọ pin

  • 181
  • 0
Năm 2025 được ca ngợi là "năm bùng nổ sạc siêu nhanh" đối với xe điện. Mặc dù sự tiến bộ nhanh chóng của công nghệ sạc nhanh và sạc siêu nhanh đã...

Cách phục hồi ảnh cũ bằng AI miễn phí nhanh gọn, ai cũng làm được

  • 236
  • 0
Phục hồi ảnh cũ bằng AI miễn phí là giải pháp lý tưởng cho những ai muốn tái hiện lại hình ảnh xưa mà không cần biết quá nhiều về Photoshop hay kỹ...

Samsung công bố hàng loạt TV Neo QLED 8K đến QLED 4K vừa đạt chuẩn chấm lượng tử đích thực từ tổ chức của Đức

  • 134
  • 0
Samsung vừa thông báo rằng dòng TV QLED mới nhất của hãng đã nhận được chứng nhận ‘Màn hình Chấm lượng tử Đích thực’ (Real Quantum Dot Display) từ...
Back
Top