Melissa Ingle, một nhà khoa học dữ liệu kỳ cựu tại Twitter, đã có những đóng góp quan trọng trong lĩnh vực bảo vệ tính toàn vẹn công dân và chống thông tin sai lệch chính trị. Là một nhân viên hợp đồng, cô đã phát triển các thuật toán nhằm giúp quản lý nội dung độc hại trên Twitter, đặc biệt là trước các cuộc bầu cử tại Mỹ và Brazil. Tuy nhiên, vào đầu tháng này, Ingle cùng với 4.400 nhân viên hợp đồng khác đã mất quyền truy cập vào hệ thống nội bộ của Twitter mà không được thông báo trước. Nhiều người dự đoán rằng việc cắt giảm đội ngũ kiểm duyệt sẽ ảnh hưởng nặng nề đến sức khỏe của mạng xã hội này. Ingle đã chia sẻ với Rest of World những lo ngại của cô về tương lai không chắc chắn của công tác kiểm duyệt trên Twitter.
Cô cho biết, trong vai trò là nhà khoa học dữ liệu, Ingle đã viết và theo dõi các thuật toán nhằm quét tìm thông tin sai lệch chính trị trên Twitter. Các mô hình này được liên tục cập nhật và cải thiện, và một phần các tweet bị nghi ngờ sẽ được gửi tới kiểm tra của con người. Đội ngũ chính cho công tác kiểm duyệt nội dung tổng cộng có 30 người, chuyên kiểm tra tất cả các loại nội dung như phát ngôn thù ghét, quấy rối, khiêu ***, lạm dụng trẻ em, hay nạn buôn bán người. Đội ngũ này chủ yếu là các nhà khoa học dữ liệu và họ phối hợp với nhiều nhóm khác nhau trong Twitter.
Trong quá trình làm việc, họ đã giám sát và đánh dấu các tweet liên quan đến cuộc bầu cử tại Mỹ và Brazil. Mỗi quốc gia với tập người dùng lớn có các chính sách khác nhau, và họ đã phát triển các thuật toán dựa trên các chính sách địa phương, cũng như tham khảo ý kiến từ những người am hiểu về ngôn ngữ và văn hóa của từng quốc gia. Tuy nhiên, Ingle cho rằng họ đã bỏ lỡ nhiều quốc gia ở châu Phi và gặp khó khăn khi làm việc ở một số khu vực tại Đông Nam Á do sự can thiệp của chính quyền địa phương.
Cô cũng thừa nhận rằng có thể đã có phần lạm dụng trong quy trình. Là một người đóng góp không phải CEO, nhưng Ingle tin rằng việc kiểm duyệt nội dung cần cả hai phương pháp: thuật toán và kiểm tra của con người, đặc biệt khi có tới 37,5 triệu tweet được đăng mỗi giờ. Khi số lượng nhân viên bị cắt giảm, không còn ai ở lại để giám sát hoạt động này. Thêm vào đó, việc học máy cần phải được cập nhật liên tục để phản ánh sự thay đổi của các diễn ngôn chính trị. Hiện tại, chúng ta chưa thấy được tác động tiêu cực của những chính sách này.
Điều mà Ingle lo ngại nhất chính là sự thiếu hụt các nhà kiểm duyệt con người – những người theo dõi thời gian thực và xem xét các tweet được báo cáo. Hơn nữa, các thuật toán sẽ ngày càng kém hiệu quả và cho phép nhiều thông tin sai lệch hơn lọt vào.
Rất tiếc, chỉ riêng việc tự động hóa là không đủ. Cô không khẳng định rằng chúng ta không thể đạt được điều đó trong tương lai, nhưng hiện tại, cả việc học máy và kiểm tra của con người đều cần thiết. Nếu không có biện pháp can thiệp kịp thời, tình trạng thông tin sai lệch và quấy rối sẽ ngày càng tồi tệ.
Nguồn tham khảo: https://restofworld.org/2022/misinformation-on-twitter-will-get-worse/
Cô cho biết, trong vai trò là nhà khoa học dữ liệu, Ingle đã viết và theo dõi các thuật toán nhằm quét tìm thông tin sai lệch chính trị trên Twitter. Các mô hình này được liên tục cập nhật và cải thiện, và một phần các tweet bị nghi ngờ sẽ được gửi tới kiểm tra của con người. Đội ngũ chính cho công tác kiểm duyệt nội dung tổng cộng có 30 người, chuyên kiểm tra tất cả các loại nội dung như phát ngôn thù ghét, quấy rối, khiêu ***, lạm dụng trẻ em, hay nạn buôn bán người. Đội ngũ này chủ yếu là các nhà khoa học dữ liệu và họ phối hợp với nhiều nhóm khác nhau trong Twitter.

Trong quá trình làm việc, họ đã giám sát và đánh dấu các tweet liên quan đến cuộc bầu cử tại Mỹ và Brazil. Mỗi quốc gia với tập người dùng lớn có các chính sách khác nhau, và họ đã phát triển các thuật toán dựa trên các chính sách địa phương, cũng như tham khảo ý kiến từ những người am hiểu về ngôn ngữ và văn hóa của từng quốc gia. Tuy nhiên, Ingle cho rằng họ đã bỏ lỡ nhiều quốc gia ở châu Phi và gặp khó khăn khi làm việc ở một số khu vực tại Đông Nam Á do sự can thiệp của chính quyền địa phương.
Cô cũng thừa nhận rằng có thể đã có phần lạm dụng trong quy trình. Là một người đóng góp không phải CEO, nhưng Ingle tin rằng việc kiểm duyệt nội dung cần cả hai phương pháp: thuật toán và kiểm tra của con người, đặc biệt khi có tới 37,5 triệu tweet được đăng mỗi giờ. Khi số lượng nhân viên bị cắt giảm, không còn ai ở lại để giám sát hoạt động này. Thêm vào đó, việc học máy cần phải được cập nhật liên tục để phản ánh sự thay đổi của các diễn ngôn chính trị. Hiện tại, chúng ta chưa thấy được tác động tiêu cực của những chính sách này.

Điều mà Ingle lo ngại nhất chính là sự thiếu hụt các nhà kiểm duyệt con người – những người theo dõi thời gian thực và xem xét các tweet được báo cáo. Hơn nữa, các thuật toán sẽ ngày càng kém hiệu quả và cho phép nhiều thông tin sai lệch hơn lọt vào.
Rất tiếc, chỉ riêng việc tự động hóa là không đủ. Cô không khẳng định rằng chúng ta không thể đạt được điều đó trong tương lai, nhưng hiện tại, cả việc học máy và kiểm tra của con người đều cần thiết. Nếu không có biện pháp can thiệp kịp thời, tình trạng thông tin sai lệch và quấy rối sẽ ngày càng tồi tệ.

Nguồn tham khảo: https://restofworld.org/2022/misinformation-on-twitter-will-get-worse/