90% dữ liệu AI là tiếng Anh Mỹ: Thảm họa ‘xóa sổ’ ngôn ngữ toàn cầu hay cơ hội để công nghệ trở nên công bằng hơn?

Nguyễn Hoàng
Nguyễn Hoàng
Phản hồi: 0

Nguyễn Hoàng

Intern Writer
90% dữ liệu đào tạo của AI tạo sinh hiện nay xuất phát từ tiếng Anh, chủ yếu là tiếng Anh Mỹ dòng chính (tiếng Anh Mỹ chính thống).

1746527192108.png


Tiếng Anh Mỹ sử dụng các ưu tiên về lịch sử, kinh tế, công nghệ và giá trị của các tập đoàn công nghệ Mỹ như Google, Meta, Microsoft, OpenAI.

Các sản phẩm AI như tự động sửa lỗi, chuyển giọng nói thành văn bản, hay hỗ trợ viết bằng AI đều dựa trên dữ liệu tiếng Anh, dẫn đến loại trừ hoặc “sửa” các biến thể tiếng Anh khác.

nghiên cứu cho người nói tiếng Anh Nghiên cứu không thuộc dòng chính cảm thấy thất vọng khi các công nghệ AI đều dùng giọng Mỹ, gây khó chịu và cảm giác bị loại trừ.


Ví dụ thực tế: Một nhà ngôn ngữ gọi điện cho các nhà sử dụng 3 phương ngữ khác nhau tại Mỹ, kết quả chỉ giọng Mỹ dòng chính mới nhận được nhiều lời mời xem nhà – chứng tỏ thiên vị ngôn ngữ không chỉ tồn tại ở ngoài đời mà vẫn được củng cố bởi AI.

Khi AI được ứng dụng rộng rãi, hậu quả của thiên vị này càng nghiêm trọng hơn: Ứng dụng dùng tiếng Anh Ấn Độ có thể là hệ thống AI chấm điểm hồ sơ thấp, phần mềm nhận diện giao diện giọng nói bỏ từ quan trọng trong văn bản địa chỉ.

Các biến thể tiếng Anh như tiếng Anh bản địa Úc, Anh Ấn Độ, Anh Singapore… đều có cấu trúc, từ vựng và “luật” riêng, nhưng thường được xem là “tiếng Anh hư hỏng” hoặc bị loại ra khỏi tập dữ liệu huấn luyện.

AI đa ngôn ngữ trên lý thuyết nhưng lại đơn ngữ trong thực tế thiếu dữ liệu của các biến thể tiếng Anh.

Để hướng tới công việc sử dụng ngôn ngữ, cần phát triển AI công nhận đa dạng tiếng Anh, hợp tác giữa các nhà ngôn ngữ học, kỹ sư, giáo viên và cộng đồng địa phương.

Mục tiêu là thay đổi công nghệ cho phù hợp với người dùng, không phải “sửa” người dùng theo tiêu chuẩn tiếng Anh Mỹ.

📌 Khoảng 90% dữ liệu AI tạo ra hiện nay là tiếng Anh của Anh, gây ra bất công và làm mờ các biến thể khác ở Anh. Hệ thống AI cần thay đổi để tôn trọng đa dạng ngôn ngữ, tránh duy trì “ảo giác” về tiếng Anh tiêu chuẩn và tạo ra kết quả công việc bằng cho toàn cầu.

Nguồn bài viết: https://songai.vn/posts/90-du-lieu-...ng-va-lam-lu-mo-nhung-bien-the-tieng-anh-khac
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng

LG đồng hành cùng Hòa Minzy, Obito và Hứa Kim Tuyền tung ra MV “Nếp Nhà”

  • 99
  • 0
LG Electronics Việt Nam vừa giới thiệu MV “Nếp Nhà” với sự kết hợp của ca sĩ Hòa Minzy, rapper Obito và nhạc sĩ Hứa Kim Tuyền. Đây là món quà âm...

Lần đầu tiên một đại gia Việt có tài sản hơn 9 tỉ USD, vượt cả chủ tịch Samsung

  • 206
  • 0
Cổ phiếu VIC của Tập đoàn Vingroup tiếp tục tăng mạnh trong phiên ngày 8-5, góp phần nâng quy mô tài sản ròng của ông Phạm Nhật Vượng vượt 9 tỉ...

Đây là cách "xem YouTube" nhanh nhất có thể bạn chưa thử

  • 248
  • 1
Mô hình Gemini 2.5 Flash có thể tóm tắt nội dung video dài trên YouTube, giúp người dùng tiết kiệm thời gian và nắm bắt thông tin nhanh chóng...

Sạc siêu nhanh xe điện: sự tiện lợi phải trả giá bằng tuổi thọ pin

  • 181
  • 0
Năm 2025 được ca ngợi là "năm bùng nổ sạc siêu nhanh" đối với xe điện. Mặc dù sự tiến bộ nhanh chóng của công nghệ sạc nhanh và sạc siêu nhanh đã...

Cách phục hồi ảnh cũ bằng AI miễn phí nhanh gọn, ai cũng làm được

  • 236
  • 0
Phục hồi ảnh cũ bằng AI miễn phí là giải pháp lý tưởng cho những ai muốn tái hiện lại hình ảnh xưa mà không cần biết quá nhiều về Photoshop hay kỹ...

Samsung công bố hàng loạt TV Neo QLED 8K đến QLED 4K vừa đạt chuẩn chấm lượng tử đích thực từ tổ chức của Đức

  • 134
  • 0
Samsung vừa thông báo rằng dòng TV QLED mới nhất của hãng đã nhận được chứng nhận ‘Màn hình Chấm lượng tử Đích thực’ (Real Quantum Dot Display) từ...

Sếp Apple dự đoán "ngày tàn" của iPhone chỉ trong 10 năm tới: Lý do từ kẻ mà "ai cũng biết là ai"

  • 1,237
  • 0
Phó chủ tịch cấp cao phụ trách mảng dịch vụ của Apple, ông Eddy Cue, vừa đưa ra một nhận định gây sửng sốt về tương lai của chính sản phẩm chủ lực...

"Cú lừa" của Apple và Samsung về dung lượng lưu trữ điện thoại

  • 287
  • 0
Chi phí tăng đáng kể khi nâng cấp bộ nhớ được cho là chiến lược tối đa hóa lợi nhuận của các hãng smartphone, đặc biệt ở phân khúc cao cấp...

Hãng xe lớn nhất thế giới bay mất 1,3 tỷ USD lợi nhuận chỉ trong 2 tháng vì thuế Mỹ

  • 212
  • 0
Một năm trước, hãng sản xuất ô tô lớn nhất thế giới Toyota đã có một năm thành công rực rỡ. Người tiêu dùng Mỹ đã mua xe hybrid của Toyota và đồng...

Thị trường Nhật Bản "nín thở" chờ BYD công phá hàng rào bảo vệ các hãng xe nội địa

  • 167
  • 0
Thị trường xe siêu nhỏ (kei car) là một rào cản phi thuế quan lớn, bảo vệ ngành ô tô Nhật Bản trước các nhà sản xuất nước ngoài. Xe siêu nhỏ chiếm...
Back
Top