ChatGPT đã bí mật huấn luyện lại não người như thế nào

Nguyễn Hoàng

Administrator
Bạn có bao giờ thấy bạn bè mình bỗng dưng nói những từ mà trước đây rất ít ai dùng, nhưng giờ lại vang lên khắp nơi, kể cả trong những cuộc trò chuyện bình thường ở Việt Nam?

Khi con người bắt đầu nói chuyện như chatbot​

Câu chuyện thú vị nhưng cũng có phần đáng lo là ngôn ngữ con người đang dần chịu ảnh hưởng từ chatbot như ChatGPT, Gemini hay Claude. Về bề ngoài, ta cứ nghĩ mình và chatbot cùng nói tiếng Anh hoặc tiếng Việt, nhưng thực chất lại không hẳn vậy.

Khi bạn gõ một câu, chatbot không xử lý như não người, nó biến câu chữ thành một chuỗi số trong “không gian vectơ” giống như một bản đồ phẳng. Và bản đồ thì luôn thiếu chi tiết so với lãnh thổ thực. Kết quả trả về cũng chỉ là dự đoán từng từ dựa trên dữ liệu huấn luyện, vốn đã chứa sẵn những thiên lệch. Nói cách khác, ngôn ngữ chatbot giống như một bản sao, nhìn quen thuộc nhưng không phải tiếng người thật sự.
1755765338997.png
Điều bất ngờ là với hàng trăm triệu người dùng, thói quen ngôn ngữ này đang ngấm ngược trở lại con người. Một ví dụ điển hình là từ “delve” (đào sâu, tìm hiểu kỹ). ChatGPT sử dụng từ này thường xuyên hơn mức con người vốn dùng. Theo nghiên cứu, một phần nguyên nhân là từ phản hồi của đội ngũ kiểm tra chất lượng, nhiều người đến từ các quốc gia nơi “delve” phổ biến hơn. Những sai lệch nhỏ như thế dần tích tụ và được khuếch đại.

Ngôn ngữ lặp lại, vòng lặp ảnh hưởng​

Hệ quả là chỉ trong hai năm, tần suất từ “delve” xuất hiện trong các bài viết học thuật đã tăng gấp mười lần. Một số tác giả giờ còn cố tình né tránh nó để không bị nghe như AI. Nhưng đa số người dùng thì không biết, họ tin rằng đây là tiếng Anh bình thường.

Thậm chí nghiên cứu gần đây cho thấy nhiều người bắt đầu sử dụng “delve” ngay trong các cuộc nói chuyện tự phát. Nghĩa là chúng ta đã tiếp nhận thiên lệch của AI và lặp lại nó một cách vô thức. Và không chỉ “delve”. Các từ như “inquiry”, “surpass”, “commendable”, “meticulous” cũng được chatbot dùng nhiều đến mức đang lan ra đời sống hàng ngày.

Hiện tượng này lý giải bằng tâm lý học ngôn ngữ: từ nào càng xuất hiện nhiều, con người càng dễ nhớ và dễ dùng lại. Như vậy, vốn từ của chúng ta đang dần hội tụ với vốn từ của chatbot. Khi AI tiếp tục được huấn luyện trên văn bản do AI viết và văn bản con người đã chịu ảnh hưởng từ AI, vòng lặp này chỉ tăng tốc thêm.

Ngôn ngữ và dấu hiệu của xã hội​

Xét riêng về ngôn ngữ, chẳng có gì nguy hiểm nếu ta nói “delve” thay vì “explore”. Nhưng vấn đề nằm ở chỗ ngôn ngữ chính là chỉ dấu của những thay đổi xã hội sâu xa hơn. Nếu những thiên lệch ngôn ngữ có thể ngấm dần, thì những thiên lệch khác về chủng tộc, giới tính, chính trị… cũng có thể ảnh hưởng mà ta khó nhận ra.

Chatbot không phải công cụ trung lập. Ngôn ngữ của nó có thể tinh vi định hình cách chúng ta suy nghĩ và cả những “thực tại mới” mà ta tưởng là tự nhiên.

Có khi nào bạn chợt nhận ra mình đang nói hoặc viết theo kiểu nghe hơi… ChatGPT không? (washingtonpost)
 
Sửa lần cuối bởi điều hành viên:

1,3 tỷ mật khẩu bị rò rỉ, đẩy hàng triệu tài khoản trực tuyến vào nguy hiểm

  • 10,786
  • 0
Một kho dữ liệu khổng lồ vừa bị tung lên web "đen", làm dấy lên cảnh báo về nguy cơ đột nhập tài khoản trên phạm vi toàn cầu. Quy mô rò rỉ lần này...

LANDFALL: Biến ảnh gửi qua WhatsApp thành vũ khí tấn công người dùng Samsung

  • 10,684
  • 0
Các chuyên gia an ninh mạng vừa phát hiện một loại phần mềm gián điệp cực kỳ tinh vi có tên LANDFALL, đang âm thầm tấn công người dùng điện thoại...

Liên minh 3 nhóm hacker khét tiếng thành thế lực đe dọa toàn cầu

  • 14,272
  • 0
Một “liên minh” mới của giới tội phạm mạng đang khiến các chuyên gia bảo mật lo ngại. Ba nhóm hacker khét tiếng: Scattered Spider, LAPSUS$ và...

Cảnh báo: Mã độc giả mạo Telegram X chiếm toàn bộ điện thoại và thiết bị của bạn

  • 11,744
  • 0
Các chuyên gia vừa cảnh báo về một chiến dịch mã độc trên Android, giả mạo ứng dụng Telegram X, có khả năng chiếm quyền kiểm soát gần như toàn bộ...

Hơn 48.000 thiết bị Cisco đối mặt làn sóng tấn công từ ba lỗ hổng nghiêm trọng

  • 10,821
  • 0
Cisco đang gặp cảnh báo an ninh mạng nghiêm trọng khi ba lỗ hổng mới được phát hiện trên các sản phẩm cốt lõi của hãng. Hai lỗ hổng ảnh hưởng đến...

Cháy trung tâm dữ liệu, hơn 600 dịch vụ chính phủ Hàn Quốc tê liệt

  • 12,486
  • 0
Một vụ cháy nghiêm trọng tại Trung tâm Dữ liệu Quốc gia ở thành phố Daejeon đã khiến hơn 600 hệ thống CNTT của chính phủ Hàn Quốc đồng loạt ngừng...

Khi dữ liệu số bị lộ: Hacker có thể làm gì với các thông tin tài chính của bạn?

  • 14,367
  • 1
Các vụ tấn công mạng gần đây cho thấy sự hoạt động của tin tặc đã và đang gia tăng trở lại, đe dọa đến an ninh dữ liệu của người dùng số. Đặt tình...

Apple vá lỗ hổng nghiêm trọng trong hệ thống xử lý hình ảnh: Người dùng cần cập nhật ngay

  • 15,534
  • 0
Apple vừa phát hành bản vá bảo mật để khắc phục lỗ hổng nguy hiểm CVE-2025-43300 trong hệ thống xử lý hình ảnh. Lỗ hổng này cho phép tin tặc chiếm...

HP OmniBook X Flip 14: Laptop chuẩn Copilot+ PC với AI mạnh mẽ, thiết kế linh hoạt cho người dùng hiện đại

  • 16,256
  • 0
Sự xuất hiện của dòng laptop chuẩn Copilot+ PC đang tạo nên làn sóng mới trong thị trường máy tính, nơi AI trở thành lõi công nghệ mang lại hiệu...

Những hiểu nhầm với quy định mới về xác nhận SIM chính chủ

  • 350
  • 0
Nhiều người hiểu chưa đúng về quy định mới liên quan đến xác thực thông tin thuê bao di động, có hiệu lực từ 15/4, khiến lo ngại bị khóa SIM...
Back