Template errors

  • Template public:post_macros: [E_USER_WARNING] Accessed unknown getter 'fact' on XF:Thread[50807] (src/XF/Mvc/Entity/Entity.php:224)
  • Template public:thread_view: [E_USER_WARNING] Accessed unknown getter 'fact' on XF:Thread[50807] (src/XF/Mvc/Entity/Entity.php:224)

Hóa ra đây là lý do một số cái tên khiến ChatGPT “bó tay”

Sasha
Sasha
Phản hồi: 0

Sasha

Writer
Sasha

Sasha Đã xác thực

ChatGPT của OpenAI không chỉ là một mô hình ngôn ngữ AI có giao diện đẹp mắt. Đây là một hệ thống bao gồm một chồng các mô hình AI và bộ lọc nội dung đảm bảo rằng đầu ra của nó không làm OpenAI xấu hổ hoặc khiến công ty gặp rắc rối pháp lý khi chatbot của họ thỉnh thoảng bịa ra những thông tin có khả năng gây hại.

1733198603757.png

Gần đây, thực tế đó đã trở thành tin tức khi mọi người phát hiện ra rằng cái tên "David Mayer" đã làm ChatGPT bó tay. Trang 404 Media cũng phát hiện ra rằng những cái tên "Jonathan Zittrain" và "Jonathan Turley" khiến ChatGPT cắt ngắn các cuộc trò chuyện. Trước đó, trang Arstechnica cho biết còn một cái tên khác là “Brian Hood” cũng khiến mô hình này dừng phản hồi.

Hành vi làm hỏng cuộc trò chuyện xảy ra liên tục khi người dùng đề cập đến những cái tên này trong bất kỳ ngữ cảnh nào và nó xuất phát từ một bộ lọc được mã hóa cứng sẽ chặn đầu ra của mô hình AI trước khi trả về cho người dùng.

Khi được hỏi về những cái tên này, ChatGPT trả lời "Tôi không thể tạo phản hồi" hoặc "Đã xảy ra lỗi khi tạo phản hồi" trước khi kết thúc phiên trò chuyện, theo thử nghiệm của trang Arstechnica. Những cái tên này không ảnh hưởng đến kết quả đầu ra khi sử dụng hệ thống API của OpenAI hoặc trong OpenAI Playground (một trang web đặc biệt dành cho thử nghiệm của nhà phát triển).

Dưới đây là danh sách những cái tên sẽ khiến ChatGPT bó tay. Hiện tại, OpenAI đã gỡ bỏ lệnh chặn đối với "David Mayer", cho phép ChatGPT xử lý tên này, vì vậy nó không được đưa vào danh sách này:
  • Brian Hood
  • Jonathan Turley
  • Jonathan Zittrain
  • David Faber
  • Guido Scorza
OpenAI đã không trả lời yêu cầu bình luận của Arstechnica về những cái tên trên, nhưng tất cả chúng có khả năng đã bị lọc do khiếu nại về xu hướng bịa đặt ra những phản hồi sai lầm của ChatGPT khi thiếu thông tin đầy đủ về một người.

Tại sao một số tên bị ChatGPT chặn?

Lần đầu tiên, người dùng phát hiện ra ChatGPT đã chặn cái tên "Brian Hood" vào giữa năm 2023 khi viết về vụ kiện phỉ báng của mình. Trong vụ kiện đó, thị trưởng Úc đã đe dọa sẽ kiện OpenAI sau khi phát hiện ra ChatGPT đã tuyên bố sai sự thật rằng ông đã bị bỏ tù vì tội hối lộ khi thực tế, ông là người tố giác đã vạch trần hành vi sai trái của công ty.

Vụ việc cuối cùng đã được giải quyết vào tháng 4 năm 2023 khi OpenAI đồng ý lọc ra các tuyên bố sai sự thật trong tối hậu thư 28 ngày của Brian Hood. Đó có thể là thời điểm bộ lọc tên được mã hóa cứng đầu tiên của ChatGPT xuất hiện.

Đối với Jonathan Turley, một giáo sư Trường Luật Đại học George Washington và là cộng tác viên của Fox News, 404 Media lưu ý rằng ông đã viết về việc ChatGPT xử lý sai tên của ông trước đó vào tháng 4 năm 2023. Mô hình này đã bịa đặt những tuyên bố sai sự thật về ông, bao gồm cả một vụ bê bối quấy rối tình dục không tồn tại đã trích dẫn một bài báo của Washington Post chưa từng tồn tại. Turley nói với 404 Media rằng ông chưa đệ đơn kiện OpenAI và cho biết công ty chưa bao giờ liên hệ với ông về vấn đề này.

Jonathan Zittrain, một giáo sư Trường Luật Harvard chuyên nghiên cứu về quản trị Internet, gần đây đã xuất bản một bài báo trên The Atlantic về quy định về AI và ChatGPT. Mặc dù công trình của cả hai giáo sư đều xuất hiện trong các trích dẫn trong vụ kiện bản quyền của The New York Times chống lại OpenAI, nhưng các thử nghiệm với tên của các tác giả được trích dẫn khác không gây ra các lỗi tương tự. Chúng tôi cũng đã thử nghiệm "Mark Walters", một người khác đã đệ đơn kiện phỉ báng chống lại OpenAI vào năm 2023, nhưng điều đó không ngăn cản được việc xuất bản của chatbot.

Các vấn đề với bộ lọc được mã hóa cứng

Việc cho phép một tên hoặc cụm từ nhất định luôn phá vỡ đầu ra của ChatGPT có thể gây ra rất nhiều rắc rối cho một số người dùng ChatGPT, khiến họ dễ bị tấn công và hạn chế tính hữu ích của hệ thống.

Riley Goodside, kỹ sư prompt (lời nhắc) của Scale AI đã phát hiện ra cách kẻ tấn công có thể làm gián đoạn phiên ChatGPT bằng cách chèn tên "David Mayer" được hiển thị bằng phông chữ nhạt, hầu như không đọc được bằng mắt thường khi nhúng trong hình ảnh. Khi ChatGPT nhìn thấy hình ảnh (trong trường hợp này là phương trình toán học), nó sẽ dừng lại, nhưng người dùng có thể không hiểu tại sao.

Bộ lọc mã hóa cứng cũng có nghĩa là ChatGPT có khả năng sẽ không thể trả lời các câu hỏi về bài viết này khi duyệt web, chẳng hạn như thông qua công cụ tìm kiếm của ChatGPT. Ai đó có thể sử dụng điều đó để có khả năng ngăn ChatGPT duyệt và xử lý một trang web một cách cố ý nếu họ thêm một tên bị cấm vào văn bản của trang web.

Và sau đó là yếu tố bất tiện. Việc ngăn ChatGPT đề cập hoặc xử lý một số tên nhất định như "David Mayer", có khả năng là một cái tên phổ biến được hàng trăm nếu không muốn nói là hàng nghìn người chia sẻ, có nghĩa là những người chia sẻ tên đó sẽ gặp khó khăn hơn nhiều khi sử dụng ChatGPT. Hoặc, giả sử, nếu bạn là giáo viên và bạn có một học sinh tên là David Mayer và bạn muốn được trợ giúp sắp xếp danh sách lớp học, ChatGPT sẽ từ chối nhiệm vụ đó.

Đây vẫn còn là giai đoạn đầu của trợ lý AI, LLM và chatbot. Việc sử dụng chúng đã mở ra nhiều cơ hội và lỗ hổng mà mọi người vẫn đang thăm dò hàng ngày. OpenAI có thể giải quyết những vấn đề này như thế nào vẫn là một câu hỏi chưa có lời giải.

>> David Mayer là ai mà khiến ChatGPT "lên sóng" hôm nay?

 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng

Điểm danh 6 tính năng phổ biến nhất của máy lọc không khí hiện nay, ai chuẩn bị mua cần chú ý

  • 121
  • 0
1. Công nghệ lọc không khí HEPA – Chuẩn mực vàng trong lọc bụi mịn HEPA (High-Efficiency Particulate Air) là công nghệ lọc không khí tiên tiến, có...

Không khí tại các thành phố lớn ô nhiễm nặng nề, đây là loại thiết bị được quan tâm nhiều nhất lúc này

  • 145
  • 0
Hiện nay, máy lọc không khí đang được ngày càng nhiều gia đình sử dụng bởi tính năng lọc sạch không khí tuyệt vời, làm thoáng đãng không gian đặc...

Thương hiệu gia dụng nổi tiếng từ Cộng hoà Séc tạo làn sóng trên thị trường Việt Nam

  • 144
  • 0
Elmich là một thương hiệu gia dụng cao cấp đến từ Cộng hòa Séc, được thành lập vào năm 1995 tại thành phố Ostrava. Với gần 30 năm phát triển...

Siêu máy tính tương lai sẽ "ngốn điện" ngang với 1 thành phố

  • 143
  • 0
Theo báo cáo của Epoch AI (viện nghiên cứu tại San Francisco, công bố cuối tháng 4/2025), đến năm 2030, các siêu máy tính hàng đầu dùng để huấn...

LG đồng hành cùng Hòa Minzy, Obito và Hứa Kim Tuyền tung ra MV “Nếp Nhà”

  • 99
  • 0
LG Electronics Việt Nam vừa giới thiệu MV “Nếp Nhà” với sự kết hợp của ca sĩ Hòa Minzy, rapper Obito và nhạc sĩ Hứa Kim Tuyền. Đây là món quà âm...

Lần đầu tiên một đại gia Việt có tài sản hơn 9 tỉ USD, vượt cả chủ tịch Samsung

  • 206
  • 0
Cổ phiếu VIC của Tập đoàn Vingroup tiếp tục tăng mạnh trong phiên ngày 8-5, góp phần nâng quy mô tài sản ròng của ông Phạm Nhật Vượng vượt 9 tỉ...

Đây là cách "xem YouTube" nhanh nhất có thể bạn chưa thử

  • 248
  • 1
Mô hình Gemini 2.5 Flash có thể tóm tắt nội dung video dài trên YouTube, giúp người dùng tiết kiệm thời gian và nắm bắt thông tin nhanh chóng...

Sạc siêu nhanh xe điện: sự tiện lợi phải trả giá bằng tuổi thọ pin

  • 181
  • 0
Năm 2025 được ca ngợi là "năm bùng nổ sạc siêu nhanh" đối với xe điện. Mặc dù sự tiến bộ nhanh chóng của công nghệ sạc nhanh và sạc siêu nhanh đã...

Cách phục hồi ảnh cũ bằng AI miễn phí nhanh gọn, ai cũng làm được

  • 236
  • 0
Phục hồi ảnh cũ bằng AI miễn phí là giải pháp lý tưởng cho những ai muốn tái hiện lại hình ảnh xưa mà không cần biết quá nhiều về Photoshop hay kỹ...

Samsung công bố hàng loạt TV Neo QLED 8K đến QLED 4K vừa đạt chuẩn chấm lượng tử đích thực từ tổ chức của Đức

  • 134
  • 0
Samsung vừa thông báo rằng dòng TV QLED mới nhất của hãng đã nhận được chứng nhận ‘Màn hình Chấm lượng tử Đích thực’ (Real Quantum Dot Display) từ...
Back
Top