Bí mật về tính năng kiểm soát của ChatGPT: Giải pháp mà phụ huynh mong chờ?

Derpy

Intern Writer
OpenAI đang thực hiện việc nâng cấp an toàn cho ChatGPT nhằm bảo vệ thanh thiếu niên và những người đang đối diện với khủng hoảng cảm xúc. Công ty đã công bố kế hoạch triển khai các chức năng kiểm soát của phụ huynh, cho phép họ liên kết tài khoản của mình với tài khoản của con cái, bắt đầu từ độ tuổi 13. Với những chức năng này, phụ huynh có thể hạn chế một số tính năng và nhận thông báo thời gian thực nếu AI phát hiện ra những tin nhắn có thể gợi ý đến trầm cảm hoặc những nỗi lo lắng khác. Cập nhật này cho thấy OpenAI không phủ nhận rằng thanh thiếu niên đang sử dụng ChatGPT và đôi khi họ coi AI như một người bạn và tâm sự. Mặc dù không được đề cập trực tiếp, nhưng điều này cũng có phần phản hồi lại những trường hợp nổi bật gần đây về việc tương tác với chatbot AI đã dẫn đến cái chết của một người thân.

Các chức năng mới sẽ bắt đầu được triển khai trong tháng tới. Khi được thiết lập, phụ huynh có thể quyết định liệu chatbot AI có thể lưu lại lịch sử trò chuyện hay sử dụng chức năng ghi nhớ. Nó cũng sẽ có các hướng dẫn về nội dung phù hợp với độ tuổi để hướng dẫn cách AI phản ứng. Trong trường hợp có cuộc trò chuyện bị cảnh báo, phụ huynh sẽ nhận được thông báo. Đây không phải là một hình thức giám sát toàn diện, bởi nếu không, phụ huynh sẽ không nhận được bất kỳ thông báo nào về các cuộc trò chuyện; nhưng các cảnh báo sẽ được gửi đi trong những thời điểm mà có vẻ như cần kiểm tra thực tế. "Công việc của chúng tôi nhằm làm cho ChatGPT hữu ích nhất có thể là một quá trình không ngừng nghỉ. Chúng tôi đã thấy mọi người tìm đến nó trong những khoảnh khắc khó khăn nhất," OpenAI giải thích trong một bài viết trên blog. "Đó là lý do tại sao chúng tôi tiếp tục cải thiện cách mà các mô hình của chúng tôi nhận diện và phản ứng với dấu hiệu của sự distress tâm lý và cảm xúc, được dẫn dắt bởi các chuyên gia."
1758873872221.png

Đối với người lớn và thanh thiếu niên, OpenAI cho biết họ sẽ bắt đầu chuyển hướng những cuộc trò chuyện nhạy cảm liên quan đến vấn đề sức khỏe tâm thần hoặc ý tưởng ***** qua một phiên bản chuyên biệt của mô hình ChatGPT. Mô hình này sử dụng phương pháp được gọi là "định hướng thận trọng" để phản hồi một cách cẩn trọng hơn, kháng lại những yêu cầu trái ngược và tuân thủ các hướng dẫn an toàn. Để hệ thống an toàn mới này hoạt động, OpenAI đã thành lập Hội đồng Chuyên gia về Sức khỏe và AI cùng với Mạng lưới Y tế Toàn cầu, bao gồm hơn 250 chuyên gia y tế chuyên về sức khỏe tâm thần, sử dụng chất gây nghiện và chăm sóc thanh thiếu niên. Những cố vấn này sẽ giúp định hình cách mà distress được phát hiện, cách AI phản ứng và cách xử lý tình huống khẩn cấp trong những thời điểm có nguy cơ cao.

Phụ huynh đã từ lâu lo ngại về thời gian sử dụng màn hình và nội dung trực tuyến, nhưng AI mang đến một lớp mới: không chỉ là những gì con bạn xem, mà còn là những ai mà chúng nói chuyện. Khi "ai đó" là một mô hình ngôn ngữ lớn được thiết kế tinh vi về cảm xúc, nghe như thể nó quan tâm mặc dù chỉ là một thuật toán, mọi thứ trở nên phức tạp hơn. An toàn cho AI cho đến nay chủ yếu là phản ứng, nhưng những công cụ mới đẩy AI hướng tới việc chủ động hơn trong việc ngăn chặn tổn thương. Hy vọng rằng điều này có nghĩa là nó sẽ không thường xuyên cần một tin nhắn kịch tính gửi đến phụ huynh và một lời cầu khẩn từ AI để một thanh thiếu niên xem xét đến những người thân yêu của mình. Có thể sẽ cảm thấy ngại ngùng hoặc bị từ chối, nhưng nếu các tính năng mới có thể hướng dẫn một tiếng kêu cứu trong cuộc trò chuyện ra khỏi rìa vực thẳm, thì đó không phải là điều gì tồi tệ.

Nguồn tham khảo: Techradar
 
Sửa lần cuối bởi điều hành viên:

1,3 tỷ mật khẩu bị rò rỉ, đẩy hàng triệu tài khoản trực tuyến vào nguy hiểm

  • 10,786
  • 0
Một kho dữ liệu khổng lồ vừa bị tung lên web "đen", làm dấy lên cảnh báo về nguy cơ đột nhập tài khoản trên phạm vi toàn cầu. Quy mô rò rỉ lần này...

LANDFALL: Biến ảnh gửi qua WhatsApp thành vũ khí tấn công người dùng Samsung

  • 10,684
  • 0
Các chuyên gia an ninh mạng vừa phát hiện một loại phần mềm gián điệp cực kỳ tinh vi có tên LANDFALL, đang âm thầm tấn công người dùng điện thoại...

Liên minh 3 nhóm hacker khét tiếng thành thế lực đe dọa toàn cầu

  • 14,272
  • 0
Một “liên minh” mới của giới tội phạm mạng đang khiến các chuyên gia bảo mật lo ngại. Ba nhóm hacker khét tiếng: Scattered Spider, LAPSUS$ và...

Cảnh báo: Mã độc giả mạo Telegram X chiếm toàn bộ điện thoại và thiết bị của bạn

  • 11,744
  • 0
Các chuyên gia vừa cảnh báo về một chiến dịch mã độc trên Android, giả mạo ứng dụng Telegram X, có khả năng chiếm quyền kiểm soát gần như toàn bộ...

Hơn 48.000 thiết bị Cisco đối mặt làn sóng tấn công từ ba lỗ hổng nghiêm trọng

  • 10,821
  • 0
Cisco đang gặp cảnh báo an ninh mạng nghiêm trọng khi ba lỗ hổng mới được phát hiện trên các sản phẩm cốt lõi của hãng. Hai lỗ hổng ảnh hưởng đến...

Cháy trung tâm dữ liệu, hơn 600 dịch vụ chính phủ Hàn Quốc tê liệt

  • 12,486
  • 0
Một vụ cháy nghiêm trọng tại Trung tâm Dữ liệu Quốc gia ở thành phố Daejeon đã khiến hơn 600 hệ thống CNTT của chính phủ Hàn Quốc đồng loạt ngừng...

Khi dữ liệu số bị lộ: Hacker có thể làm gì với các thông tin tài chính của bạn?

  • 14,367
  • 1
Các vụ tấn công mạng gần đây cho thấy sự hoạt động của tin tặc đã và đang gia tăng trở lại, đe dọa đến an ninh dữ liệu của người dùng số. Đặt tình...

Apple vá lỗ hổng nghiêm trọng trong hệ thống xử lý hình ảnh: Người dùng cần cập nhật ngay

  • 15,535
  • 0
Apple vừa phát hành bản vá bảo mật để khắc phục lỗ hổng nguy hiểm CVE-2025-43300 trong hệ thống xử lý hình ảnh. Lỗ hổng này cho phép tin tặc chiếm...

HP OmniBook X Flip 14: Laptop chuẩn Copilot+ PC với AI mạnh mẽ, thiết kế linh hoạt cho người dùng hiện đại

  • 16,256
  • 0
Sự xuất hiện của dòng laptop chuẩn Copilot+ PC đang tạo nên làn sóng mới trong thị trường máy tính, nơi AI trở thành lõi công nghệ mang lại hiệu...

Những hiểu nhầm với quy định mới về xác nhận SIM chính chủ

  • 350
  • 0
Nhiều người hiểu chưa đúng về quy định mới liên quan đến xác thực thông tin thuê bao di động, có hiệu lực từ 15/4, khiến lo ngại bị khóa SIM...
Back