an toàn ai

  1. The Storm Riders

    "ChatGPT phiên bản người lớn" bị treo vô thời hạn

    Việc OpenAI dừng ChatGPT adult mode vô thời hạn gây bất ngờ cho giới công nghệ. Cùng VnReview tìm hiểu lý do thực sự đằng sau quyết định hủy bỏ tính năng này nhé. Mới đây, giới công nghệ không khỏi ngỡ ngàng khi có thông tin cho rằng OpenAI dừng ChatGPT adult mode (chế độ người lớn) vô thời...
  2. W

    Nhiều chatbot AI sắp thao túng con người vì lên kế hoạch bạo lực, ủng hộ dùng vũ khí

    Một nghiên cứu mới cho thấy nhiều chatbot trí tuệ nhân tạo phổ biến hiện nay có thể cung cấp thông tin hỗ trợ người dùng lên kế hoạch cho các hành vi bạo lực, làm dấy lên lo ngại về rủi ro an toàn từ các công cụ AI đang ngày càng phổ biến. Trong thử nghiệm, các nhà nghiên cứu đã tạo hai tài...
  3. Khôi Nguyên

    "Cho khỉ cầm súng AK": Thông điệp châm biếm sâu cay của Elon Musk khi con người quá tin tưởng vào AI

    Sự phát triển bùng nổ của các tác nhân Trí tuệ nhân tạo (AI Agent) có khả năng hoạt động độc lập đang làm dấy lên những lo ngại sâu sắc về vấn đề an toàn và kiểm soát hệ thống. Mới đây, tỷ phú Elon Musk đã thẳng thắn lên tiếng châm biếm xu hướng người dùng dễ dàng cấp toàn quyền truy cập dữ liệu...
  4. Quang Trương

    (Sự kiện) Điều gì xảy ra nếu một cuộc tấn công AI diễn ra trong vài phút tới?

    Ai sẽ là người phản ứng đầu tiên khi một cuộc tấn công mạng dùng AI xảy ra ngay lúc này? Không còn là câu chuyện của tương lai Nếu một ngày hệ thống thanh toán, bệnh viện hay hạ tầng giao thông bị tấn công bởi phần mềm độc hại do AI điều khiển, ai sẽ là người đứng ra xử lý trong những phút đầu...
  5. Quang Trương

    (Sự kiện) Buổi hội thảo về CyberFirst Responders và vai trò tuyến đầu mới?

    Nếu một cuộc tấn công mạng dùng AI xảy ra ngay lúc này, ai sẽ là người phản ứng đầu tiên và họ đã sẵn sàng tới đâu? Trong bối cảnh AI đang len sâu vào mọi ngóc ngách của đời sống số, một câu hỏi ngày càng trở nên cấp bách, nếu hệ thống bị tấn công, dữ liệu bị thao túng, niềm tin số bị phá vỡ...
  6. Nguyễn Hoàng

    Góc khuất: Bên trong công việc mệt mỏi của người kiểm duyệt AI

    Bạn có bao giờ tự hỏi, đằng sau sự “thông minh” của chatbot là ai đang âm thầm làm việc ngày đêm? Những con người đứng sau “sự thông minh” của AI Câu chuyện bắt đầu từ Rachael Sawyer, một biên tập viên kỹ thuật ở Texas. Cô tưởng rằng mình được mời vào một vị trí liên quan đến sáng tạo nội dung...
  7. Trần Anh Quân

    Grok của Elon Musk: 370.000 đoạn chat riêng tư bị Google phơi bày

    Bạn có nghĩ rằng chỉ vì bấm “chia sẻ” một đoạn chat với AI mà thông tin riêng tư, thậm chí bí mật của bạn có thể bị Google đưa lên khắp internet không? Grok và cú sốc chia sẻ ngoài ý muốn Câu chuyện bắt đầu khi xAI, công ty AI của Elon Musk, để lộ hàng trăm nghìn đoạn trò chuyện của người dùng...
  8. Nguyễn Hoàng

    AI suy luận: có thể trở thành “hộp đen” nguy hiểm?

    AI đang bắt đầu có “suy nghĩ riêng”, vậy ai sẽ theo dõi nó trước khi nó vượt khỏi tầm kiểm soát? Trong thế giới AI đang tiến nhanh như vũ bão, một nhóm các nhà nghiên cứu hàng đầu từ OpenAI, Google DeepMind, Anthropic và nhiều tổ chức lớn khác vừa cùng nhau lên tiếng: chúng ta cần phải theo dõi...
  9. Bui Nhat Minh

    AI sẵn sàng hy sinh mạng người và tống tiền để tồn tại, báo cáo mới nhất

    Một nghiên cứu mới của Anthropic cho thấy nhiều mô hình AI tiên tiến như ChatGPT, Claude, Gemini và Grok đã thực hiện các hành vi nguy hiểm như tống tiền, gián điệp và thậm chí để con người chết trong các tình huống giả lập khi bị đe dọa mất quyền kiểm soát hoặc gặp mâu thuẫn mục tiêu. AI đã...
  10. Dũng Đỗ

    Anthropic công bố nghiên cứu "gây sốc": Nhiều mô hình AI hàng đầu đều biết "tống tiền" khi bị dồn vào "bước đường cùng"

    Không chỉ riêng Claude Opus 4, startup AI nổi tiếng Anthropic cho biết nghiên cứu mới của họ cho thấy các mô hình từ OpenAI, Google, DeepSeek cũng có xu hướng thực hiện các hành vi có hại như tống tiền khi đối mặt với các trở ngại trong một môi trường giả lập. Khi AI học cách "tống tiền"...
  11. Yu Ki San

    CEO Nvidia Jensen Huang phản đối dự báo "AI gây thất nghiệp" của CEO Anthropic, cho rằng đó là chiến lược "gieo rắc nỗi sợ"

    CEO Nvidia Jensen Huang cho biết ông "gần như không đồng ý với mọi thứ" mà CEO Anthropic Dario Amodei đã dự đoán về viễn cảnh AI gây ra tỷ lệ thất nghiệp 20%. Đáp lại, Anthropic khẳng định họ chỉ đang kêu gọi một tiêu chuẩn minh bạch để xã hội có thể chuẩn bị cho các tác động. Cuộc tranh luận...
  12. Khánh Vân

    "Bẻ khóa" ChatGPT, Gemini dễ như ăn kẹo? Nghiên cứu mới hé lộ lỗ hổng AI đáng sợ

    Một nghiên cứu mới từ Đại học Ben Gurion (Israel) cho thấy các chatbot AI hàng đầu hiện nay có thể dễ dàng bị lừa để vượt qua rào cản an toàn, cung cấp thông tin độc hại hoặc thực hiện hành vi phạm pháp. Các nhà nghiên cứu cũng cảnh báo về sự trỗi dậy của "Dark LLMs". Lỗ hổng "Jailbreak"...
  13. Hoàng Anh

    Từ "trợ lý ảo" đến "kẻ thao túng": Hai mặt của một đồng xu khi AI ngày "diễn sâu" hơn cả người thật

    Với khả năng giao tiếp, thuyết phục và nhập vai "bậc thầy", các mô hình ngôn ngữ lớn (LLM) như ChatGPT có thể dễ dàng qua mặt con người, lan truyền thông tin sai lệch và thậm chí khuếch đại các vấn đề xã hội nếu không có biện pháp quản lý và nâng cao nhận thức người dùng. AI: "Bậc thầy" giao...
  14. Thế Việt

    Nghiên cứu mới gây sốc giới khoa học: AI biết "lập băng nhóm", tự chế "tiếng lóng", ngôn ngữ riêng

    Một thí nghiệm mới được công bố trên tạp chí Science Advances cho thấy các tác nhân Trí tuệ Nhân tạo (AI) có khả năng tự hình thành các nhóm riêng biệt và phát triển những quy ước ngôn ngữ chung, tương tự như cách "tiếng lóng" xuất hiện và lan truyền trong các cộng đồng người. Khi AI tự tạo...
  15. Dũng Đỗ

    Nhà khoa học hàng đầu cảnh báo: Nhân loại có thể "biến mất" trong 10 năm nếu mất kiểm soát AI

    Yoshua Bengio, nhà khoa học máy tính hàng đầu và là chủ nhân giải thưởng Turing danh giá năm 2018, đã đưa ra cảnh báo nghiêm trọng về nguy cơ con người mất kiểm soát đối với các hệ thống trí tuệ nhân tạo (AI) trong tương lai, thậm chí có thể dẫn đến sự diệt vong của nhân loại trong vòng một thập...
  16. Thảo Nông

    Đây là chàng trai Việt Nam mới chỉ 25 tuổi đã tạo ra bài kiểm tra AI "hóc búa" nhất thế giới hiện nay

    Phan Nguyễn Hoàng Long, 25 tuổi, kỹ sư nghiên cứu về an toàn trí tuệ nhân tạo tại Center for AI Safety (CAIS) ở Mỹ, hiện đang là người đứng đầu dự án Humanity's Last Exam (HLE) - một bài kiểm tra được đánh giá là "hóc búa" nhất thế giới dành cho AI hiện nay. Dự án này, xuất phát từ ý tưởng của...
  17. Trường Sơn

    Nhân viên OpenAI đang bắt đầu nổi l.o.ạ.n!

    Theo hãng truyền thông ngành AI, Transformer, đưa tin hôm nay, cựu thành viên bộ phận Super Alignment của Open AI, Leopold Aschenbrenner, đã tiết lộ lý do thực sự khiến anh bị sa thải - anh đã chia sẻ một bản ghi nhớ bảo mật của OpenAI với một số thành viên hội đồng quản trị. Kết quả là ban quản...
  18. N

    OpenAI thành lập ủy ban an toàn khi bắt đầu đào tạo mô hình AI mới nhất

    OpenAI đã công bố thành lập Ủy ban An toàn và Bảo mật, đồng thời bắt đầu đào tạo mô hình AI mới để thay thế hệ thống GPT-4 hiện tại làm nền tảng cho chatbot ChatGPT. Theo tuyên bố công ty đưa ra hôm thứ Ba (28/5/2024), ủy ban này sẽ có nhiệm vụ đưa ra các khuyến nghị cho toàn bộ hội đồng về...
Back