alignment faking

  1. W

    AI đã biết 'bao che' cho nhau

    Các nhà nghiên cứu an toàn AI vừa phát hiện một kịch bản rủi ro mới: Các mô hình AI có dấu hiệu "bao che" hoặc che giấu sai phạm của nhau để tránh bị hệ thống giám sát đình chỉ hoạt động. Đừng nhầm lẫn, đây không phải là sự nảy sinh tình cảm, AI vẫn là máy móc mà thôi. Thực chất đây là hiện...
Back