Nhóm nghiên cứu HiddenLayer phát hiện một kỹ thuật nhắc nhở mới mang tên “Policy Puppetry” có thể vượt qua mọi rào cản an toàn của các mô hình AI lớn, bất kể nhà cung cấp, kiến trúc hay quy trình huấn luyện.
Kỹ thuật này sử dụng nhắc cấu trúc tương tự như hệ thống cấu hình (XML, JSON), kết...
an ninh ai
giám sát ai thời gian thực
khai thác mô hình lớn
lỗ hổng ai
nhắc nhở nguy hiểm
policypuppetry
rào cản an toàn ai
rlhf không đủ
rủi ro y tế ai
vượt rào chắn ai