OpenAI đưa ra hướng dẫn an toàn: Ban giám đốc có quyền ngăn CEO ra mẫu mới

Trường Sơn
Trường Sơn
Phản hồi: 0
Ban giám đốc của công ty khởi nghiệp trí tuệ nhân tạo OpenAI sẽ có quyền phủ quyết quyết định của CEO công ty về việc tung ra phiên bản ChatGPT mới.
Vào ngày 18 tháng 12, giờ địa phương, OpenAI đã phát hành một hướng dẫn bảo mật có tên “Khuôn khổ chuẩn bị” trên trang web chính thức, trong đó quy định “theo dõi, đánh giá, dự đoán và ngăn chặn những rủi ro thảm khốc do các mô hình ngày càng mạnh mẽ mang lại”.
OpenAI giải thích rằng nghiên cứu về rủi ro của trí tuệ nhân tạo tiên tiến chưa đạt được những gì cần thiết. Để giải quyết khoảng trống này và hệ thống hóa tư duy bảo mật, OpenAI đang áp dụng phiên bản beta của Khuôn khổ chuẩn bị.
OpenAI đưa ra hướng dẫn an toàn: Ban giám đốc có quyền ngăn CEO ra mẫu mới
Ảnh chụp màn hình tệp phiên bản thử nghiệm OpenAI "Ready Framework", từ trang web chính thức
OpenAI đã thông báo trong một thông cáo báo chí rằng “Nhóm Sẵn sàng” sẽ làm việc để đảm bảo an ninh cho các mô hình trí tuệ nhân tạo tiên tiến. Nhóm sẽ liên tục đánh giá các hệ thống AI để hiểu cách chúng hoạt động trong bốn loại rủi ro khác nhau, bao gồm các vấn đề an ninh mạng tiềm ẩn, mối đe dọa hóa học, mối đe dọa hạt nhân và mối đe dọa sinh học, đồng thời nỗ lực giảm thiểu mọi tác hại mà công nghệ có thể gây ra.
Cụ thể, OpenAI đang theo dõi cái gọi là rủi ro “thảm họa”, được định nghĩa trong hướng dẫn là “bất kỳ rủi ro nào có thể dẫn đến thiệt hại kinh tế hàng trăm tỷ đô la hoặc gây thương tích nghiêm trọng hoặc thậm chí tử vong cho nhiều người”.
Được biết, OpenAI đã công bố thành lập "nhóm sẵn sàng" vào tháng 10, một trong ba nhóm độc lập của startup chịu trách nhiệm giám sát an toàn trí tuệ nhân tạo. Ngoài ra còn có “hệ thống an toàn” xem xét các sản phẩm hiện tại, chẳng hạn như GPT-4 và “siêu liên kết”, tập trung vào các hệ thống AI cực kỳ mạnh mẽ có thể ra đời trong tương lai.
Aleksander Madry dẫn đầu đội chuẩn bị. Trong một cuộc phỏng vấn với Bloomberg, Madry cho biết nhóm sẽ gửi báo cáo hàng tháng cho một nhóm cố vấn an ninh nội bộ mới, nhóm này sẽ phân tích công việc của nhóm Madry và đưa ra khuyến nghị cho CEO Sam Altman và ban giám đốc công ty.
Madry cho biết nhóm sẽ đánh giá lặp đi lặp lại mô hình trí tuệ nhân tạo tiên tiến nhất chưa được phát hành của OpenAI, xếp hạng nó là "thấp", "trung bình", "cao" hoặc "nghiêm trọng" đối với các loại nhận thức khác nhau. rủi ro. Nhóm cũng sẽ thực hiện các thay đổi để giảm thiểu những mối nguy hiểm tiềm ẩn mà họ tìm thấy trong trí tuệ nhân tạo và đo lường hiệu quả. Theo hướng dẫn an toàn mới, OpenAI sẽ chỉ tung ra các mô hình trí tuệ nhân tạo được xếp hạng “trung bình” hoặc “thấp” trong tương lai.
Điều đáng chú ý là theo các nguyên tắc an toàn, Altman và đội ngũ lãnh đạo có thể quyết định có phát hành các mô hình AI mới dựa trên các báo cáo này hay không, nhưng hội đồng quản trị có quyền hủy bỏ quyết định.
Gần đây, cuộc chiến nội bộ giữa Altman và ban giám đốc đã thu hút sự chú ý của thế giới, sau khi cuộc đấu tranh nội bộ này kết thúc, ban giám đốc đã có những thay đổi to lớn, đồng thời cũng gây ra một suy nghĩ khác về sự an toàn của trí tuệ nhân tạo.
Vào tháng 4 năm nay, một nhóm các chuyên gia và lãnh đạo ngành trí tuệ nhân tạo đã ký một bức thư ngỏ kêu gọi tạm dừng phát triển các hệ thống mạnh hơn GPT-4 trong vòng sáu tháng tới, với lý do những rủi ro tiềm ẩn của trí tuệ nhân tạo đối với xã hội. Một cuộc thăm dò do công ty tư vấn Ipsos đưa ra vào tháng 5 cho thấy hơn 2/3 người Mỹ lo lắng về những tác động tiêu cực có thể xảy ra của trí tuệ nhân tạo và 61% tin rằng nó có thể đe dọa nền văn minh nhân loại.
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng

Thương hiệu gia dụng nổi tiếng từ Cộng hoà Séc tạo làn sóng trên thị trường Việt Nam

  • 144
  • 0
Elmich là một thương hiệu gia dụng cao cấp đến từ Cộng hòa Séc, được thành lập vào năm 1995 tại thành phố Ostrava. Với gần 30 năm phát triển...

Siêu máy tính tương lai sẽ "ngốn điện" ngang với 1 thành phố

  • 143
  • 0
Theo báo cáo của Epoch AI (viện nghiên cứu tại San Francisco, công bố cuối tháng 4/2025), đến năm 2030, các siêu máy tính hàng đầu dùng để huấn...

LG đồng hành cùng Hòa Minzy, Obito và Hứa Kim Tuyền tung ra MV “Nếp Nhà”

  • 99
  • 0
LG Electronics Việt Nam vừa giới thiệu MV “Nếp Nhà” với sự kết hợp của ca sĩ Hòa Minzy, rapper Obito và nhạc sĩ Hứa Kim Tuyền. Đây là món quà âm...

Lần đầu tiên một đại gia Việt có tài sản hơn 9 tỉ USD, vượt cả chủ tịch Samsung

  • 206
  • 0
Cổ phiếu VIC của Tập đoàn Vingroup tiếp tục tăng mạnh trong phiên ngày 8-5, góp phần nâng quy mô tài sản ròng của ông Phạm Nhật Vượng vượt 9 tỉ...

Đây là cách "xem YouTube" nhanh nhất có thể bạn chưa thử

  • 248
  • 1
Mô hình Gemini 2.5 Flash có thể tóm tắt nội dung video dài trên YouTube, giúp người dùng tiết kiệm thời gian và nắm bắt thông tin nhanh chóng...

Sạc siêu nhanh xe điện: sự tiện lợi phải trả giá bằng tuổi thọ pin

  • 181
  • 0
Năm 2025 được ca ngợi là "năm bùng nổ sạc siêu nhanh" đối với xe điện. Mặc dù sự tiến bộ nhanh chóng của công nghệ sạc nhanh và sạc siêu nhanh đã...

Cách phục hồi ảnh cũ bằng AI miễn phí nhanh gọn, ai cũng làm được

  • 236
  • 0
Phục hồi ảnh cũ bằng AI miễn phí là giải pháp lý tưởng cho những ai muốn tái hiện lại hình ảnh xưa mà không cần biết quá nhiều về Photoshop hay kỹ...

Samsung công bố hàng loạt TV Neo QLED 8K đến QLED 4K vừa đạt chuẩn chấm lượng tử đích thực từ tổ chức của Đức

  • 134
  • 0
Samsung vừa thông báo rằng dòng TV QLED mới nhất của hãng đã nhận được chứng nhận ‘Màn hình Chấm lượng tử Đích thực’ (Real Quantum Dot Display) từ...

Sếp Apple dự đoán "ngày tàn" của iPhone chỉ trong 10 năm tới: Lý do từ kẻ mà "ai cũng biết là ai"

  • 1,237
  • 0
Phó chủ tịch cấp cao phụ trách mảng dịch vụ của Apple, ông Eddy Cue, vừa đưa ra một nhận định gây sửng sốt về tương lai của chính sản phẩm chủ lực...

"Cú lừa" của Apple và Samsung về dung lượng lưu trữ điện thoại

  • 287
  • 0
Chi phí tăng đáng kể khi nâng cấp bộ nhớ được cho là chiến lược tối đa hóa lợi nhuận của các hãng smartphone, đặc biệt ở phân khúc cao cấp...
Back
Top