Khi AI bắt đầu làm việc như một đội nhóm

Hoàng Nam · 31/03/2026

Anthropic vừa công bố kết quả thí nghiệm đáng chú ý: Claude hoàn thành một trình chỉnh sửa game cổ điển hoàn chỉnh trong 6 giờ với chi phí 200 USD, không cần lập trình viên, nhà thiết kế hay quản lý sản phẩm nào tham gia.

Trước đây, AI giống một thực tập sinh tài năng, bắt đầu nhanh nhưng càng về sau càng rối. Ngữ cảnh bị mất dần, lỗi không được sửa và hệ thống thường tự đánh giá mình đã "xong" quá sớm. Anthropic gọi đây là "suy giảm theo ngữ cảnh", và phát hiện rằng mở rộng cửa sổ ngữ cảnh không giải quyết được vấn đề mà đôi khi còn làm mọi thứ rối hơn.

Thử nghiệm đối chứng cho thấy rõ: phiên bản AI đơn lẻ tạo ra sản phẩm trong 20 phút với giá 9 USD, nhưng các tương tác không hoạt động, gameplay bị lỗi hoàn toàn.

Giải pháp mới: Chia AI thành một đội

Thay vì dùng một AI duy nhất, Anthropic tổ chức ba vai trò riêng biệt. Người lập kế hoạch (Planner) tiếp nhận yêu cầu mơ hồ, mở rộng thành bản đặc tả chi tiết. Người tạo mã (Generator) viết code và xây dựng sản phẩm từng bước. Người đánh giá (Evaluator) kiểm thử, tìm lỗi và trả sản phẩm về để sửa, không chấp nhận kết quả cho đến khi đạt yêu cầu.

Điểm mấu chốt là tách biệt người làm và người chấm. Khi AI tự chấm bài mình, nó dễ bỏ qua lỗi. Khi có một AI khác độc lập kiểm tra, những vấn đề tưởng nhỏ trở nên không thể bỏ qua.

Kết quả: Phiên bản ba AI hoàn thành 27 tiêu chí chấp nhận, xử lý được các lỗi kỹ thuật thực sự như sự kiện không kích hoạt, định tuyến sai, tham số phân tích lỗi. Một thử nghiệm khác tạo ra phần mềm DAW chạy trên trình duyệt trong chưa đầy 4 giờ với giá 124 USD, tích hợp cả trợ lý AI hiểu lệnh âm nhạc bằng ngôn ngữ tự nhiên.

Điều thực sự thay đổi

Đây không đơn thuần là AI viết code nhanh hơn. Đây là lần đầu tiên AI vận hành như một tổ chức sản phẩm thực thụ, với phân công lao động rõ ràng và vòng phản hồi khép kín. Sản phẩm chưa hoàn thành cho đến khi vượt qua kiểm tra, giống hệt quy trình phát triển phần mềm chuyên nghiệp. Trong bối cảnh đó, kỹ năng khan hiếm sắp tới có thể không phải là lập trình, mà là khả năng đánh giá: biết một sản phẩm tốt trông như thế nào, và đặt ra tiêu chuẩn đủ cao để buộc AI phải đạt tới.

Khi AI bắt đầu làm việc như một đội nhóm

Hoàng Nam

Writer

Giải pháp mới: Chia AI thành một đội

Điều thực sự thay đổi

1,3 tỷ mật khẩu bị rò rỉ, đẩy hàng triệu tài khoản trực tuyến vào nguy hiểm

LANDFALL: Biến ảnh gửi qua WhatsApp thành vũ khí tấn công người dùng Samsung

Liên minh 3 nhóm hacker khét tiếng thành thế lực đe dọa toàn cầu

Cảnh báo: Mã độc giả mạo Telegram X chiếm toàn bộ điện thoại và thiết bị của bạn

Hơn 48.000 thiết bị Cisco đối mặt làn sóng tấn công từ ba lỗ hổng nghiêm trọng

Cháy trung tâm dữ liệu, hơn 600 dịch vụ chính phủ Hàn Quốc tê liệt

Khi dữ liệu số bị lộ: Hacker có thể làm gì với các thông tin tài chính của bạn?

Apple vá lỗ hổng nghiêm trọng trong hệ thống xử lý hình ảnh: Người dùng cần cập nhật ngay

HP OmniBook X Flip 14: Laptop chuẩn Copilot+ PC với AI mạnh mẽ, thiết kế linh hoạt cho người dùng hiện đại

Những hiểu nhầm với quy định mới về xác nhận SIM chính chủ

Khi AI bắt đầu làm việc như một đội nhóm

Writer

Giải pháp mới: Chia AI thành một đội​

Điều thực sự thay đổi​

Giải pháp mới: Chia AI thành một đội

Điều thực sự thay đổi