Không cần lập trình! AI của MIT tự học điều khiển robot bằng cách nhìn thế giới

Tháp rơi tự do · 17/10/2025

Phương pháp đào tạo mới không sử dụng cảm biến hoặc điều chỉnh điều khiển trên bo mạch, mà chỉ sử dụng một camera duy nhất để theo dõi chuyển động của robot và sử dụng dữ liệu hình ảnh.

Một bàn tay robot mềm mại cong các ngón tay lại để cầm một cây bút chì gỗ.

Các nhà khoa học tại MIT đã phát triển một hệ thống trí tuệ nhân tạo (AI) dựa trên tầm nhìn mới có thể tự học cách điều khiển hầu như mọi robot mà không cần sử dụng cảm biến hoặc đào tạo trước. Hệ thống thu thập dữ liệu về kiến trúc của một robot nhất định bằng camera, tương tự như cách con người sử dụng mắt để tìm hiểu về bản thân khi họ di chuyển.

Điều này cho phép bộ điều khiển AI phát triển một mô hình tự học để vận hành bất kỳ robot nào — về cơ bản là cung cấp cho máy móc khả năng tự nhận thức về mặt vật lý giống như con người.

Các nhà nghiên cứu đã đạt được bước đột phá này bằng cách tạo ra một mô hình điều khiển mới sử dụng camera để ánh xạ luồng video "trường Jacobian vận động thị giác" của robot, mô tả các điểm 3D có thể nhìn thấy của máy, tới bộ truyền động của robot.

Mô hình AI sau đó có thể dự đoán các chuyển động chính xác của động cơ. Điều này cho phép biến các kiến trúc robot phi truyền thống, chẳng hạn như robot mềm và robot được thiết kế bằng vật liệu linh hoạt, thành các đơn vị tự động chỉ với vài giờ đào tạo.

"Hãy nghĩ về cách bạn học cách điều khiển các ngón tay của mình: bạn lắc lư, bạn quan sát, bạn thích nghi", Sizhe Lester Li , nghiên cứu sinh tiến sĩ tại MIT CSAIL và là nhà nghiên cứu chính của dự án, giải thích trong một thông cáo báo chí . "Đó chính là những gì hệ thống của chúng tôi làm. Nó thử nghiệm với các hành động ngẫu nhiên và tìm ra bộ phận nào của robot sẽ di chuyển."

Các giải pháp robot thông thường dựa vào kỹ thuật chính xác để tạo ra máy móc đạt thông số kỹ thuật chính xác, có thể được điều khiển bằng các hệ thống được đào tạo sẵn. Những giải pháp này có thể đòi hỏi các cảm biến và mô hình AI đắt tiền được phát triển với hàng trăm hoặc hàng nghìn giờ tinh chỉnh để dự đoán mọi chuyển động có thể xảy ra. Ví dụ, việc cầm nắm đồ vật bằng các chi giống như bàn tay vẫn là một thách thức khó khăn trong cả lĩnh vực kỹ thuật máy móc và điều khiển hệ thống AI.

Hiểu thế giới xung quanh bạn

Ngược lại, sử dụng giải pháp camera lập bản đồ "trường Jacobian" cung cấp giải pháp có chi phí thấp và độ trung thực cao cho thách thức tự động hóa hệ thống robot.

Nhóm nghiên cứu đã công bố phát hiện của mình vào ngày 25 tháng 6 trên tạp chí Nature . Trong đó, họ cho biết công trình được thiết kế để mô phỏng phương pháp học điều khiển máy móc của não người.

Khả năng học hỏi, tái tạo cấu hình 3D và dự đoán chuyển động dựa trên khả năng điều khiển của chúng ta chỉ bắt nguồn từ thị giác. Theo bài báo, "con người có thể học cách nhặt và đặt đồ vật chỉ trong vài phút" khi điều khiển robot bằng bộ điều khiển trò chơi điện tử, và "cảm biến duy nhất chúng ta cần là mắt".

Khung này bao gồm hai thành phần chính. Thành phần đầu tiên là một mô hình học sâu, về cơ bản cho phép robot xác định vị trí của nó và các chi của nó trong không gian ba chiều. Điều này cho phép robot dự đoán vị trí của nó sẽ thay đổi như thế nào khi các lệnh chuyển động cụ thể được thực thi. Thành phần thứ hai là một chương trình học máy dịch các lệnh chuyển động chung thành mã mà robot có thể hiểu và thực thi.

Nhóm đã thử nghiệm mô hình huấn luyện và điều khiển mới bằng cách so sánh hiệu quả của nó với các phương pháp điều khiển dựa trên camera truyền thống. Giải pháp trường Jacobian vượt trội hơn các hệ thống điều khiển 2D hiện có về độ chính xác — đặc biệt là khi nhóm đưa vào cơ chế che khuất thị giác khiến các phương pháp cũ rơi vào trạng thái lỗi. Tuy nhiên, các máy sử dụng phương pháp của nhóm đã thành công trong việc tạo ra bản đồ 3D có thể điều hướng ngay cả khi cảnh bị che khuất một phần bởi nhiễu ngẫu nhiên.

Sau khi các nhà khoa học phát triển khung, nó đã được áp dụng cho nhiều loại robot với kiến trúc đa dạng. Kết quả cuối cùng là một chương trình điều khiển không cần sự can thiệp của con người để huấn luyện và vận hành robot chỉ bằng một camera video duy nhất.

Nguồn: Live Science

Không cần lập trình! AI của MIT tự học điều khiển robot bằng cách nhìn thế giới

Tháp rơi tự do

Intern Writer

Hiểu thế giới xung quanh bạn

1,3 tỷ mật khẩu bị rò rỉ, đẩy hàng triệu tài khoản trực tuyến vào nguy hiểm

LANDFALL: Biến ảnh gửi qua WhatsApp thành vũ khí tấn công người dùng Samsung

Liên minh 3 nhóm hacker khét tiếng thành thế lực đe dọa toàn cầu

Cảnh báo: Mã độc giả mạo Telegram X chiếm toàn bộ điện thoại và thiết bị của bạn

Hơn 48.000 thiết bị Cisco đối mặt làn sóng tấn công từ ba lỗ hổng nghiêm trọng

Cháy trung tâm dữ liệu, hơn 600 dịch vụ chính phủ Hàn Quốc tê liệt

Khi dữ liệu số bị lộ: Hacker có thể làm gì với các thông tin tài chính của bạn?

Apple vá lỗ hổng nghiêm trọng trong hệ thống xử lý hình ảnh: Người dùng cần cập nhật ngay

HP OmniBook X Flip 14: Laptop chuẩn Copilot+ PC với AI mạnh mẽ, thiết kế linh hoạt cho người dùng hiện đại

Những hiểu nhầm với quy định mới về xác nhận SIM chính chủ

Không cần lập trình! AI của MIT tự học điều khiển robot bằng cách nhìn thế giới

Intern Writer

Hiểu thế giới xung quanh bạn​

Hiểu thế giới xung quanh bạn