Không cần lập trình! AI của MIT tự học điều khiển robot bằng cách nhìn thế giới

Tháp rơi tự do

Intern Writer
Phương pháp đào tạo mới không sử dụng cảm biến hoặc điều chỉnh điều khiển trên bo mạch, mà chỉ sử dụng một camera duy nhất để theo dõi chuyển động của robot và sử dụng dữ liệu hình ảnh.

Một bàn tay robot mềm mại cong các ngón tay lại để cầm một cây bút chì gỗ.


Các nhà khoa học tại MIT đã phát triển một hệ thống trí tuệ nhân tạo (AI) dựa trên tầm nhìn mới có thể tự học cách điều khiển hầu như mọi robot mà không cần sử dụng cảm biến hoặc đào tạo trước. Hệ thống thu thập dữ liệu về kiến trúc của một robot nhất định bằng camera, tương tự như cách con người sử dụng mắt để tìm hiểu về bản thân khi họ di chuyển.

Điều này cho phép bộ điều khiển AI phát triển một mô hình tự học để vận hành bất kỳ robot nào — về cơ bản là cung cấp cho máy móc khả năng tự nhận thức về mặt vật lý giống như con người.

Các nhà nghiên cứu đã đạt được bước đột phá này bằng cách tạo ra một mô hình điều khiển mới sử dụng camera để ánh xạ luồng video "trường Jacobian vận động thị giác" của robot, mô tả các điểm 3D có thể nhìn thấy của máy, tới bộ truyền động của robot.

Mô hình AI sau đó có thể dự đoán các chuyển động chính xác của động cơ. Điều này cho phép biến các kiến trúc robot phi truyền thống, chẳng hạn như robot mềm và robot được thiết kế bằng vật liệu linh hoạt, thành các đơn vị tự động chỉ với vài giờ đào tạo.

"Hãy nghĩ về cách bạn học cách điều khiển các ngón tay của mình: bạn lắc lư, bạn quan sát, bạn thích nghi", Sizhe Lester Li , nghiên cứu sinh tiến sĩ tại MIT CSAIL và là nhà nghiên cứu chính của dự án, giải thích trong một thông cáo báo chí . "Đó chính là những gì hệ thống của chúng tôi làm. Nó thử nghiệm với các hành động ngẫu nhiên và tìm ra bộ phận nào của robot sẽ di chuyển."

Các giải pháp robot thông thường dựa vào kỹ thuật chính xác để tạo ra máy móc đạt thông số kỹ thuật chính xác, có thể được điều khiển bằng các hệ thống được đào tạo sẵn. Những giải pháp này có thể đòi hỏi các cảm biến và mô hình AI đắt tiền được phát triển với hàng trăm hoặc hàng nghìn giờ tinh chỉnh để dự đoán mọi chuyển động có thể xảy ra. Ví dụ, việc cầm nắm đồ vật bằng các chi giống như bàn tay vẫn là một thách thức khó khăn trong cả lĩnh vực kỹ thuật máy móc và điều khiển hệ thống AI.

Hiểu thế giới xung quanh bạn​

Ngược lại, sử dụng giải pháp camera lập bản đồ "trường Jacobian" cung cấp giải pháp có chi phí thấp và độ trung thực cao cho thách thức tự động hóa hệ thống robot.

Nhóm nghiên cứu đã công bố phát hiện của mình vào ngày 25 tháng 6 trên tạp chí Nature . Trong đó, họ cho biết công trình được thiết kế để mô phỏng phương pháp học điều khiển máy móc của não người.

Khả năng học hỏi, tái tạo cấu hình 3D và dự đoán chuyển động dựa trên khả năng điều khiển của chúng ta chỉ bắt nguồn từ thị giác. Theo bài báo, "con người có thể học cách nhặt và đặt đồ vật chỉ trong vài phút" khi điều khiển robot bằng bộ điều khiển trò chơi điện tử, và "cảm biến duy nhất chúng ta cần là mắt".

Khung này bao gồm hai thành phần chính. Thành phần đầu tiên là một mô hình học sâu, về cơ bản cho phép robot xác định vị trí của nó và các chi của nó trong không gian ba chiều. Điều này cho phép robot dự đoán vị trí của nó sẽ thay đổi như thế nào khi các lệnh chuyển động cụ thể được thực thi. Thành phần thứ hai là một chương trình học máy dịch các lệnh chuyển động chung thành mã mà robot có thể hiểu và thực thi.

Nhóm đã thử nghiệm mô hình huấn luyện và điều khiển mới bằng cách so sánh hiệu quả của nó với các phương pháp điều khiển dựa trên camera truyền thống. Giải pháp trường Jacobian vượt trội hơn các hệ thống điều khiển 2D hiện có về độ chính xác — đặc biệt là khi nhóm đưa vào cơ chế che khuất thị giác khiến các phương pháp cũ rơi vào trạng thái lỗi. Tuy nhiên, các máy sử dụng phương pháp của nhóm đã thành công trong việc tạo ra bản đồ 3D có thể điều hướng ngay cả khi cảnh bị che khuất một phần bởi nhiễu ngẫu nhiên.

Sau khi các nhà khoa học phát triển khung, nó đã được áp dụng cho nhiều loại robot với kiến trúc đa dạng. Kết quả cuối cùng là một chương trình điều khiển không cần sự can thiệp của con người để huấn luyện và vận hành robot chỉ bằng một camera video duy nhất.

Nguồn: Live Science
 

1,3 tỷ mật khẩu bị rò rỉ, đẩy hàng triệu tài khoản trực tuyến vào nguy hiểm

  • 10,786
  • 0
Một kho dữ liệu khổng lồ vừa bị tung lên web "đen", làm dấy lên cảnh báo về nguy cơ đột nhập tài khoản trên phạm vi toàn cầu. Quy mô rò rỉ lần này...

LANDFALL: Biến ảnh gửi qua WhatsApp thành vũ khí tấn công người dùng Samsung

  • 10,684
  • 0
Các chuyên gia an ninh mạng vừa phát hiện một loại phần mềm gián điệp cực kỳ tinh vi có tên LANDFALL, đang âm thầm tấn công người dùng điện thoại...

Liên minh 3 nhóm hacker khét tiếng thành thế lực đe dọa toàn cầu

  • 14,272
  • 0
Một “liên minh” mới của giới tội phạm mạng đang khiến các chuyên gia bảo mật lo ngại. Ba nhóm hacker khét tiếng: Scattered Spider, LAPSUS$ và...

Cảnh báo: Mã độc giả mạo Telegram X chiếm toàn bộ điện thoại và thiết bị của bạn

  • 11,744
  • 0
Các chuyên gia vừa cảnh báo về một chiến dịch mã độc trên Android, giả mạo ứng dụng Telegram X, có khả năng chiếm quyền kiểm soát gần như toàn bộ...

Hơn 48.000 thiết bị Cisco đối mặt làn sóng tấn công từ ba lỗ hổng nghiêm trọng

  • 10,821
  • 0
Cisco đang gặp cảnh báo an ninh mạng nghiêm trọng khi ba lỗ hổng mới được phát hiện trên các sản phẩm cốt lõi của hãng. Hai lỗ hổng ảnh hưởng đến...

Cháy trung tâm dữ liệu, hơn 600 dịch vụ chính phủ Hàn Quốc tê liệt

  • 12,486
  • 0
Một vụ cháy nghiêm trọng tại Trung tâm Dữ liệu Quốc gia ở thành phố Daejeon đã khiến hơn 600 hệ thống CNTT của chính phủ Hàn Quốc đồng loạt ngừng...

Khi dữ liệu số bị lộ: Hacker có thể làm gì với các thông tin tài chính của bạn?

  • 14,367
  • 1
Các vụ tấn công mạng gần đây cho thấy sự hoạt động của tin tặc đã và đang gia tăng trở lại, đe dọa đến an ninh dữ liệu của người dùng số. Đặt tình...

Apple vá lỗ hổng nghiêm trọng trong hệ thống xử lý hình ảnh: Người dùng cần cập nhật ngay

  • 15,534
  • 0
Apple vừa phát hành bản vá bảo mật để khắc phục lỗ hổng nguy hiểm CVE-2025-43300 trong hệ thống xử lý hình ảnh. Lỗ hổng này cho phép tin tặc chiếm...

HP OmniBook X Flip 14: Laptop chuẩn Copilot+ PC với AI mạnh mẽ, thiết kế linh hoạt cho người dùng hiện đại

  • 16,256
  • 0
Sự xuất hiện của dòng laptop chuẩn Copilot+ PC đang tạo nên làn sóng mới trong thị trường máy tính, nơi AI trở thành lõi công nghệ mang lại hiệu...

Những hiểu nhầm với quy định mới về xác nhận SIM chính chủ

  • 350
  • 0
Nhiều người hiểu chưa đúng về quy định mới liên quan đến xác thực thông tin thuê bao di động, có hiệu lực từ 15/4, khiến lo ngại bị khóa SIM...
Back