Gemini Robotics: 'Bộ não' AI mới của Google vừa trình làng, biến robot thành trợ thủ đắc lực

Khôi Nguyên
Khôi Nguyên
Phản hồi: 0
Những điểm chính:
  • Google DeepMind ra mắt hai mô hình AI mới: Gemini Robotics và Gemini Robotics-ER.
  • Gemini Robotics là mô hình "Thị giác - Ngôn ngữ - Hành động" (VLA), giúp robot tương tác với đồ vật, di chuyển và thực hiện nhiều tác vụ.
  • Gemini Robotics-ER có khả năng nhận thức không gian vượt trội, có thể suy luận và tạo mã để thực hiện hành động mới.
  • Cả hai mô hình đều có khả năng thích ứng linh hoạt với các tình huống thay đổi.
  • Google DeepMind cũng công bố bộ dữ liệu Asimov và "hiến pháp robot" để đảm bảo an toàn.
Google vừa giới thiệu hai mô hình AI mới, Gemini Robotics và Gemini Robotics-ER, được phát triển bởi Google DeepMind, với mục tiêu biến robot trở thành những trợ thủ đắc lực, có khả năng thực hiện nhiều tác vụ phức tạp trong thế giới thực.

Screenshot-2025-03-14-at-13-06-1995-3209-1741932555_png_75.jpg

Gemini Robotics: Nền tảng chung cho robot đa năng

Gemini Robotics được thiết kế dưới dạng mô hình "Thị giác - Ngôn ngữ - Hành động" (Vision-Language-Action - VLA), hướng đến mục tiêu trở thành nền tảng chung cho nhiều loại robot khác nhau. Mô hình này giúp robot:
  • Tương tác với đồ vật: Nhận biết và thao tác với các đồ vật trong môi trường.
  • Di chuyển: Điều hướng và di chuyển trong môi trường thực tế.
  • Thực hiện nhiều tác vụ: Thực hiện các tác vụ đa dạng theo yêu cầu của người dùng.
Google DeepMind đã đăng tải một loạt video cho thấy khả năng của Gemini Robotics. Trong các video này, robot có thể gấp giấy, cất kính vào hộp, và thực hiện nhiều hành động khác theo câu lệnh.

Điểm đáng chú ý là Gemini Robotics có khả năng thích ứng linh hoạt với các tình huống thay đổi. Ví dụ, khi một vật thể bị trượt khỏi tay cầm, hoặc khi có người di chuyển đồ vật xung quanh, robot có thể nhanh chóng điều chỉnh hành động của mình.


Gemini Robotics-ER: Nhận thức không gian và suy luận logic

Gemini Robotics-ER là phiên bản nâng cao của Gemini Robotics, được bổ sung khả năng nhận thức không gian vượt trội. Mô hình này có thể sử dụng khả năng suy luận thực tế (ER) của Gemini để chạy các chương trình riêng.

Gemini Robotics-ER được cho là có thể cải thiện đáng kể các khả năng hiện có của Gemini 2.0, như xác định và nhận diện hình ảnh 3D, suy luận và tạo ra mã để thực hiện các hành động mới ngay lập tức.

Ví dụ, khi nhìn thấy một chiếc cốc cà phê, robot chạy Gemini Robotics-ER có thể suy luận ra cách cầm cốc bằng hai ngón tay và thực hiện động tác đó một cách hoàn chỉnh. Nếu việc tạo mã tự động không hiệu quả, mô hình sẽ quan sát và học hỏi thao tác của con người, sau đó tự áp dụng để tìm ra giải pháp.

apollo_lunch_packing.width-700.format_webp.webp_75.jpg

An toàn và đạo đức: Bộ dữ liệu Asimov và 'hiến pháp robot'

Google DeepMind cũng nhấn mạnh đến vấn đề an toàn và đạo đức trong việc phát triển robot AI. Công ty đã công bố bộ dữ liệu Asimov và phát triển "hiến pháp robot" để định hướng hành vi của robot theo hướng an toàn, đồng thời đánh giá tác động của các mô hình này đối với xã hội.

Tương lai của robot AI

Google cho biết, Gemini Robotics mang đến những bước tiến đáng kể trong việc phát triển các robot đa năng, có khả năng:
  • Linh hoạt: Thích ứng với nhiều tình huống khác nhau.
  • Tương tác: Hiểu và phản hồi nhanh chóng trước các lệnh hoặc thay đổi.
  • Khéo léo: Thực hiện các thao tác mà con người thường làm bằng tay và ngón tay.
"Cùng với các đối tác, chúng tôi hướng đến xây dựng thế hệ robot hữu ích và an toàn hơn," Google DeepMind cho biết.

unnamed_png_75.jpg

Trước đó, theo Goldman Sachs Research, phần cứng dành cho robot hình người đã gần hoàn thiện, nhưng phần mềm vẫn chưa theo kịp. Tuy nhiên, với sự xuất hiện của Gemini Robotics và Gemini Robotics-ER, Google đang cho thấy những nỗ lực đáng kể trong việc thu hẹp khoảng cách này.

Việc Google ra mắt Gemini Robotics và Gemini Robotics-ER đánh dấu một bước tiến quan trọng trong lĩnh vực robot AI. Với khả năng học hỏi, thích ứng và thực hiện các tác vụ phức tạp, các mô hình AI này hứa hẹn sẽ mở ra một tương lai mới, nơi robot có thể hỗ trợ con người trong nhiều lĩnh vực của cuộc sống.
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng

Bị coi là quốc gia kém phát triển, Triều Tiên lấy đâu ra tiền phát triển vũ khí khiến phương Tây e ngại?

  • 238
  • 0
Bất chấp việc được biết đến là một trong những quốc gia nghèo nhất châu Á, Triều Tiên trong những năm gần đây lại liên tục khiến thế giới kinh...

Điểm danh 6 tính năng phổ biến nhất của máy lọc không khí hiện nay, ai chuẩn bị mua cần chú ý

  • 122
  • 0
1. Công nghệ lọc không khí HEPA – Chuẩn mực vàng trong lọc bụi mịn HEPA (High-Efficiency Particulate Air) là công nghệ lọc không khí tiên tiến, có...

Không khí tại các thành phố lớn ô nhiễm nặng nề, đây là loại thiết bị được quan tâm nhiều nhất lúc này

  • 146
  • 0
Hiện nay, máy lọc không khí đang được ngày càng nhiều gia đình sử dụng bởi tính năng lọc sạch không khí tuyệt vời, làm thoáng đãng không gian đặc...

Thương hiệu gia dụng nổi tiếng từ Cộng hoà Séc tạo làn sóng trên thị trường Việt Nam

  • 145
  • 0
Elmich là một thương hiệu gia dụng cao cấp đến từ Cộng hòa Séc, được thành lập vào năm 1995 tại thành phố Ostrava. Với gần 30 năm phát triển...

Siêu máy tính tương lai sẽ "ngốn điện" ngang với 1 thành phố

  • 144
  • 0
Theo báo cáo của Epoch AI (viện nghiên cứu tại San Francisco, công bố cuối tháng 4/2025), đến năm 2030, các siêu máy tính hàng đầu dùng để huấn...

LG đồng hành cùng Hòa Minzy, Obito và Hứa Kim Tuyền tung ra MV “Nếp Nhà”

  • 99
  • 0
LG Electronics Việt Nam vừa giới thiệu MV “Nếp Nhà” với sự kết hợp của ca sĩ Hòa Minzy, rapper Obito và nhạc sĩ Hứa Kim Tuyền. Đây là món quà âm...

Lần đầu tiên một đại gia Việt có tài sản hơn 9 tỉ USD, vượt cả chủ tịch Samsung

  • 206
  • 0
Cổ phiếu VIC của Tập đoàn Vingroup tiếp tục tăng mạnh trong phiên ngày 8-5, góp phần nâng quy mô tài sản ròng của ông Phạm Nhật Vượng vượt 9 tỉ...

Đây là cách "xem YouTube" nhanh nhất có thể bạn chưa thử

  • 248
  • 1
Mô hình Gemini 2.5 Flash có thể tóm tắt nội dung video dài trên YouTube, giúp người dùng tiết kiệm thời gian và nắm bắt thông tin nhanh chóng...

Sạc siêu nhanh xe điện: sự tiện lợi phải trả giá bằng tuổi thọ pin

  • 181
  • 0
Năm 2025 được ca ngợi là "năm bùng nổ sạc siêu nhanh" đối với xe điện. Mặc dù sự tiến bộ nhanh chóng của công nghệ sạc nhanh và sạc siêu nhanh đã...

Cách phục hồi ảnh cũ bằng AI miễn phí nhanh gọn, ai cũng làm được

  • 236
  • 0
Phục hồi ảnh cũ bằng AI miễn phí là giải pháp lý tưởng cho những ai muốn tái hiện lại hình ảnh xưa mà không cần biết quá nhiều về Photoshop hay kỹ...
Back
Top