Google Gemini: Những gì chúng tôi biết cho đến nay

Thoại Viết Hoàng
Thoại Viết Hoàng
Phản hồi: 0
Dựa trên các cuộc phỏng vấn và báo cáo mới nhất, đây là những gì chúng ta biết cho đến nay về Gemini, hệ thống AI sắp ra mắt của Google nhằm cạnh tranh với OpenAI.
Google Gemini: Những gì chúng tôi biết cho đến nay
Tại hội nghị nhà phát triển Google I/O vào tháng 5 năm 2023, Giám đốc điều hành Sundar Pichai đã công bố hệ thống trí tuệ nhân tạo (AI) sắp ra mắt của công ty, Gemini.
Mô hình ngôn ngữ lớn (LLM) đang được phát triển bởi bộ phận Google DeepMind (Brain Team + DeepMind). Nó có thể cạnh tranh với các hệ thống AI như ChatGPT của OpenAI và có thể hoạt động tốt hơn chúng.
Mặc dù thông tin chi tiết vẫn còn khan hiếm nhưng đây là những gì chúng ta có thể tổng hợp lại được từ các cuộc phỏng vấn và báo cáo mới nhất về Google Gemini.
Google Gemini sẽ đa phương thức
Pichai tuyên bố rằng Gemini kết hợp các điểm mạnh của hệ thống AlphaGo của DeepMind, được biết đến với khả năng thành thạo trò chơi cờ vây phức tạp, với khả năng mô hình hóa ngôn ngữ mở rộng.
Ông cho biết nó được thiết kế ngay từ đầu để trở thành đa phương thức, tích hợp văn bản, hình ảnh và các loại dữ liệu khác. Điều này có thể cho phép khả năng đàm thoại tự nhiên hơn.
Pichai cũng gợi ý về các khả năng trong tương lai như trí nhớ và lập kế hoạch có thể hỗ trợ các nhiệm vụ đòi hỏi khả năng suy luận.
Song Tử có thể sử dụng các công cụ và API
Trong bản cập nhật tiểu sử chuyên môn của mình vào mùa hè, Nhà khoa học trưởng Jeffrey Dean của Google cho biết Gemini là một trong những “mô hình đa phương thức thế hệ tiếp theo” mà ông đang đồng lãnh đạo.
Ông cho biết họ sẽ sử dụng Pathways, cơ sở hạ tầng AI mới của Google, để cho phép mở rộng quy mô đào tạo trên các bộ dữ liệu đa dạng.
Điều này gợi ý rằng Gemini có khả năng trở thành mô hình ngôn ngữ lớn nhất được tạo ra cho đến nay, có khả năng vượt quá kích thước của GPT-3 với hơn 175 tỷ tham số.
Nó sẽ đi kèm với nhiều kích cỡ và khả năng khác nhau
Thông tin chi tiết bổ sung đến từ Demis Hassabis, Giám đốc điều hành của DeepMind.
Vào tháng 6, anh ấy nói với Wired rằng các kỹ thuật của AlphaGo, như học tăng cường và tìm kiếm trên cây, có thể mang lại cho Song Tử những khả năng mới như lý luận và giải quyết vấn đề
Hassabis cho biết Gemini là một “loạt mẫu” sẽ được cung cấp với nhiều kích cỡ và khả năng khác nhau.
Ông cũng cho biết Gemini có thể sử dụng trí nhớ, kiểm tra tính xác thực dựa trên các nguồn như Google Tìm kiếm và cải thiện khả năng học tăng cường để nâng cao độ chính xác và giảm nội dung gây ảo giác nguy hiểm.
Kết quả sớm của Song Tử đầy hứa hẹn
Trong một cuộc phỏng vấn với Time vào tháng 9, Hassabis nhắc lại rằng Gemini đặt mục tiêu kết hợp quy mô và sự đổi mới.
Ông cho biết việc kết hợp việc lập kế hoạch và trí nhớ đang ở giai đoạn đầu khám phá.
Hassabis cũng cho biết Gemini có thể sử dụng các phương pháp truy xuất để xuất ra toàn bộ khối thông tin, thay vì tạo từng từ một, để cải thiện tính nhất quán của thực tế.
Anh ấy tiết lộ rằng Gemini xây dựng dựa trên công việc đa phương thức của DeepMind giống như hệ thống chú thích hình ảnh Flamingo.Nhìn chung, Hassabis cho biết Gemini đang cho thấy “những kết quả ban đầu rất hứa hẹn”.
Chatbots nâng cao là trợ lý cá nhân phổ quát
Trong một cuộc phỏng vấn với Wired, được xuất bản vài ngày sau đó, Pichai đã đưa ra dấu hiệu rõ ràng nhất về việc Gemini phù hợp với lộ trình sản phẩm của Google như thế nào.
Ông cho biết các hệ thống AI đàm thoại như Bard “không phải là trạng thái kết thúc” mà là điểm dừng dẫn đến các chatbot tiên tiến hơn.
Pichai cho biết Gemini và những phiên bản tương lai cuối cùng sẽ trở thành “trợ lý cá nhân phổ quát đáng kinh ngạc” được tích hợp trong cuộc sống hàng ngày của mọi người trong các lĩnh vực như du lịch, công việc và giải trí.
Ông nhắc lại rằng Gemini sẽ kết hợp các điểm mạnh của văn bản và hình ảnh, đồng thời nói rằng các chatbot ngày nay sẽ “trông tầm thường” nếu so sánh trong vòng một vài năm tới.
Các đối thủ quan tâm đến hiệu suất của Song Tử
Giám đốc điều hành OpenAI đã tweet những gì dường như là phản hồi cho một bài báo có tường phí báo cáo rằng Google Gemini có thể hoạt động tốt hơn GPT-4.
Google Gemini: Những gì chúng tôi biết cho đến nay
Không có câu trả lời chính thức nào cho câu hỏi tiếp theo của Elon Musk về việc liệu những con số do SemiAnalysis cung cấp có chính xác hay không.
Meta làm việc trên LLM để cạnh tranh với OpenAI
Mặc dù tin tức về Gemini cho đến nay vẫn đầy hứa hẹn nhưng Google không phải là công ty duy nhất được cho là sẵn sàng tung ra LLM mới để cạnh tranh với OpenAI.
Meta gần đây nhất đã công bố phát hành Llama 2, một mô hình AI nguồn mở, hợp tác với Microsoft. Công ty dường như tận tâm tạo ra AI một cách có trách nhiệm để dễ tiếp cận hơn.
Đếm ngược tới Google Gemini
Những gì chúng ta biết cho đến nay cho thấy Gemini có thể đại diện cho một tiến bộ đáng kể trong xử lý ngôn ngữ tự nhiên.
Sự kết hợp giữa nghiên cứu AI mới nhất của DeepMind với nguồn tài nguyên tính toán khổng lồ của Google khiến cho tác động tiềm tàng khó có thể bị phóng đại.
Nếu Gemini đáp ứng được kỳ vọng, nó có thể thúc đẩy sự thay đổi trong AI tương tác, phù hợp với tham vọng của Google là “đưa AI đến với hàng tỷ người theo những cách có trách nhiệm”.
Tin tức mới nhất từ Meta và Google xuất hiện vài ngày sau Diễn đàn AI Insight đầu tiên, nơi các CEO công nghệ gặp riêng với một bộ phận Thượng viện Hoa Kỳ để thảo luận về tương lai của AI.
Tham khảo bài viết gốc tại đây:
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng

Không khí tại các thành phố lớn ô nhiễm nặng nề, đây là loại thiết bị được quan tâm nhiều nhất lúc này

  • 145
  • 0
Hiện nay, máy lọc không khí đang được ngày càng nhiều gia đình sử dụng bởi tính năng lọc sạch không khí tuyệt vời, làm thoáng đãng không gian đặc...

Thương hiệu gia dụng nổi tiếng từ Cộng hoà Séc tạo làn sóng trên thị trường Việt Nam

  • 144
  • 0
Elmich là một thương hiệu gia dụng cao cấp đến từ Cộng hòa Séc, được thành lập vào năm 1995 tại thành phố Ostrava. Với gần 30 năm phát triển...

Siêu máy tính tương lai sẽ "ngốn điện" ngang với 1 thành phố

  • 143
  • 0
Theo báo cáo của Epoch AI (viện nghiên cứu tại San Francisco, công bố cuối tháng 4/2025), đến năm 2030, các siêu máy tính hàng đầu dùng để huấn...

LG đồng hành cùng Hòa Minzy, Obito và Hứa Kim Tuyền tung ra MV “Nếp Nhà”

  • 99
  • 0
LG Electronics Việt Nam vừa giới thiệu MV “Nếp Nhà” với sự kết hợp của ca sĩ Hòa Minzy, rapper Obito và nhạc sĩ Hứa Kim Tuyền. Đây là món quà âm...

Lần đầu tiên một đại gia Việt có tài sản hơn 9 tỉ USD, vượt cả chủ tịch Samsung

  • 206
  • 0
Cổ phiếu VIC của Tập đoàn Vingroup tiếp tục tăng mạnh trong phiên ngày 8-5, góp phần nâng quy mô tài sản ròng của ông Phạm Nhật Vượng vượt 9 tỉ...

Đây là cách "xem YouTube" nhanh nhất có thể bạn chưa thử

  • 248
  • 1
Mô hình Gemini 2.5 Flash có thể tóm tắt nội dung video dài trên YouTube, giúp người dùng tiết kiệm thời gian và nắm bắt thông tin nhanh chóng...

Sạc siêu nhanh xe điện: sự tiện lợi phải trả giá bằng tuổi thọ pin

  • 181
  • 0
Năm 2025 được ca ngợi là "năm bùng nổ sạc siêu nhanh" đối với xe điện. Mặc dù sự tiến bộ nhanh chóng của công nghệ sạc nhanh và sạc siêu nhanh đã...

Cách phục hồi ảnh cũ bằng AI miễn phí nhanh gọn, ai cũng làm được

  • 236
  • 0
Phục hồi ảnh cũ bằng AI miễn phí là giải pháp lý tưởng cho những ai muốn tái hiện lại hình ảnh xưa mà không cần biết quá nhiều về Photoshop hay kỹ...

Samsung công bố hàng loạt TV Neo QLED 8K đến QLED 4K vừa đạt chuẩn chấm lượng tử đích thực từ tổ chức của Đức

  • 134
  • 0
Samsung vừa thông báo rằng dòng TV QLED mới nhất của hãng đã nhận được chứng nhận ‘Màn hình Chấm lượng tử Đích thực’ (Real Quantum Dot Display) từ...

Sếp Apple dự đoán "ngày tàn" của iPhone chỉ trong 10 năm tới: Lý do từ kẻ mà "ai cũng biết là ai"

  • 1,237
  • 0
Phó chủ tịch cấp cao phụ trách mảng dịch vụ của Apple, ông Eddy Cue, vừa đưa ra một nhận định gây sửng sốt về tương lai của chính sản phẩm chủ lực...
Back
Top