Google ra mắt mô hình AI Gemini 2.5 thông minh nhất từ trước đến nay, đường đua AI lại nóng

From Beijing with Love
From Beijing with Love
Phản hồi: 0

From Beijing with Love

Cháu đã lớn thế này rồi à. Lại đây chú ôm cái coi.
Google vừa chính thức giới thiệu Gemini 2.5, thế hệ mô hình trí tuệ nhân tạo (AI) được hãng tuyên bố là thông minh nhất từ trước đến nay. Phiên bản đầu tiên trong loạt 2.5 này là Gemini 2.5 Pro Experimental (bản thử nghiệm), đã nhanh chóng thể hiện sức mạnh vượt trội trên nhiều bài đánh giá (benchmark) phổ biến và vươn lên vị trí số 1 trên bảng xếp hạng LMArena (đo lường sự ưa thích của con người) với cách biệt đáng kể.

Điểm cốt lõi của Gemini 2.5 nằm ở chỗ chúng là các "mô hình biết suy nghĩ" (thinking models). Điều này có nghĩa là chúng có khả năng "suy nghĩ" và lý luận qua các bước trước khi đưa ra phản hồi, dẫn đến hiệu suất nâng cao và độ chính xác được cải thiện. Trong lĩnh vực AI, khả năng "suy luận" (reasoning) không chỉ dừng lại ở việc phân loại và dự đoán. Nó bao hàm khả năng phân tích thông tin, rút ra kết luận logic, kết hợp bối cảnh và các sắc thái tinh tế, cũng như đưa ra quyết định sáng suốt.


Google cho biết họ đã khám phá các cách làm cho AI thông minh hơn và có khả năng suy luận tốt hơn từ lâu, thông qua các kỹ thuật như học tăng cường (reinforcement learning) và gợi ý theo chuỗi suy nghĩ (chain-of-thought prompting). Dựa trên nền tảng này, hãng gần đây đã giới thiệu mô hình "biết suy nghĩ" đầu tiên là Gemini 2.0 Flash Thinking. Giờ đây, với Gemini 2.5, Google đã đạt được một cấp độ hiệu suất mới bằng cách kết hợp một mô hình nền tảng được cải tiến đáng kể với quá trình hậu huấn luyện (post-training) được cải thiện. Hãng khẳng định sẽ xây dựng những khả năng tư duy này trực tiếp vào tất cả các mô hình trong tương lai, giúp chúng xử lý các vấn đề phức tạp hơn và hỗ trợ các tác nhân (agents) có năng lực hơn, nhận biết bối cảnh tốt hơn.

1742974063189.png


Gemini 2.5 Pro Experimental được định vị là mô hình tiên tiến nhất của Google cho các tác vụ phức tạp. Việc đứng đầu bảng xếp hạng LMArena cho thấy đây là một mô hình có năng lực cao và phong cách phản hồi chất lượng. 2.5 Pro cũng thể hiện khả năng suy luận và viết mã mạnh mẽ, dẫn đầu trong các bài đánh giá phổ biến về viết mã, toán học và khoa học như GPQA và AIME 2025. Nó cũng đạt điểm số cao nhất (18,8% khi không sử dụng công cụ) trên "Humanity’s Last Exam", một bộ dữ liệu được thiết kế bởi hàng trăm chuyên gia để nắm bắt giới hạn kiến thức và suy luận của con người.

Google đặc biệt nhấn mạnh vào hiệu suất viết mã, và với Gemini 2.5, hãng đã đạt được một bước nhảy vọt lớn so với phiên bản 2.0. 2.5 Pro xuất sắc trong việc tạo ra các ứng dụng web hấp dẫn về mặt hình ảnh, các ứng dụng mã có tính tự hành (agentic code), cùng với việc chuyển đổi và chỉnh sửa mã. Trên SWE-Bench Verified, tiêu chuẩn ngành cho đánh giá mã tự hành, Gemini 2.5 Pro đạt 63,8% với thiết lập tác nhân tùy chỉnh. Google thậm chí còn trình diễn khả năng suy luận của 2.5 Pro trong việc tạo ra một trò chơi điện tử hoàn chỉnh từ một dòng lệnh duy nhất.

1742974091922.png


Gemini 2.5 tiếp tục phát huy những điểm mạnh của các mô hình Gemini trước đó, bao gồm khả năng đa phương thức tự nhiên (native multimodality) và cửa sổ ngữ cảnh dài (long context window). 2.5 Pro hiện được phát hành với cửa sổ ngữ cảnh 1 triệu token (và sẽ sớm có phiên bản 2 triệu token), cho phép nó hiểu các bộ dữ liệu khổng lồ và xử lý các vấn đề phức tạp từ nhiều nguồn thông tin khác nhau, bao gồm văn bản, âm thanh, hình ảnh, video và thậm chí toàn bộ kho mã nguồn. Giám đốc điều hành Google DeepMind, Demis Hassabis, đã gọi Gemini 2.5 Pro là "một mô hình tiên tiến tuyệt vời, số 1 trên LMArena với cách biệt 39 điểm ELO đáng kinh ngạc, với những cải tiến đáng kể trên mọi phương diện về suy luận đa phương thức, viết mã & STEM".

Hiện tại, Gemini 2.5 Pro đã có sẵn trong Google AI Studio và trong ứng dụng Gemini cho người dùng Gemini Advanced thông qua menu thả xuống chọn mô hình. Nó cũng sẽ sớm có mặt trên Vertex AI. Google cho biết sẽ công bố giá trong những tuần tới, cho phép người dùng sử dụng 2.5 Pro với giới hạn tỷ lệ cao hơn cho mục đích sản xuất quy mô lớn.

1742974110068.png


Sự ra mắt Gemini 2.5 diễn ra trong bối cảnh cuộc đua AI ngày càng nóng lên. Cùng thời điểm, Microsoft cũng đã công bố các tác nhân "suy luận sâu" (deep reasoning agents) mới cho Microsoft 365 Copilot, mang tên Researcher và Analyst, dựa trên các mô hình của OpenAI. Researcher tập trung vào "nghiên cứu phức tạp, đa bước", trong khi Analyst có khả năng biến dữ liệu thô thành bảng tính, chạy mã Python và hoạt động như một nhà khoa học dữ liệu lành nghề. Các công cụ này dự kiến sẽ sớm ra mắt trong chương trình truy cập sớm, cùng với các khả năng tác nhân tự trị mới trong Copilot Studio. Điều này cho thấy xu hướng chung của ngành là phát triển các tác nhân AI ngày càng thông minh và có khả năng suy luận phức tạp hơn.

Với Gemini 2.5, Google đang khẳng định vị thế của mình trong cuộc đua AI, nhấn mạnh vào khả năng "suy nghĩ" và suy luận như một yếu tố khác biệt chính, đồng thời tiếp tục cải thiện hiệu suất và khả năng đa phương thức của các mô hình AI của mình.

#Gemini #GoogleAI
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng

Điểm danh 6 tính năng phổ biến nhất của máy lọc không khí hiện nay, ai chuẩn bị mua cần chú ý

  • 121
  • 0
1. Công nghệ lọc không khí HEPA – Chuẩn mực vàng trong lọc bụi mịn HEPA (High-Efficiency Particulate Air) là công nghệ lọc không khí tiên tiến, có...

Không khí tại các thành phố lớn ô nhiễm nặng nề, đây là loại thiết bị được quan tâm nhiều nhất lúc này

  • 145
  • 0
Hiện nay, máy lọc không khí đang được ngày càng nhiều gia đình sử dụng bởi tính năng lọc sạch không khí tuyệt vời, làm thoáng đãng không gian đặc...

Thương hiệu gia dụng nổi tiếng từ Cộng hoà Séc tạo làn sóng trên thị trường Việt Nam

  • 144
  • 0
Elmich là một thương hiệu gia dụng cao cấp đến từ Cộng hòa Séc, được thành lập vào năm 1995 tại thành phố Ostrava. Với gần 30 năm phát triển...

Siêu máy tính tương lai sẽ "ngốn điện" ngang với 1 thành phố

  • 143
  • 0
Theo báo cáo của Epoch AI (viện nghiên cứu tại San Francisco, công bố cuối tháng 4/2025), đến năm 2030, các siêu máy tính hàng đầu dùng để huấn...

LG đồng hành cùng Hòa Minzy, Obito và Hứa Kim Tuyền tung ra MV “Nếp Nhà”

  • 99
  • 0
LG Electronics Việt Nam vừa giới thiệu MV “Nếp Nhà” với sự kết hợp của ca sĩ Hòa Minzy, rapper Obito và nhạc sĩ Hứa Kim Tuyền. Đây là món quà âm...

Lần đầu tiên một đại gia Việt có tài sản hơn 9 tỉ USD, vượt cả chủ tịch Samsung

  • 206
  • 0
Cổ phiếu VIC của Tập đoàn Vingroup tiếp tục tăng mạnh trong phiên ngày 8-5, góp phần nâng quy mô tài sản ròng của ông Phạm Nhật Vượng vượt 9 tỉ...

Đây là cách "xem YouTube" nhanh nhất có thể bạn chưa thử

  • 248
  • 1
Mô hình Gemini 2.5 Flash có thể tóm tắt nội dung video dài trên YouTube, giúp người dùng tiết kiệm thời gian và nắm bắt thông tin nhanh chóng...

Sạc siêu nhanh xe điện: sự tiện lợi phải trả giá bằng tuổi thọ pin

  • 181
  • 0
Năm 2025 được ca ngợi là "năm bùng nổ sạc siêu nhanh" đối với xe điện. Mặc dù sự tiến bộ nhanh chóng của công nghệ sạc nhanh và sạc siêu nhanh đã...

Cách phục hồi ảnh cũ bằng AI miễn phí nhanh gọn, ai cũng làm được

  • 236
  • 0
Phục hồi ảnh cũ bằng AI miễn phí là giải pháp lý tưởng cho những ai muốn tái hiện lại hình ảnh xưa mà không cần biết quá nhiều về Photoshop hay kỹ...

Samsung công bố hàng loạt TV Neo QLED 8K đến QLED 4K vừa đạt chuẩn chấm lượng tử đích thực từ tổ chức của Đức

  • 134
  • 0
Samsung vừa thông báo rằng dòng TV QLED mới nhất của hãng đã nhận được chứng nhận ‘Màn hình Chấm lượng tử Đích thực’ (Real Quantum Dot Display) từ...
Back
Top