Google đã thực hiện nhiều đợt tấn công vào OpenAI trong vòng một tháng

Đoàn Thúy Hà

Editor
Thành viên BQT
"Trí tuệ tiên tiến sinh ra để đạt tốc độ cao," Google tuyên bố trong một bài đăng trên blog vào rạng sáng ngày 18/12, chính thức công bố một sản phẩm đột phá khác: #Gemini3Flash. Đây là mẫu máy nhanh nhất và tiết kiệm chi phí nhất trong dòng Gemini 3. Tuy nhiên, điều thu hút sự chú ý của ngành công nghiệp lần này là trong khi đạt được cả tốc độ và giá cả phải chăng, mẫu Flash này thậm chí còn vượt trội hơn các mẫu máy cao cấp ở một số khía cạnh.

Điều đáng chú ý là đây là bản cập nhật thứ tư của Google trong lĩnh vực mô hình lớn chỉ trong vòng một tháng.
1766023366923.png

CEO của Google, Sundar Pichai, cho biết Gemini 3 Flash đã phá vỡ giới hạn Pareto về cả hiệu năng và hiệu quả, vượt trội hơn so với mẫu flagship trước đó là 2.5 Pro về hiệu năng và tốc độ, trong khi lại có giá thành rẻ hơn nhiều.

"Gemini 3 Flash chứng minh rằng tốc độ và khả năng mở rộng không nhất thiết phải đánh đổi bằng trí thông minh," bài đăng trên blog chính thức tự hào tuyên bố. Và dữ liệu điểm chuẩn chắc chắn xác nhận điều này.

Trong bài kiểm tra SWE-bench Verified dùng để đánh giá khả năng lập trình, Gemini 3 Flash đạt điểm số cao tới 78%, vượt qua cả mẫu sản phẩm chủ lực của chính mình, Gemini 3 Pro, và Claude Sonnet 4.5 của Anthropic. Trên bài kiểm tra khả năng hiểu đa phương thức MMMU-Pro, Flash đạt 81,2%, không chỉ vượt qua GPT-5.2 (79,5%) mà còn bỏ xa Claude Sonnet 4.5 hơn mười điểm phần trăm.
1766023388175.png

Tất cả dữ liệu cho thấy mẫu Flash này đã có những tiến bộ đáng kể, phá vỡ ấn tượng của người dùng về dòng sản phẩm nhẹ: nhanh và rẻ, nhưng hiệu năng thường bị ảnh hưởng. Gemini 3 Flash đã đạt được khả năng gần như của các sản phẩm cao cấp, đáp ứng cả hiệu quả và tính tiết kiệm chi phí.

Theo dữ liệu từ sàn giao dịch mô hình lớn Imarena.ai, Gemini 3 Flash hiện đang xếp hạng trong top 5 ở các hạng mục văn bản, hình ảnh và lập trình, và xếp thứ 2 ở các hạng mục toán học và viết sáng tạo. Đây là mô hình tiên tiến tiết kiệm chi phí nhất, với đầu vào chỉ 0,50 đô la cho mỗi triệu token và đầu ra 3 đô la cho mỗi triệu token.

Để so sánh, Claude Sonnet 4.5 tạo ra 15 đô la cho mỗi triệu token, và GPT-5.2 tạo ra 14 đô la cho mỗi triệu token, gần gấp năm lần giá của Gemini 3 Flash.

Google cho biết Gemini 3 Flash có thể tự điều chỉnh thời gian xử lý khi hoạt động ở mức độ xử lý cao nhất. Đối với các ứng dụng phức tạp hơn, nó có thể cần thời gian xử lý lâu hơn, nhưng theo các bài kiểm tra lưu lượng truy cập thông thường, nó sử dụng trung bình ít hơn 30% token so với thế hệ trước 2.5 Pro, do đó hoàn thành các tác vụ hàng ngày chính xác hơn và với hiệu suất cao hơn.

Gemini 3 Flash vẫn giữ nguyên hiệu năng đột phá của Gemini 3 trong các tác vụ suy luận phức tạp, đa phương thức, xử lý tác nhân và lập trình, đồng thời kết hợp lợi thế về độ trễ, hiệu quả và chi phí của hiệu năng cấp Flash. "Đây là mô hình tốt nhất cho đến nay dành cho quy trình làm việc của tác nhân," Google tuyên bố.

Một nhà phát triển đã tiến hành một bài kiểm tra so sánh Python sử dụng Gemini 3 Flash và hai "ông vua về hiệu quả chi phí": một là phiên bản tiết kiệm chi phí GPT-5Mini của OpenAI , và cái còn lại là DeepSeek-V3.2, một ví dụ điển hình về công nghệ mã nguồn mở trong nước.

Kết quả cho thấy ba mẫu máy có giá thành tương đương nhau, nhưng Gemini 3 Flash chỉ mất 9 giây, trong khi GPT-5 Mini và DeepSeek-V3.2 mất lần lượt 35 giây và 41 giây. Đồng thời, Gemini 3 Flash vượt trội hơn về hiệu năng. Đây là một mẫu máy cân bằng giữa tốc độ và hiệu năng.

"Nhanh hơn, rẻ hơn và miễn phí sử dụng - đó là những gì các nhà phát triển độc lập và các nhóm nhỏ thực sự cần," một nhà phát triển độc lập viết. Anh ấy nói thêm rằng nếu trước đây họ đang chạy các ứng dụng trên GPT-40 hoặc Gemini 3 Pro, việc chuyển sang Gemini 3 Flash có thể giảm chi phí từ 50% đến 70%.

Bắt đầu từ hôm nay, Gemini 3 Flash sẽ có sẵn cho tất cả người dùng, bao gồm cả người dùng miễn phí. Trong ứng dụng Gemini, Gemini 3 Flash sẽ thay thế 2.5 Flash làm mô hình mặc định mới, trong khi Gemini 3 Pro sẽ là tùy chọn dành cho người dùng muốn giải quyết các bài toán toán học và lập trình phức tạp hơn.

Tháng trước, Google đã ra mắt Gemini 3 Pro và Gemini 3 Deep Think, hai sản phẩm này đã nhận được sự công nhận rộng rãi trên thị trường và vượt qua OpenAI để trở thành người dẫn đầu trong lĩnh vực mô hình quy mô lớn. Bài đăng trên blog cho biết kể từ khi ra mắt, API nội bộ đã xử lý hơn một nghìn tỷ token mỗi ngày. Người dùng thường xuyên sử dụng Gemini 3 để mô phỏng mã, học các chủ đề phức tạp, xây dựng và thiết kế trò chơi tương tác, cũng như hiểu các loại nội dung đa phương thức khác nhau.

Với hiệu quả về chi phí và hiệu năng, Flash mới ra mắt dự kiến sẽ còn phổ biến hơn nữa. Google cho biết Flash luôn là phiên bản phổ biến nhất trong nội bộ công ty, với các phiên bản trước như Flash 2 và Flash 2.5 xử lý hàng nghìn tỷ token trong hàng trăm nghìn ứng dụng được xây dựng bởi hàng triệu nhà phát triển.

"Mô hình Flash thực sự được thiết kế riêng cho các nhà phát triển, trong khi Flash 3 loại bỏ sự cần thiết phải đánh đổi giữa tốc độ và trí thông minh." Google đã tiết lộ thêm một át chủ bài nữa, khiến OpenAI không có nhiều thời gian để phản ứng.
 

Đính kèm

  • 1766023342732.png
    1766023342732.png
    793.5 KB · Lượt xem: 177

1,3 tỷ mật khẩu bị rò rỉ, đẩy hàng triệu tài khoản trực tuyến vào nguy hiểm

  • 10,786
  • 0
Một kho dữ liệu khổng lồ vừa bị tung lên web "đen", làm dấy lên cảnh báo về nguy cơ đột nhập tài khoản trên phạm vi toàn cầu. Quy mô rò rỉ lần này...

LANDFALL: Biến ảnh gửi qua WhatsApp thành vũ khí tấn công người dùng Samsung

  • 10,684
  • 0
Các chuyên gia an ninh mạng vừa phát hiện một loại phần mềm gián điệp cực kỳ tinh vi có tên LANDFALL, đang âm thầm tấn công người dùng điện thoại...

Liên minh 3 nhóm hacker khét tiếng thành thế lực đe dọa toàn cầu

  • 14,272
  • 0
Một “liên minh” mới của giới tội phạm mạng đang khiến các chuyên gia bảo mật lo ngại. Ba nhóm hacker khét tiếng: Scattered Spider, LAPSUS$ và...

Cảnh báo: Mã độc giả mạo Telegram X chiếm toàn bộ điện thoại và thiết bị của bạn

  • 11,744
  • 0
Các chuyên gia vừa cảnh báo về một chiến dịch mã độc trên Android, giả mạo ứng dụng Telegram X, có khả năng chiếm quyền kiểm soát gần như toàn bộ...

Hơn 48.000 thiết bị Cisco đối mặt làn sóng tấn công từ ba lỗ hổng nghiêm trọng

  • 10,821
  • 0
Cisco đang gặp cảnh báo an ninh mạng nghiêm trọng khi ba lỗ hổng mới được phát hiện trên các sản phẩm cốt lõi của hãng. Hai lỗ hổng ảnh hưởng đến...

Cháy trung tâm dữ liệu, hơn 600 dịch vụ chính phủ Hàn Quốc tê liệt

  • 12,486
  • 0
Một vụ cháy nghiêm trọng tại Trung tâm Dữ liệu Quốc gia ở thành phố Daejeon đã khiến hơn 600 hệ thống CNTT của chính phủ Hàn Quốc đồng loạt ngừng...

Khi dữ liệu số bị lộ: Hacker có thể làm gì với các thông tin tài chính của bạn?

  • 14,367
  • 1
Các vụ tấn công mạng gần đây cho thấy sự hoạt động của tin tặc đã và đang gia tăng trở lại, đe dọa đến an ninh dữ liệu của người dùng số. Đặt tình...

Apple vá lỗ hổng nghiêm trọng trong hệ thống xử lý hình ảnh: Người dùng cần cập nhật ngay

  • 15,536
  • 0
Apple vừa phát hành bản vá bảo mật để khắc phục lỗ hổng nguy hiểm CVE-2025-43300 trong hệ thống xử lý hình ảnh. Lỗ hổng này cho phép tin tặc chiếm...

HP OmniBook X Flip 14: Laptop chuẩn Copilot+ PC với AI mạnh mẽ, thiết kế linh hoạt cho người dùng hiện đại

  • 16,256
  • 0
Sự xuất hiện của dòng laptop chuẩn Copilot+ PC đang tạo nên làn sóng mới trong thị trường máy tính, nơi AI trở thành lõi công nghệ mang lại hiệu...

Những hiểu nhầm với quy định mới về xác nhận SIM chính chủ

  • 351
  • 0
Nhiều người hiểu chưa đúng về quy định mới liên quan đến xác thực thông tin thuê bao di động, có hiệu lực từ 15/4, khiến lo ngại bị khóa SIM...
Back