Alibaba tung ai mã nguồn mở Qwen3: tuyên bố mạnh hơn OpenAI o1, DeepSeek R1

Hoàng Khang
Hoàng Khang
Phản hồi: 0
Hoàng Khang

Hoàng Khang Đã xác thực

Gã khổng lồ công nghệ Trung Quốc Alibaba vừa chính thức tung ra Qwen3, một loạt mô hình ngôn ngữ lớn đa phương thức (LLMM) mã nguồn mở mới nhất, thông qua nhóm nghiên cứu Qwen của mình.

029ebd88-b24c-4396-80ff-2a47b3477cc6_png_75.jpg


Đáng chú ý, phiên bản MoE (Mixture of Experts) lớn nhất trong dòng này, Qwen3-235B-A22B, được tuyên bố là vượt trội hơn cả mô hình mã nguồn mở DeepSeek R1 lẫn mô hình độc quyền o1 mới nhất của OpenAI trên các bài kiểm tra benchmark quan trọng, đồng thời tiệm cận hiệu năng của Google Gemini 2.5-Pro. Động thái này tiếp tục khẳng định vị thế hàng đầu của Trung Quốc trong lĩnh vực AI mã nguồn mở và gia tăng sức ép cạnh tranh lên các đối thủ phương Tây.

Kiến trúc MoE, Suy luận Hybrid và Loạt mô hình đa dạng

Dòng Qwen3 bao gồm tổng cộng 8 mô hình mới, phục vụ nhiều nhu cầu khác nhau. Hai mô hình lớn nhất sử dụng kiến trúc Mixture-of-Experts (MoE) – một kỹ thuật hiệu quả giúp kích hoạt các "chuyên gia" нейрон phù hợp nhất cho từng tác vụ thay vì toàn bộ mạng lưới, giúp tiết kiệm tài nguyên khi suy luận (inference). Các mô hình MoE bao gồm bản 235 tỷ tham số (với 22 tỷ tham số hoạt động) và bản 30 tỷ tham số (với 3 tỷ tham số hoạt động). Sáu mô hình còn lại là các mô hình "dày đặc" (dense) truyền thống với kích thước từ 0.6 tỷ đến 32 tỷ tham số, phù hợp cho việc triển khai trên các thiết bị từ laptop đến cụm máy chủ.

Một tính năng độc đáo được giới thiệu là khả năng "Suy luận Hybrid" (Hybrid Reasoning) hay "Suy luận Động" (Dynamic Reasoning). Nó cho phép người dùng chủ động chuyển đổi giữa chế độ phản hồi nhanh, chính xác thông thường và chế độ "Suy nghĩ" (Thinking Mode) tốn nhiều tài nguyên tính toán hơn cho các câu hỏi phức tạp trong lĩnh vực khoa học, toán học, kỹ thuật... Người dùng có thể kích hoạt chế độ này qua nút bấm trên giao diện Qwen Chat hoặc bằng các prompt đặc biệt.

Các mô hình Qwen3 cũng được cải thiện đáng kể về khả năng đa ngôn ngữ, hiện hỗ trợ tới 119 ngôn ngữ và phương ngữ. Chúng được huấn luyện trên một tập dữ liệu khổng lồ ~36 nghìn tỷ token (gấp đôi Qwen2.5) bao gồm dữ liệu web, tài liệu và cả dữ liệu tổng hợp.

Gppj9_kbEAAkO9U_jpg_75.jpg



Lợi thế cho Doanh nghiệp và Cộng đồng Mã nguồn mở

Việc Qwen3 được phát hành dưới giấy phép Apache 2.0 rất thông thoáng (cho phép sử dụng thương mại không giới hạn) là một lợi thế lớn so với các mô hình mã nguồn mở khác như Llama của Meta (vốn có các điều khoản hạn chế hơn). Điều này, kết hợp với các ưu điểm kỹ thuật, khiến Qwen3 trở thành một lựa chọn hấp dẫn cho các doanh nghiệp và nhà phát triển:
  • Hiệu năng cao, chi phí thấp: Mô hình MoE lớn cung cấp khả năng suy luận ngang ngửa GPT-4 với chi phí bộ nhớ GPU chỉ tương đương mô hình dense 20-30 tỷ tham số.
  • Dễ tích hợp: Hỗ trợ các framework phổ biến và cung cấp điểm cuối tương thích với OpenAI, giúp chuyển đổi dễ dàng.
  • Tùy chỉnh linh hoạt: Hỗ trợ chính thức LoRA/QLoRA cho phép doanh nghiệp tự tinh chỉnh mô hình trên dữ liệu riêng mà không cần gửi dữ liệu cho bên thứ ba.
  • Kiểm soát và Bảo mật: Triển khai tại chỗ (on-premises) cho phép ghi log và kiểm tra toàn bộ prompt/output; kiến trúc MoE cũng giúp giảm bề mặt tấn công khi suy luận.
Sự xuất hiện của Qwen3 cung cấp một giải pháp thay thế mã nguồn mở mạnh mẽ và khả thi không chỉ so với các mô hình độc quyền của Mỹ mà còn cả với các đối thủ Trung Quốc khác như DeepSeek, Tencent hay ByteDance. Nó cho thấy cuộc đua cung cấp các mô hình AI ngày càng mạnh mẽ và dễ tiếp cận vẫn diễn ra vô cùng quyết liệt.

Screenshot-2025-04-28-at-6.31.44-E2-80-AFPM_png_75.jpg

Tầm nhìn tương lai

Nhóm Qwen không xem Qwen3 là điểm dừng. Họ định vị đây là bước tiến quan trọng hướng tới các mục tiêu xa hơn về Trí tuệ Nhân tạo Tổng quát (AGI) và Siêu trí tuệ (ASI). Kế hoạch tiếp theo bao gồm mở rộng quy mô dữ liệu và mô hình hơn nữa, tăng độ dài ngữ cảnh, hỗ trợ thêm nhiều phương thức đầu vào/ra (modality) và cải thiện khả năng học tăng cường. Việc liên tục phát hành các mô hình mạnh mẽ dưới giấy phép mở của Qwen đang góp phần hạ thấp rào cản, thúc đẩy đổi mới trong cộng đồng AI toàn cầu.
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng

LG đồng hành cùng Hòa Minzy, Obito và Hứa Kim Tuyền tung ra MV “Nếp Nhà”

  • 99
  • 0
LG Electronics Việt Nam vừa giới thiệu MV “Nếp Nhà” với sự kết hợp của ca sĩ Hòa Minzy, rapper Obito và nhạc sĩ Hứa Kim Tuyền. Đây là món quà âm...

Lần đầu tiên một đại gia Việt có tài sản hơn 9 tỉ USD, vượt cả chủ tịch Samsung

  • 206
  • 0
Cổ phiếu VIC của Tập đoàn Vingroup tiếp tục tăng mạnh trong phiên ngày 8-5, góp phần nâng quy mô tài sản ròng của ông Phạm Nhật Vượng vượt 9 tỉ...

Đây là cách "xem YouTube" nhanh nhất có thể bạn chưa thử

  • 248
  • 1
Mô hình Gemini 2.5 Flash có thể tóm tắt nội dung video dài trên YouTube, giúp người dùng tiết kiệm thời gian và nắm bắt thông tin nhanh chóng...

Sạc siêu nhanh xe điện: sự tiện lợi phải trả giá bằng tuổi thọ pin

  • 181
  • 0
Năm 2025 được ca ngợi là "năm bùng nổ sạc siêu nhanh" đối với xe điện. Mặc dù sự tiến bộ nhanh chóng của công nghệ sạc nhanh và sạc siêu nhanh đã...

Cách phục hồi ảnh cũ bằng AI miễn phí nhanh gọn, ai cũng làm được

  • 236
  • 0
Phục hồi ảnh cũ bằng AI miễn phí là giải pháp lý tưởng cho những ai muốn tái hiện lại hình ảnh xưa mà không cần biết quá nhiều về Photoshop hay kỹ...

Samsung công bố hàng loạt TV Neo QLED 8K đến QLED 4K vừa đạt chuẩn chấm lượng tử đích thực từ tổ chức của Đức

  • 134
  • 0
Samsung vừa thông báo rằng dòng TV QLED mới nhất của hãng đã nhận được chứng nhận ‘Màn hình Chấm lượng tử Đích thực’ (Real Quantum Dot Display) từ...

Sếp Apple dự đoán "ngày tàn" của iPhone chỉ trong 10 năm tới: Lý do từ kẻ mà "ai cũng biết là ai"

  • 1,237
  • 0
Phó chủ tịch cấp cao phụ trách mảng dịch vụ của Apple, ông Eddy Cue, vừa đưa ra một nhận định gây sửng sốt về tương lai của chính sản phẩm chủ lực...

"Cú lừa" của Apple và Samsung về dung lượng lưu trữ điện thoại

  • 287
  • 0
Chi phí tăng đáng kể khi nâng cấp bộ nhớ được cho là chiến lược tối đa hóa lợi nhuận của các hãng smartphone, đặc biệt ở phân khúc cao cấp...

Hãng xe lớn nhất thế giới bay mất 1,3 tỷ USD lợi nhuận chỉ trong 2 tháng vì thuế Mỹ

  • 212
  • 0
Một năm trước, hãng sản xuất ô tô lớn nhất thế giới Toyota đã có một năm thành công rực rỡ. Người tiêu dùng Mỹ đã mua xe hybrid của Toyota và đồng...

Thị trường Nhật Bản "nín thở" chờ BYD công phá hàng rào bảo vệ các hãng xe nội địa

  • 167
  • 0
Thị trường xe siêu nhỏ (kei car) là một rào cản phi thuế quan lớn, bảo vệ ngành ô tô Nhật Bản trước các nhà sản xuất nước ngoài. Xe siêu nhỏ chiếm...
Back
Top