Chỉ dùng 10% tham số, Qwen 3 có thật sự “ăn đứt” DeepSeek R1 và GPT-4 Omni?

Nhung Phan
Nhung Phan
Phản hồi: 0

Nhung Phan

Intern Writer
Qwen 3 là dòng mô hình AI mới của Alibaba, bao gồm Qwen3-235B-A22B (MoE, chỉ 22B tham số hoạt động) và Qwen3-30B-A3B nhẹ hơn (3B tham số hoạt động).

1746612447340.png


Qwen3-235B-A22B vượt qua nhiều hàng benchmark đầu tiên như HumanEval, GSM8K, BoolQ, ARC-Challenge, MATH, Big-Bench Hard.

Cả hai phiên bản của Qwen3 đều sử dụng thiết kế Mixture of Experts, giúp tiết kiệm chi phí suy luận lên đến 90% so với mô hình thông thường.

Trong bài toán tạo ghi chú ứng dụng, Qwen3 cho kết quả nhanh chóng, thân thiện với người dùng nhưng DeepSeek R1 đắt hơn trong thời gian ngắn.

Với trò chơi Conway's Game of Life, Qwen3 cung cấp mã đơn giản và mẫu thử dễ sử dụng, trong khi DeepSeek R1 yêu cầu kiểm tra tệp yêu cầu và phức tạp hơn.

Trong bài toán tạo hình SVG con bướm, Qwen3 tạo ra hình ảnh chính xác và cân xứng hơn để đạt được hiệu quả hoạt hình của DeepSeek R1.

Ở bài toán suy luận “ai là người phạm tội?”, cả hai mô hình đều ra đáp án đúng là David, nhưng DeepSeek nhanh hơn 40 giây.

Trong kế hoạch lập kế hoạch đi theo tham số, cả hai mô hình cho ra kết quả giống nhau nhưng trình bày logic của Qwen3 rõ ràng hơn.

Với bài toán học về hai đoàn tàu gặp nhau, Qwen3 xử lý logic rõ ràng, tính toán đúng thời điểm 1:12 chiều, trong khi DeepSeek chuyển đổi phương pháp tạo ra mất thời gian.

Trong câu hỏi tính toán nhiên liệu trong trò chơi đua xe, DeepSeek R1 cho kết quả chính xác 27,3L và khuyến nghị bổ sung, còn Qwen3 chỉ ra 26,4L và tip ý dự phòng.

Trong phần viết, Qwen3 chia rõ 3 phần nội dung, phần tắt rõ ràng, trong khi DeepSeek R1 viết mã hóa thành khối khó đọc.

Về tổng thể, Qwen3 vượt trội về khả năng lập trình, viết lách và xử lý tiêu chuẩn xác thực; DeepSeek R1 có lợi thế ở tốc độ phản hồi và logic toán phức tạp.

Cả hai đều là lựa chọn AI mã nguồn mở mạnh mẽ, nhưng Qwen3 nổi bật nhờ khả năng toàn diện, chi phí thấp và hỗ trợ phát triển khai cục bộ.


📌 Qwen 3 nổi bật nhờ kết quả thiết kế MoE hiệu quả (chỉ 10% tham số hoạt động), vượt ra ngoài DeepSeek R1 trong trình cài đặt, viết và bài toán thực tế. DeepSeek R1 vẫn có lợi thế về tốc độ và giải toán phức tạp. Với điểm chuẩn cao, chi phí thấp và mã nguồn mở (Apache 2.0), Qwen 3 là đơn vị lý tưởng thay thế GPT-4 Omni.

Nguồn bài viết: https://songai.vn/posts/so-sanh-toa...-hai-mo-hinh-ai-ma-nguon-mo-hang-dau-hien-nay
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng

LG đồng hành cùng Hòa Minzy, Obito và Hứa Kim Tuyền tung ra MV “Nếp Nhà”

  • 99
  • 0
LG Electronics Việt Nam vừa giới thiệu MV “Nếp Nhà” với sự kết hợp của ca sĩ Hòa Minzy, rapper Obito và nhạc sĩ Hứa Kim Tuyền. Đây là món quà âm...

Lần đầu tiên một đại gia Việt có tài sản hơn 9 tỉ USD, vượt cả chủ tịch Samsung

  • 206
  • 0
Cổ phiếu VIC của Tập đoàn Vingroup tiếp tục tăng mạnh trong phiên ngày 8-5, góp phần nâng quy mô tài sản ròng của ông Phạm Nhật Vượng vượt 9 tỉ...

Đây là cách "xem YouTube" nhanh nhất có thể bạn chưa thử

  • 248
  • 1
Mô hình Gemini 2.5 Flash có thể tóm tắt nội dung video dài trên YouTube, giúp người dùng tiết kiệm thời gian và nắm bắt thông tin nhanh chóng...

Sạc siêu nhanh xe điện: sự tiện lợi phải trả giá bằng tuổi thọ pin

  • 181
  • 0
Năm 2025 được ca ngợi là "năm bùng nổ sạc siêu nhanh" đối với xe điện. Mặc dù sự tiến bộ nhanh chóng của công nghệ sạc nhanh và sạc siêu nhanh đã...

Cách phục hồi ảnh cũ bằng AI miễn phí nhanh gọn, ai cũng làm được

  • 236
  • 0
Phục hồi ảnh cũ bằng AI miễn phí là giải pháp lý tưởng cho những ai muốn tái hiện lại hình ảnh xưa mà không cần biết quá nhiều về Photoshop hay kỹ...

Samsung công bố hàng loạt TV Neo QLED 8K đến QLED 4K vừa đạt chuẩn chấm lượng tử đích thực từ tổ chức của Đức

  • 134
  • 0
Samsung vừa thông báo rằng dòng TV QLED mới nhất của hãng đã nhận được chứng nhận ‘Màn hình Chấm lượng tử Đích thực’ (Real Quantum Dot Display) từ...

Sếp Apple dự đoán "ngày tàn" của iPhone chỉ trong 10 năm tới: Lý do từ kẻ mà "ai cũng biết là ai"

  • 1,237
  • 0
Phó chủ tịch cấp cao phụ trách mảng dịch vụ của Apple, ông Eddy Cue, vừa đưa ra một nhận định gây sửng sốt về tương lai của chính sản phẩm chủ lực...

"Cú lừa" của Apple và Samsung về dung lượng lưu trữ điện thoại

  • 287
  • 0
Chi phí tăng đáng kể khi nâng cấp bộ nhớ được cho là chiến lược tối đa hóa lợi nhuận của các hãng smartphone, đặc biệt ở phân khúc cao cấp...

Hãng xe lớn nhất thế giới bay mất 1,3 tỷ USD lợi nhuận chỉ trong 2 tháng vì thuế Mỹ

  • 212
  • 0
Một năm trước, hãng sản xuất ô tô lớn nhất thế giới Toyota đã có một năm thành công rực rỡ. Người tiêu dùng Mỹ đã mua xe hybrid của Toyota và đồng...

Thị trường Nhật Bản "nín thở" chờ BYD công phá hàng rào bảo vệ các hãng xe nội địa

  • 167
  • 0
Thị trường xe siêu nhỏ (kei car) là một rào cản phi thuế quan lớn, bảo vệ ngành ô tô Nhật Bản trước các nhà sản xuất nước ngoài. Xe siêu nhỏ chiếm...
Back
Top