Chỉ dùng 10% tham số, Qwen 3 có thật sự “ăn đứt” DeepSeek R1 và GPT-4 Omni?

Nhung Phan · 07/05/2025

Qwen 3 là dòng mô hình AI mới của Alibaba, bao gồm Qwen3-235B-A22B (MoE, chỉ 22B tham số hoạt động) và Qwen3-30B-A3B nhẹ hơn (3B tham số hoạt động).

Qwen3-235B-A22B vượt qua nhiều hàng benchmark đầu tiên như HumanEval, GSM8K, BoolQ, ARC-Challenge, MATH, Big-Bench Hard.

Cả hai phiên bản của Qwen3 đều sử dụng thiết kế Mixture of Experts, giúp tiết kiệm chi phí suy luận lên đến 90% so với mô hình thông thường.

Trong bài toán tạo ghi chú ứng dụng, Qwen3 cho kết quả nhanh chóng, thân thiện với người dùng nhưng DeepSeek R1 đắt hơn trong thời gian ngắn.

Với trò chơi Conway's Game of Life, Qwen3 cung cấp mã đơn giản và mẫu thử dễ sử dụng, trong khi DeepSeek R1 yêu cầu kiểm tra tệp yêu cầu và phức tạp hơn.

Trong bài toán tạo hình SVG con bướm, Qwen3 tạo ra hình ảnh chính xác và cân xứng hơn để đạt được hiệu quả hoạt hình của DeepSeek R1.

Ở bài toán suy luận “ai là người phạm tội?”, cả hai mô hình đều ra đáp án đúng là David, nhưng DeepSeek nhanh hơn 40 giây.

Trong kế hoạch lập kế hoạch đi theo tham số, cả hai mô hình cho ra kết quả giống nhau nhưng trình bày logic của Qwen3 rõ ràng hơn.

Với bài toán học về hai đoàn tàu gặp nhau, Qwen3 xử lý logic rõ ràng, tính toán đúng thời điểm 1:12 chiều, trong khi DeepSeek chuyển đổi phương pháp tạo ra mất thời gian.

Trong câu hỏi tính toán nhiên liệu trong trò chơi đua xe, DeepSeek R1 cho kết quả chính xác 27,3L và khuyến nghị bổ sung, còn Qwen3 chỉ ra 26,4L và tip ý dự phòng.

Trong phần viết, Qwen3 chia rõ 3 phần nội dung, phần tắt rõ ràng, trong khi DeepSeek R1 viết mã hóa thành khối khó đọc.

Về tổng thể, Qwen3 vượt trội về khả năng lập trình, viết lách và xử lý tiêu chuẩn xác thực; DeepSeek R1 có lợi thế ở tốc độ phản hồi và logic toán phức tạp.

Cả hai đều là lựa chọn AI mã nguồn mở mạnh mẽ, nhưng Qwen3 nổi bật nhờ khả năng toàn diện, chi phí thấp và hỗ trợ phát triển khai cục bộ.

Qwen 3 nổi bật nhờ kết quả thiết kế MoE hiệu quả (chỉ 10% tham số hoạt động), vượt ra ngoài DeepSeek R1 trong trình cài đặt, viết và bài toán thực tế. DeepSeek R1 vẫn có lợi thế về tốc độ và giải toán phức tạp. Với điểm chuẩn cao, chi phí thấp và mã nguồn mở (Apache 2.0), Qwen 3 là đơn vị lý tưởng thay thế GPT-4 Omni.

Nguồn bài viết: https://songai.vn/posts/so-sanh-toa...-hai-mo-hinh-ai-ma-nguon-mo-hang-dau-hien-nay