deepseek r1 so sánh

  1. Nhung Phan

    Chỉ dùng 10% tham số, Qwen 3 có thật sự “ăn đứt” DeepSeek R1 và GPT-4 Omni?

    Qwen 3 là dòng mô hình AI mới của Alibaba, bao gồm Qwen3-235B-A22B (MoE, chỉ 22B tham số hoạt động) và Qwen3-30B-A3B nhẹ hơn (3B tham số hoạt động). Qwen3-235B-A22B vượt qua nhiều hàng benchmark đầu tiên như HumanEval, GSM8K, BoolQ, ARC-Challenge, MATH, Big-Bench Hard. Cả hai phiên bản của...
Back