DeepSeek R2 sắp ra mắt: 1.200 tỷ tham số, huấn luyện bằng chip Huawei, rẻ hơn GPT-4 tới 97%

Thế Việt · 29/04/2025

Sau khi gây tiếng vang lớn với mô hình R1, công ty AI Trung Quốc DeepSeek được cho là đang chuẩn bị tung ra "cú sốc" tiếp theo mang tên DeepSeek R2. Những thông tin rò rỉ gần đây từ truyền thông Trung Quốc (được trang Wccftech tổng hợp lại) đang vẽ nên chân dung một mô hình AI thế hệ mới với quy mô khổng lồ, kiến trúc tiên tiến, và đặc biệt là chi phí vận hành siêu rẻ cùng khả năng huấn luyện hiệu quả trên chip "cây nhà lá vườn" của Huawei, hứa hẹn sẽ tiếp tục làm thay đổi cuộc chơi AI toàn cầu.

DeepSeek R2: Quy mô ngang ngửa GPT-4, chi phí chỉ bằng 3%?

Theo các nguồn tin rò rỉ, DeepSeek R2 sẽ có kích thước lên tới 1,2 nghìn tỷ (1.2 Trillion) tham số, gấp đôi so với R1 và ngang ngửa với các mô hình hàng đầu hiện nay như GPT-4 Turbo của OpenAI hay Gemini 2.0 Pro của Google. Mô hình này được cho là sử dụng kiến trúc MoE (Mixture of Experts) dạng hybrid tiên tiến, có thể kết hợp các lớp chuyên biệt (sparse) và lớp dày đặc (dense) hoặc dùng cơ chế "gating" thông minh để tối ưu hóa hiệu suất xử lý và tiết kiệm tài nguyên tính toán.

Nhưng điểm gây chấn động nhất là chi phí vận hành được đồn đoán. Thông tin rò rỉ cho rằng chi phí cho mỗi triệu token đầu vào của R2 chỉ khoảng 0,07 USD và mỗi triệu token đầu ra là 0,27 USD. Nếu con số này là chính xác, nó rẻ hơn tới 97,4% so với mức giá hiện tại của GPT-4. Đây sẽ là một lợi thế cạnh tranh cực lớn, có khả năng thu hút hàng loạt doanh nghiệp chuyển sang sử dụng giải pháp của DeepSeek để tiết kiệm chi phí khổng lồ.
Bước tiến tự chủ phần cứng với chip Huawei Ascend

Một thông tin quan trọng khác là DeepSeek R2 được cho là đã huấn luyện thành công và đạt hiệu suất sử dụng tới 82% trên các cụm siêu chip AI Huawei Ascend 910B. Đây là dòng chip AI cao cấp do Trung Quốc tự thiết kế và sản xuất (dù có thể vẫn cần quy trình gia công bên ngoài), với cụm thử nghiệm đạt sức mạnh tính toán 512 PetaFLOPS (FP16). Việc DeepSeek có thể tối ưu và huấn luyện hiệu quả một mô hình quy mô nghìn tỷ tham số trên phần cứng nội địa cho thấy một bước tiến lớn trong nỗ lực giảm sự phụ thuộc vào công nghệ GPU của Mỹ (đặc biệt là Nvidia), vốn đang bị hạn chế xuất khẩu sang Trung Quốc.

Chờ đợi lời xác nhận chính thức

Cần nhấn mạnh rằng, tất cả các thông tin về DeepSeek R2 hiện tại vẫn chỉ dừng ở mức độ tin đồn và rò rỉ, chưa được DeepSeek chính thức xác nhận. Tuy nhiên, sau những gì DeepSeek R1 đã làm được (chứng minh năng lực AI Trung Quốc và khả năng phát triển chi phí thấp), những tin đồn về R2 hoàn toàn có cơ sở để gây chú ý. Nếu trở thành sự thật, DeepSeek R2 với quy mô lớn, chi phí cực thấp và được huấn luyện trên phần cứng nội địa sẽ là một đòn giáng mạnh vào thị trường AI toàn cầu, khẳng định sự trỗi dậy mạnh mẽ của các thế lực AI đến từ Trung Quốc. Cộng đồng công nghệ đang nóng lòng chờ đợi thông báo chính thức từ DeepSeek.

#DeepSeek

DeepSeek R2 sắp ra mắt: 1.200 tỷ tham số, huấn luyện bằng chip Huawei, rẻ hơn GPT-4 tới 97%

Thế Việt

Topaz

1,3 tỷ mật khẩu bị rò rỉ, đẩy hàng triệu tài khoản trực tuyến vào nguy hiểm

LANDFALL: Biến ảnh gửi qua WhatsApp thành vũ khí tấn công người dùng Samsung

Liên minh 3 nhóm hacker khét tiếng thành thế lực đe dọa toàn cầu

Cảnh báo: Mã độc giả mạo Telegram X chiếm toàn bộ điện thoại và thiết bị của bạn

Hơn 48.000 thiết bị Cisco đối mặt làn sóng tấn công từ ba lỗ hổng nghiêm trọng

Cháy trung tâm dữ liệu, hơn 600 dịch vụ chính phủ Hàn Quốc tê liệt

Khi dữ liệu số bị lộ: Hacker có thể làm gì với các thông tin tài chính của bạn?

Apple vá lỗ hổng nghiêm trọng trong hệ thống xử lý hình ảnh: Người dùng cần cập nhật ngay

HP OmniBook X Flip 14: Laptop chuẩn Copilot+ PC với AI mạnh mẽ, thiết kế linh hoạt cho người dùng hiện đại

DJI Osmo Pocket 4 ra mắt: Camera gimbal bỏ túi “All-in-One” với cảm biến 1 inch, zoom 2X lossless và hàng loạt nâng cấp chuyên nghiệp

🔥 AI phổ thông

50% lời khuyên y tế từ 5 nền tảng AI hàng đầu là không chính xác!

Claude siết xác minh danh tính: người dùng phản ứng mạnh

Kỹ năng viết code không còn là “lá chắn” trong kỷ nguyên AI

Cốc Cốc: dân mạng Việt đang đổ xô tìm kiếm các công cụ AI thế hệ mới và thiết bị tầm trung

Sau OpenAI và Anthropic, Google vừa ra mắt ứng dụng AI Gemini gốc cho máy tính Mac