Deepseek chuẩn bị gây chấn động thế giới lần thứ hai?

Mr. Darcy · 10/01/2026

Tháng 7 năm ngoái, DeepSeek chứng kiến cú rơi mạnh về mức độ quan tâm khi lượt tải giảm từ hơn 80 triệu xuống chỉ còn hơn 20 triệu, tức giảm hơn 72%. Cụm từ “DeepSeek xuống dốc” khi đó nhanh chóng trở thành chủ đề nóng trên mạng.

Nhưng theo nhiều nguồn tin thân cận, DeepSeek đang chuẩn bị quay lại vị trí dẫn đầu. Họ dự kiến ra mắt DeepSeek-V4 vào giữa tháng 2 năm nay, đúng dịp Tết Nguyên đán 2026, tròn một năm sau khi DeepSeek-R1 xuất hiện. Trọng tâm của phiên bản mới là khả năng tạo và xử lý mã.

Các đánh giá nội bộ cho thấy V4 vượt lên trên nhiều đối thủ lớn như Claude của Anthropic hay dòng GPT của OpenAI trong các bài kiểm tra lập trình. Nhóm phát triển cũng cho biết họ đã giải quyết được nhiều nút thắt kỹ thuật tồn tại lâu nay, mở đường cho một thế hệ AI phục vụ “Vibe Coding”.

Một điểm đáng chú ý là DeepSeek-V4 không chỉ học thuộc dữ liệu mà hiểu được quy luật phía sau. Với R1 trước đây, mô hình từng thất bại ở những bài toán đơn giản như đếm số chữ “r” trong từ “strawberry”, do không nắm được khái niệm đếm mà chỉ suy đoán theo dữ liệu huấn luyện. V4 được cho là đã khắc phục triệt để vấn đề này, với điều kiện mô hình đã hiểu đúng bản chất trong quá trình huấn luyện.

Quan trọng hơn, khi trở nên phức tạp hơn, V4 vẫn giữ được độ ổn định. Trong huấn luyện AI, việc học cái mới thường kéo theo hiện tượng quên cái cũ, hay còn gọi là “quên lãng thảm khốc”. DeepSeek cho biết V4 tránh được tình trạng này, duy trì toàn vẹn các năng lực ban đầu mà không phát sinh tác dụng phụ. Đây là nền tảng cần thiết để xây dựng các tác nhân lập trình có thể làm việc với dự án lớn và mã nguồn phức tạp.

Sau R1, hướng đi của DeepSeek ngày càng rõ ràng. Tháng 9/2025, bài báo về R1 xuất hiện trên bìa Nature, với Liang Wenfeng là tác giả liên hệ. Nhóm cũng công khai chi phí huấn luyện gây chú ý, khi giai đoạn tinh chỉnh từ V3-Base lên R1 chỉ tiêu tốn khoảng 294.000 USD, tương đương khoảng 7,3 tỷ đồng, chưa tính chi phí 6 triệu USD cho mô hình nền tảng.

Cuối năm 2025, DeepSeek tiếp tục công bố nghiên cứu mHC, một kiến trúc mới giúp mô hình mở rộng quy mô mà vẫn giữ ổn định. Thử nghiệm cho thấy điểm suy luận tăng thêm hơn 2%, ngay cả ở các mô hình lớn. Nhiều dấu hiệu cho thấy V4 đã ứng dụng kiến trúc này.

Đầu tháng 1/2026, nhóm còn mở rộng bài báo R1 trên arXiv từ 22 lên 86 trang, công khai chi tiết toàn bộ quy trình huấn luyện. Trong giới AI, việc “xả” chi tiết kỹ thuật như vậy thường đồng nghĩa thế hệ tiếp theo đã sẵn sàng.

Trong khi đó, cuộc đua lập trình AI cũng nóng lên với sự tham gia của nhiều cái tên mới. Các mô hình mã nguồn mở, công cụ lập trình AI và thậm chí thiết bị phần cứng tích hợp trợ lý thông minh liên tục xuất hiện. Thị trường vốn cũng phản ứng mạnh, khi nhiều công ty AI Trung Quốc niêm yết và tăng giá ấn tượng, cho thấy nhà đầu tư sẵn sàng trả giá cao cho các mô hình chất lượng.

Ngành AI Trung Quốc đang bước qua giai đoạn hỗn loạn để tiến tới tập trung hơn. Một năm trước, DeepSeek gây chú ý với chiến lược chi phí thấp. Một năm sau, mọi ánh nhìn lại đổ dồn về DeepSeek-V4.

Liệu họ có tạo ra cú bứt phá lần thứ hai hay không, câu trả lời có lẽ sẽ lộ diện ngay trong những ngày tới. #DeepSeekV4

Deepseek chuẩn bị gây chấn động thế giới lần thứ hai?

Mr. Darcy

Editor

1,3 tỷ mật khẩu bị rò rỉ, đẩy hàng triệu tài khoản trực tuyến vào nguy hiểm

LANDFALL: Biến ảnh gửi qua WhatsApp thành vũ khí tấn công người dùng Samsung

Liên minh 3 nhóm hacker khét tiếng thành thế lực đe dọa toàn cầu

Cảnh báo: Mã độc giả mạo Telegram X chiếm toàn bộ điện thoại và thiết bị của bạn

Hơn 48.000 thiết bị Cisco đối mặt làn sóng tấn công từ ba lỗ hổng nghiêm trọng

Cháy trung tâm dữ liệu, hơn 600 dịch vụ chính phủ Hàn Quốc tê liệt

Khi dữ liệu số bị lộ: Hacker có thể làm gì với các thông tin tài chính của bạn?

Apple vá lỗ hổng nghiêm trọng trong hệ thống xử lý hình ảnh: Người dùng cần cập nhật ngay

HP OmniBook X Flip 14: Laptop chuẩn Copilot+ PC với AI mạnh mẽ, thiết kế linh hoạt cho người dùng hiện đại

Những hiểu nhầm với quy định mới về xác nhận SIM chính chủ