Deepseek chuẩn bị gây chấn động thế giới lần thứ hai?

Mr. Darcy

Editor
Thành viên BQT
Tháng 7 năm ngoái, DeepSeek chứng kiến cú rơi mạnh về mức độ quan tâm khi lượt tải giảm từ hơn 80 triệu xuống chỉ còn hơn 20 triệu, tức giảm hơn 72%. Cụm từ “DeepSeek xuống dốc” khi đó nhanh chóng trở thành chủ đề nóng trên mạng.
1768009049659.png

Nhưng theo nhiều nguồn tin thân cận, DeepSeek đang chuẩn bị quay lại vị trí dẫn đầu. Họ dự kiến ra mắt DeepSeek-V4 vào giữa tháng 2 năm nay, đúng dịp Tết Nguyên đán 2026, tròn một năm sau khi DeepSeek-R1 xuất hiện. Trọng tâm của phiên bản mới là khả năng tạo và xử lý mã.

Các đánh giá nội bộ cho thấy V4 vượt lên trên nhiều đối thủ lớn như Claude của Anthropic hay dòng GPT của OpenAI trong các bài kiểm tra lập trình. Nhóm phát triển cũng cho biết họ đã giải quyết được nhiều nút thắt kỹ thuật tồn tại lâu nay, mở đường cho một thế hệ AI phục vụ “Vibe Coding”.

Một điểm đáng chú ý là DeepSeek-V4 không chỉ học thuộc dữ liệu mà hiểu được quy luật phía sau. Với R1 trước đây, mô hình từng thất bại ở những bài toán đơn giản như đếm số chữ “r” trong từ “strawberry”, do không nắm được khái niệm đếm mà chỉ suy đoán theo dữ liệu huấn luyện. V4 được cho là đã khắc phục triệt để vấn đề này, với điều kiện mô hình đã hiểu đúng bản chất trong quá trình huấn luyện.

Quan trọng hơn, khi trở nên phức tạp hơn, V4 vẫn giữ được độ ổn định. Trong huấn luyện AI, việc học cái mới thường kéo theo hiện tượng quên cái cũ, hay còn gọi là “quên lãng thảm khốc”. DeepSeek cho biết V4 tránh được tình trạng này, duy trì toàn vẹn các năng lực ban đầu mà không phát sinh tác dụng phụ. Đây là nền tảng cần thiết để xây dựng các tác nhân lập trình có thể làm việc với dự án lớn và mã nguồn phức tạp.
1768009063619.png

Sau R1, hướng đi của DeepSeek ngày càng rõ ràng. Tháng 9/2025, bài báo về R1 xuất hiện trên bìa Nature, với Liang Wenfeng là tác giả liên hệ. Nhóm cũng công khai chi phí huấn luyện gây chú ý, khi giai đoạn tinh chỉnh từ V3-Base lên R1 chỉ tiêu tốn khoảng 294.000 USD, tương đương khoảng 7,3 tỷ đồng, chưa tính chi phí 6 triệu USD cho mô hình nền tảng.

Cuối năm 2025, DeepSeek tiếp tục công bố nghiên cứu mHC, một kiến trúc mới giúp mô hình mở rộng quy mô mà vẫn giữ ổn định. Thử nghiệm cho thấy điểm suy luận tăng thêm hơn 2%, ngay cả ở các mô hình lớn. Nhiều dấu hiệu cho thấy V4 đã ứng dụng kiến trúc này.

Đầu tháng 1/2026, nhóm còn mở rộng bài báo R1 trên arXiv từ 22 lên 86 trang, công khai chi tiết toàn bộ quy trình huấn luyện. Trong giới AI, việc “xả” chi tiết kỹ thuật như vậy thường đồng nghĩa thế hệ tiếp theo đã sẵn sàng.

Trong khi đó, cuộc đua lập trình AI cũng nóng lên với sự tham gia của nhiều cái tên mới. Các mô hình mã nguồn mở, công cụ lập trình AI và thậm chí thiết bị phần cứng tích hợp trợ lý thông minh liên tục xuất hiện. Thị trường vốn cũng phản ứng mạnh, khi nhiều công ty AI Trung Quốc niêm yết và tăng giá ấn tượng, cho thấy nhà đầu tư sẵn sàng trả giá cao cho các mô hình chất lượng.

Ngành AI Trung Quốc đang bước qua giai đoạn hỗn loạn để tiến tới tập trung hơn. Một năm trước, DeepSeek gây chú ý với chiến lược chi phí thấp. Một năm sau, mọi ánh nhìn lại đổ dồn về DeepSeek-V4.

Liệu họ có tạo ra cú bứt phá lần thứ hai hay không, câu trả lời có lẽ sẽ lộ diện ngay trong những ngày tới. #DeepSeekV4
 

1,3 tỷ mật khẩu bị rò rỉ, đẩy hàng triệu tài khoản trực tuyến vào nguy hiểm

  • 10,786
  • 0
Một kho dữ liệu khổng lồ vừa bị tung lên web "đen", làm dấy lên cảnh báo về nguy cơ đột nhập tài khoản trên phạm vi toàn cầu. Quy mô rò rỉ lần này...

LANDFALL: Biến ảnh gửi qua WhatsApp thành vũ khí tấn công người dùng Samsung

  • 10,684
  • 0
Các chuyên gia an ninh mạng vừa phát hiện một loại phần mềm gián điệp cực kỳ tinh vi có tên LANDFALL, đang âm thầm tấn công người dùng điện thoại...

Liên minh 3 nhóm hacker khét tiếng thành thế lực đe dọa toàn cầu

  • 14,272
  • 0
Một “liên minh” mới của giới tội phạm mạng đang khiến các chuyên gia bảo mật lo ngại. Ba nhóm hacker khét tiếng: Scattered Spider, LAPSUS$ và...

Cảnh báo: Mã độc giả mạo Telegram X chiếm toàn bộ điện thoại và thiết bị của bạn

  • 11,744
  • 0
Các chuyên gia vừa cảnh báo về một chiến dịch mã độc trên Android, giả mạo ứng dụng Telegram X, có khả năng chiếm quyền kiểm soát gần như toàn bộ...

Hơn 48.000 thiết bị Cisco đối mặt làn sóng tấn công từ ba lỗ hổng nghiêm trọng

  • 10,821
  • 0
Cisco đang gặp cảnh báo an ninh mạng nghiêm trọng khi ba lỗ hổng mới được phát hiện trên các sản phẩm cốt lõi của hãng. Hai lỗ hổng ảnh hưởng đến...

Cháy trung tâm dữ liệu, hơn 600 dịch vụ chính phủ Hàn Quốc tê liệt

  • 12,486
  • 0
Một vụ cháy nghiêm trọng tại Trung tâm Dữ liệu Quốc gia ở thành phố Daejeon đã khiến hơn 600 hệ thống CNTT của chính phủ Hàn Quốc đồng loạt ngừng...

Khi dữ liệu số bị lộ: Hacker có thể làm gì với các thông tin tài chính của bạn?

  • 14,367
  • 1
Các vụ tấn công mạng gần đây cho thấy sự hoạt động của tin tặc đã và đang gia tăng trở lại, đe dọa đến an ninh dữ liệu của người dùng số. Đặt tình...

Apple vá lỗ hổng nghiêm trọng trong hệ thống xử lý hình ảnh: Người dùng cần cập nhật ngay

  • 15,535
  • 0
Apple vừa phát hành bản vá bảo mật để khắc phục lỗ hổng nguy hiểm CVE-2025-43300 trong hệ thống xử lý hình ảnh. Lỗ hổng này cho phép tin tặc chiếm...

HP OmniBook X Flip 14: Laptop chuẩn Copilot+ PC với AI mạnh mẽ, thiết kế linh hoạt cho người dùng hiện đại

  • 16,256
  • 0
Sự xuất hiện của dòng laptop chuẩn Copilot+ PC đang tạo nên làn sóng mới trong thị trường máy tính, nơi AI trở thành lõi công nghệ mang lại hiệu...

Những hiểu nhầm với quy định mới về xác nhận SIM chính chủ

  • 350
  • 0
Nhiều người hiểu chưa đúng về quy định mới liên quan đến xác thực thông tin thuê bao di động, có hiệu lực từ 15/4, khiến lo ngại bị khóa SIM...
Back