DeepSeek 'chơi lớn': Miễn phí mô hình AI cho mục đích thương mại, cạnh tranh trực tiếp OpenAI

Dũng Đỗ
Dũng Đỗ
Phản hồi: 0
DeepSeek, startup AI đến từ Trung Quốc đang gây tiếng vang trên thị trường quốc tế, vừa âm thầm phát hành mô hình ngôn ngữ lớn (LLM) mới có tên DeepSeek-V3-0324 trên nền tảng Hugging Face. Sự xuất hiện của mô hình 641GB này đang gây xôn xao trong ngành công nghiệp trí tuệ nhân tạo (AI), không chỉ bởi hiệu năng ấn tượng mà còn bởi cách tiếp cận "mở" và miễn phí, thách thức trực tiếp mô hình kinh doanh của OpenAI.

deepseek-v3-ai-1742867241528-17428672468491169518492_jpg_75.jpg

Những điểm chính:
  • DeepSeek ra mắt mô hình ngôn ngữ lớn (LLM) mới DeepSeek-V3-0324, mã nguồn mở, miễn phí cho mục đích thương mại.
  • Mô hình này sử dụng kiến trúc "mixture-of-experts" (MoE) độc đáo, giúp tăng hiệu suất và giảm chi phí.
  • DeepSeek-V3-0324 tích hợp công nghệ Multi-Head Latent Attention (MLA) và Multi-Token Prediction (MTP), tăng tốc độ xử lý.
  • Mô hình có thể chạy trực tiếp trên máy tính cá nhân cao cấp (ví dụ: Apple Mac Studio với chip M3 Ultra), không cần đến trung tâm dữ liệu.
  • DeepSeek-V3-0324 được xem là nền tảng cho DeepSeek-R2, một mô hình tập trung vào khả năng suy luận, dự kiến ra mắt trong vài tháng tới.
DeepSeek-V3-0324: Mô hình AI 'khủng' nhưng miễn phí

Điểm nổi bật nhất của DeepSeek-V3-0324 là việc mô hình này được phát hành dưới giấy phép MIT, cho phép sử dụng miễn phí cho mục đích thương mại. Đây là một động thái "gây sốc", đi ngược lại với mô hình kinh doanh của các "ông lớn" AI như OpenAI, vốn thường giữ kín các mô hình của mình và cung cấp quyền truy cập thông qua các API trả phí.

deepseek-v3nowrunsat20tokenspersecondonmacstudioandthatsanightmareforopenai-venturebeat-e_gifc...jpg

Công nghệ đột phá: Mixture-of-Experts (MoE), MLA và MTP

DeepSeek-V3-0324 không đi theo hướng phát triển các mô hình AI "khổng lồ" (với hàng nghìn tỷ tham số) như các công ty Mỹ. Thay vào đó, DeepSeek áp dụng kiến trúc "mixture-of-experts" (MoE) độc đáo, giúp tối ưu hóa hiệu suất và giảm chi phí.
  • Mixture-of-Experts (MoE): Thay vì kích hoạt toàn bộ tham số cho mọi tác vụ, MoE chỉ sử dụng một phần nhỏ (khoảng 37 tỷ trong tổng số 685 tỷ tham số) cho từng tác vụ cụ thể. Điều này giúp tăng hiệu suất và giảm yêu cầu tính toán.
  • Multi-Head Latent Attention (MLA): Nâng cao khả năng duy trì ngữ cảnh của mô hình trong các đoạn văn bản dài.
  • Multi-Token Prediction (MTP): Cho phép mô hình tạo ra nhiều token (đơn vị ngôn ngữ) mỗi bước, thay vì chỉ một token như các phương pháp truyền thống.
Nhờ những cải tiến này, DeepSeek-V3-0324 có thể đạt được hiệu suất tương đương với các mô hình lớn hơn nhiều, trong khi giảm đáng kể yêu cầu về phần cứng.

Chạy AI 'khủng' trên máy tính cá nhân

Một điểm đáng chú ý khác là DeepSeek-V3-0324 có thể chạy trực tiếp trên các máy tính cá nhân cao cấp, như Apple Mac Studio với chip M3 Ultra.
Nhà nghiên cứu AI Awni Hannun cho biết, DeepSeek-V3-0324 phiên bản 4-bit có thể chạy với tốc độ trên 20 token/giây trên Mac Studio M3 Ultra 512GB.

Mặc dù Mac Studio có giá không hề rẻ (9.499 USD), nhưng việc một mô hình AI lớn có thể chạy cục bộ trên máy tính cá nhân là một bước tiến quan trọng, cho thấy tiềm năng của việc "dân chủ hóa" AI.

deepseek-v3-1742867248666-17428672487542001425879_png_75(1).jpg

DeepSeek-R2: 'Ẩn số' tiếp theo

DeepSeek-V3-0324 được xem là nền tảng cho DeepSeek-R2, một mô hình tập trung vào khả năng suy luận (reasoning) được cải tiến, dự kiến ra mắt trong vài tháng tới. Nếu DeepSeek-R2 đi theo quỹ đạo của R1 (phiên bản trước), nó có thể sẽ thách thức trực tiếp GPT-5, mô hình hàng đầu tiếp theo của OpenAI.

Trung Quốc 'rút ngắn' khoảng cách với Mỹ trong cuộc đua AI

Sự xuất hiện của DeepSeek-V3-0324 cho thấy Trung Quốc đang nhanh chóng thu hẹp khoảng cách với Mỹ trong lĩnh vực AI. Chỉ vài tháng trước, các nhà phân tích ước tính Trung Quốc tụt hậu 1-2 năm so với Mỹ về khả năng AI. Nhưng giờ đây, khoảng cách đó đã được rút ngắn xuống còn 3-6 tháng, và một số lĩnh vực thậm chí còn ngang bằng hoặc vượt trội.

Mô hình nguồn mở: Thách thức sự độc quyền của các 'ông lớn'

Cách tiếp cận của DeepSeek, với việc cung cấp AI tiên tiến miễn phí theo giấy phép mở, đang thách thức mô hình kinh doanh độc quyền của các công ty như OpenAI. Nó cho thấy, các mô hình AI nguồn mở có thể cạnh tranh với các hệ thống đóng, nhờ vào sự phổ biến rộng rãi và sức mạnh đổi mới tập thể từ hàng nghìn nhà phát triển trên toàn cầu.

DeepSeek-V3-0324 là một bước tiến quan trọng trong lĩnh vực AI, cho thấy tiềm năng của các mô hình nguồn mở, hiệu quả về chi phí, và có thể chạy trên phần cứng tiêu dùng. Sự xuất hiện của DeepSeek đang làm thay đổi cục diện cuộc đua AI, và đặt ra những câu hỏi về tương lai của ngành công nghiệp này.

#DeepSeek
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng

Bị coi là quốc gia kém phát triển, Triều Tiên lấy đâu ra tiền phát triển vũ khí khiến phương Tây e ngại?

  • 238
  • 0
Bất chấp việc được biết đến là một trong những quốc gia nghèo nhất châu Á, Triều Tiên trong những năm gần đây lại liên tục khiến thế giới kinh...

Điểm danh 6 tính năng phổ biến nhất của máy lọc không khí hiện nay, ai chuẩn bị mua cần chú ý

  • 122
  • 0
1. Công nghệ lọc không khí HEPA – Chuẩn mực vàng trong lọc bụi mịn HEPA (High-Efficiency Particulate Air) là công nghệ lọc không khí tiên tiến, có...

Không khí tại các thành phố lớn ô nhiễm nặng nề, đây là loại thiết bị được quan tâm nhiều nhất lúc này

  • 146
  • 0
Hiện nay, máy lọc không khí đang được ngày càng nhiều gia đình sử dụng bởi tính năng lọc sạch không khí tuyệt vời, làm thoáng đãng không gian đặc...

Thương hiệu gia dụng nổi tiếng từ Cộng hoà Séc tạo làn sóng trên thị trường Việt Nam

  • 145
  • 0
Elmich là một thương hiệu gia dụng cao cấp đến từ Cộng hòa Séc, được thành lập vào năm 1995 tại thành phố Ostrava. Với gần 30 năm phát triển...

Siêu máy tính tương lai sẽ "ngốn điện" ngang với 1 thành phố

  • 144
  • 0
Theo báo cáo của Epoch AI (viện nghiên cứu tại San Francisco, công bố cuối tháng 4/2025), đến năm 2030, các siêu máy tính hàng đầu dùng để huấn...

LG đồng hành cùng Hòa Minzy, Obito và Hứa Kim Tuyền tung ra MV “Nếp Nhà”

  • 99
  • 0
LG Electronics Việt Nam vừa giới thiệu MV “Nếp Nhà” với sự kết hợp của ca sĩ Hòa Minzy, rapper Obito và nhạc sĩ Hứa Kim Tuyền. Đây là món quà âm...

Lần đầu tiên một đại gia Việt có tài sản hơn 9 tỉ USD, vượt cả chủ tịch Samsung

  • 206
  • 0
Cổ phiếu VIC của Tập đoàn Vingroup tiếp tục tăng mạnh trong phiên ngày 8-5, góp phần nâng quy mô tài sản ròng của ông Phạm Nhật Vượng vượt 9 tỉ...

Đây là cách "xem YouTube" nhanh nhất có thể bạn chưa thử

  • 248
  • 1
Mô hình Gemini 2.5 Flash có thể tóm tắt nội dung video dài trên YouTube, giúp người dùng tiết kiệm thời gian và nắm bắt thông tin nhanh chóng...

Sạc siêu nhanh xe điện: sự tiện lợi phải trả giá bằng tuổi thọ pin

  • 181
  • 0
Năm 2025 được ca ngợi là "năm bùng nổ sạc siêu nhanh" đối với xe điện. Mặc dù sự tiến bộ nhanh chóng của công nghệ sạc nhanh và sạc siêu nhanh đã...

Cách phục hồi ảnh cũ bằng AI miễn phí nhanh gọn, ai cũng làm được

  • 236
  • 0
Phục hồi ảnh cũ bằng AI miễn phí là giải pháp lý tưởng cho những ai muốn tái hiện lại hình ảnh xưa mà không cần biết quá nhiều về Photoshop hay kỹ...
Back
Top