Template errors

  • Template public:post_macros: [E_USER_WARNING] Accessed unknown getter 'fact' on XF:Thread[50315] (src/XF/Mvc/Entity/Entity.php:224)
  • Template public:thread_view: [E_USER_WARNING] Accessed unknown getter 'fact' on XF:Thread[50315] (src/XF/Mvc/Entity/Entity.php:224)

Xuất hiện mô hình AI từ Trung Quốc dám "thách thức" ChatGPT

Hoàng Anh
Hoàng Anh
Phản hồi: 0

Hoàng Anh

Writer
Hoàng Anh

Hoàng Anh Đã xác thực

Công ty Trung Quốc DeepSeek chuyên nghiên cứu trí tuệ nhân tạo AI vừa công bố phiên bản thử nghiệm của DeepSeek-R1, mô hình trí tuệ nhân tạo mới nhất của họ, được thiết kế để cạnh tranh trực tiếp với mô hình ChatGPT o1 của OpenAI.

wtf_is_ai_jpg_75.jpg

DeepSeek-R1: Bước tiến trong khả năng lý luận

DeepSeek-R1 được mô tả là một mô hình lý luận tiên tiến, nổi bật với khả năng "tự kiểm chứng" thông qua việc dành nhiều thời gian hơn để xử lý câu hỏi hoặc truy vấn. Điều này giúp mô hình tránh được các sai sót phổ biến mà nhiều hệ thống AI khác thường gặp phải.

Tương tự o1, DeepSeek-R1 sử dụng phương pháp lý luận để thực hiện các nhiệm vụ, lập kế hoạch trước và thực hiện các chuỗi hành động phức tạp nhằm đưa ra câu trả lời. Tùy thuộc vào độ phức tạp của câu hỏi, DeepSeek-R1 có thể mất đến vài chục giây để "suy nghĩ" trước khi đưa ra phản hồi.

deepseek-reasoning_jpg_75.jpg

Theo DeepSeek, phiên bản thử nghiệm DeepSeek-R1-Lite-Preview có hiệu suất ngang bằng với o1-preview của OpenAI trên hai bộ đánh giá AI phổ biến: AIME và MATH. AIME sử dụng các mô hình AI khác để đánh giá hiệu suất, trong khi MATH kiểm tra khả năng giải quyết các bài toán ngôn từ. Tuy nhiên, DeepSeek-R1 không phải là hoàn hảo. Một số người dùng trên mạng xã hội X chỉ ra rằng mô hình này gặp khó khăn với các trò chơi logic đơn giản như tic-tac-toe, điều mà o1 cũng mắc phải.

Những thách thức và hạn chế

Bên cạnh những điểm mạnh, DeepSeek-R1 dễ dàng bị "jailbreak," tức bị khai thác để bỏ qua các biện pháp bảo vệ. Một người dùng đã thành công trong việc khiến mô hình cung cấp công thức chi tiết để sản xuất ma túy methamphetamine.

Ngoài ra, DeepSeek-R1 từ chối trả lời các câu hỏi liên quan đến các vấn đề chính trị nhạy cảm. Khi được hỏi về Chủ tịch Trung Quốc Tập Cận Bình, sự kiện Thiên An Môn, hoặc kịch bản Trung Quốc xâm lược Đài Loan, mô hình đã từ chối phản hồi.

cfr0z3n_vector_art_line_art_flat_illustration_graphic_novel_spl_5e4ba6f6-8ff9-4899-a927-5e1aba...jpg

Hành vi này được cho là kết quả từ áp lực của chính phủ Trung Quốc đối với các dự án AI. Các mô hình tại đây phải trải qua quá trình đánh giá từ cơ quan quản lý Internet của Trung Quốc để đảm bảo nội dung phản hồi tuân thủ “các giá trị xã hội cốt lõi.” Chính phủ thậm chí được cho là đã đề xuất một danh sách đen các nguồn dữ liệu không được phép sử dụng để huấn luyện mô hình AI. Điều này dẫn đến việc nhiều hệ thống AI Trung Quốc tránh trả lời các chủ đề có thể gây phản ứng từ các cơ quan quản lý.

Thay đổi trong cách phát triển AI

Sự chú ý đến các mô hình lý luận như DeepSeek-R1 đang gia tăng trong bối cảnh "quy luật mở rộng quy mô" - lý thuyết cho rằng cung cấp nhiều dữ liệu và sức mạnh tính toán hơn sẽ làm tăng đáng kể khả năng của AI - đang bị đặt câu hỏi. Nhiều báo cáo gần đây cho thấy hiệu suất của các mô hình từ OpenAI, Google và Anthropic không còn cải thiện nhanh chóng như trước.

Xu hướng này thúc đẩy các phòng thí nghiệm AI lớn tìm kiếm những cách tiếp cận mới. Một trong số đó là “tính toán thời gian thực” (test-time compute), nền tảng của các mô hình như o1 và DeepSeek-R1. Phương pháp này cho phép mô hình dành thêm thời gian xử lý trong quá trình suy luận để hoàn thành nhiệm vụ.

CEO Microsoft Satya Nadella gần đây đã phát biểu tại hội nghị Ignite của công ty rằng, “Chúng ta đang chứng kiến sự xuất hiện của một quy luật mở rộng quy mô mới,” ám chỉ tầm quan trọng của test-time compute trong sự phát triển của AI.

Hậu thuẫn tài chính mạnh mẽ

DeepSeek dự kiến sẽ mở mã nguồn DeepSeek-R1 và cung cấp API trong tương lai gần. Công ty này nhận được sự hỗ trợ từ High-Flyer Capital Management, một quỹ đầu tư định lượng của Trung Quốc sử dụng AI để đưa ra các quyết định giao dịch.

DeepSeek trước đó đã gây áp lực lên các đối thủ lớn như ByteDance, Baidu và Alibaba khi ra mắt DeepSeek-V2, một mô hình phân tích văn bản và hình ảnh đa năng. Điều này buộc các công ty trên phải giảm giá hoặc thậm chí cung cấp miễn phí một số mô hình của họ.

High-Flyer tự xây dựng các cụm máy chủ để huấn luyện mô hình, cụm mới nhất sử dụng 10.000 GPU Nvidia A100 với chi phí lên tới 1 tỷ yên (~138 triệu USD). Doanh nghiệp này, do Liang Wenfeng - một cựu sinh viên khoa học máy tính - sáng lập, đặt mục tiêu đạt được AI “siêu thông minh” thông qua tổ chức DeepSeek.
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng

Điểm danh 6 tính năng phổ biến nhất của máy lọc không khí hiện nay, ai chuẩn bị mua cần chú ý

  • 121
  • 0
1. Công nghệ lọc không khí HEPA – Chuẩn mực vàng trong lọc bụi mịn HEPA (High-Efficiency Particulate Air) là công nghệ lọc không khí tiên tiến, có...

Không khí tại các thành phố lớn ô nhiễm nặng nề, đây là loại thiết bị được quan tâm nhiều nhất lúc này

  • 145
  • 0
Hiện nay, máy lọc không khí đang được ngày càng nhiều gia đình sử dụng bởi tính năng lọc sạch không khí tuyệt vời, làm thoáng đãng không gian đặc...

Thương hiệu gia dụng nổi tiếng từ Cộng hoà Séc tạo làn sóng trên thị trường Việt Nam

  • 144
  • 0
Elmich là một thương hiệu gia dụng cao cấp đến từ Cộng hòa Séc, được thành lập vào năm 1995 tại thành phố Ostrava. Với gần 30 năm phát triển...

Siêu máy tính tương lai sẽ "ngốn điện" ngang với 1 thành phố

  • 143
  • 0
Theo báo cáo của Epoch AI (viện nghiên cứu tại San Francisco, công bố cuối tháng 4/2025), đến năm 2030, các siêu máy tính hàng đầu dùng để huấn...

LG đồng hành cùng Hòa Minzy, Obito và Hứa Kim Tuyền tung ra MV “Nếp Nhà”

  • 99
  • 0
LG Electronics Việt Nam vừa giới thiệu MV “Nếp Nhà” với sự kết hợp của ca sĩ Hòa Minzy, rapper Obito và nhạc sĩ Hứa Kim Tuyền. Đây là món quà âm...

Lần đầu tiên một đại gia Việt có tài sản hơn 9 tỉ USD, vượt cả chủ tịch Samsung

  • 206
  • 0
Cổ phiếu VIC của Tập đoàn Vingroup tiếp tục tăng mạnh trong phiên ngày 8-5, góp phần nâng quy mô tài sản ròng của ông Phạm Nhật Vượng vượt 9 tỉ...

Đây là cách "xem YouTube" nhanh nhất có thể bạn chưa thử

  • 248
  • 1
Mô hình Gemini 2.5 Flash có thể tóm tắt nội dung video dài trên YouTube, giúp người dùng tiết kiệm thời gian và nắm bắt thông tin nhanh chóng...

Sạc siêu nhanh xe điện: sự tiện lợi phải trả giá bằng tuổi thọ pin

  • 181
  • 0
Năm 2025 được ca ngợi là "năm bùng nổ sạc siêu nhanh" đối với xe điện. Mặc dù sự tiến bộ nhanh chóng của công nghệ sạc nhanh và sạc siêu nhanh đã...

Cách phục hồi ảnh cũ bằng AI miễn phí nhanh gọn, ai cũng làm được

  • 236
  • 0
Phục hồi ảnh cũ bằng AI miễn phí là giải pháp lý tưởng cho những ai muốn tái hiện lại hình ảnh xưa mà không cần biết quá nhiều về Photoshop hay kỹ...

Samsung công bố hàng loạt TV Neo QLED 8K đến QLED 4K vừa đạt chuẩn chấm lượng tử đích thực từ tổ chức của Đức

  • 134
  • 0
Samsung vừa thông báo rằng dòng TV QLED mới nhất của hãng đã nhận được chứng nhận ‘Màn hình Chấm lượng tử Đích thực’ (Real Quantum Dot Display) từ...
Back
Top