Xuất hiện mô hình AI từ Trung Quốc dám "thách thức" ChatGPT

Hoàng Anh · 21/11/2024

Công ty Trung Quốc DeepSeek chuyên nghiên cứu trí tuệ nhân tạo AI vừa công bố phiên bản thử nghiệm của DeepSeek-R1, mô hình trí tuệ nhân tạo mới nhất của họ, được thiết kế để cạnh tranh trực tiếp với mô hình ChatGPT o1 của OpenAI.

DeepSeek-R1: Bước tiến trong khả năng lý luận

DeepSeek-R1 được mô tả là một mô hình lý luận tiên tiến, nổi bật với khả năng "tự kiểm chứng" thông qua việc dành nhiều thời gian hơn để xử lý câu hỏi hoặc truy vấn. Điều này giúp mô hình tránh được các sai sót phổ biến mà nhiều hệ thống AI khác thường gặp phải.

Tương tự o1, DeepSeek-R1 sử dụng phương pháp lý luận để thực hiện các nhiệm vụ, lập kế hoạch trước và thực hiện các chuỗi hành động phức tạp nhằm đưa ra câu trả lời. Tùy thuộc vào độ phức tạp của câu hỏi, DeepSeek-R1 có thể mất đến vài chục giây để "suy nghĩ" trước khi đưa ra phản hồi.

Theo DeepSeek, phiên bản thử nghiệm DeepSeek-R1-Lite-Preview có hiệu suất ngang bằng với o1-preview của OpenAI trên hai bộ đánh giá AI phổ biến: AIME và MATH. AIME sử dụng các mô hình AI khác để đánh giá hiệu suất, trong khi MATH kiểm tra khả năng giải quyết các bài toán ngôn từ. Tuy nhiên, DeepSeek-R1 không phải là hoàn hảo. Một số người dùng trên mạng xã hội X chỉ ra rằng mô hình này gặp khó khăn với các trò chơi logic đơn giản như tic-tac-toe, điều mà o1 cũng mắc phải.

Những thách thức và hạn chế

Bên cạnh những điểm mạnh, DeepSeek-R1 dễ dàng bị "jailbreak," tức bị khai thác để bỏ qua các biện pháp bảo vệ. Một người dùng đã thành công trong việc khiến mô hình cung cấp công thức chi tiết để sản xuất ma túy methamphetamine.

Ngoài ra, DeepSeek-R1 từ chối trả lời các câu hỏi liên quan đến các vấn đề chính trị nhạy cảm. Khi được hỏi về Chủ tịch Trung Quốc Tập Cận Bình, sự kiện Thiên An Môn, hoặc kịch bản Trung Quốc xâm lược Đài Loan, mô hình đã từ chối phản hồi.

cfr0z3n_vector_art_line_art_flat_illustration_graphic_novel_spl_5e4ba6f6-8ff9-4899-a927-5e1aba...jpg

Hành vi này được cho là kết quả từ áp lực của chính phủ Trung Quốc đối với các dự án AI. Các mô hình tại đây phải trải qua quá trình đánh giá từ cơ quan quản lý Internet của Trung Quốc để đảm bảo nội dung phản hồi tuân thủ “các giá trị xã hội cốt lõi.” Chính phủ thậm chí được cho là đã đề xuất một danh sách đen các nguồn dữ liệu không được phép sử dụng để huấn luyện mô hình AI. Điều này dẫn đến việc nhiều hệ thống AI Trung Quốc tránh trả lời các chủ đề có thể gây phản ứng từ các cơ quan quản lý.

Thay đổi trong cách phát triển AI

Sự chú ý đến các mô hình lý luận như DeepSeek-R1 đang gia tăng trong bối cảnh "quy luật mở rộng quy mô" - lý thuyết cho rằng cung cấp nhiều dữ liệu và sức mạnh tính toán hơn sẽ làm tăng đáng kể khả năng của AI - đang bị đặt câu hỏi. Nhiều báo cáo gần đây cho thấy hiệu suất của các mô hình từ OpenAI, Google và Anthropic không còn cải thiện nhanh chóng như trước.

Xu hướng này thúc đẩy các phòng thí nghiệm AI lớn tìm kiếm những cách tiếp cận mới. Một trong số đó là “tính toán thời gian thực” (test-time compute), nền tảng của các mô hình như o1 và DeepSeek-R1. Phương pháp này cho phép mô hình dành thêm thời gian xử lý trong quá trình suy luận để hoàn thành nhiệm vụ.

CEO Microsoft Satya Nadella gần đây đã phát biểu tại hội nghị Ignite của công ty rằng, “Chúng ta đang chứng kiến sự xuất hiện của một quy luật mở rộng quy mô mới,” ám chỉ tầm quan trọng của test-time compute trong sự phát triển của AI.

Hậu thuẫn tài chính mạnh mẽ

DeepSeek dự kiến sẽ mở mã nguồn DeepSeek-R1 và cung cấp API trong tương lai gần. Công ty này nhận được sự hỗ trợ từ High-Flyer Capital Management, một quỹ đầu tư định lượng của Trung Quốc sử dụng AI để đưa ra các quyết định giao dịch.

DeepSeek trước đó đã gây áp lực lên các đối thủ lớn như ByteDance, Baidu và Alibaba khi ra mắt DeepSeek-V2, một mô hình phân tích văn bản và hình ảnh đa năng. Điều này buộc các công ty trên phải giảm giá hoặc thậm chí cung cấp miễn phí một số mô hình của họ.

High-Flyer tự xây dựng các cụm máy chủ để huấn luyện mô hình, cụm mới nhất sử dụng 10.000 GPU Nvidia A100 với chi phí lên tới 1 tỷ yên (~138 triệu USD). Doanh nghiệp này, do Liang Wenfeng - một cựu sinh viên khoa học máy tính - sáng lập, đặt mục tiêu đạt được AI “siêu thông minh” thông qua tổ chức DeepSeek.

Template errors

Có thể bạn quan tâm

Xuất hiện mô hình AI từ Trung Quốc dám "thách thức" ChatGPT

Hoàng Anh

Writer

Hoàng Anh

DeepSeek-R1: Bước tiến trong khả năng lý luận

Những thách thức và hạn chế

Thay đổi trong cách phát triển AI

Hậu thuẫn tài chính mạnh mẽ

Siêu máy tính tương lai sẽ "ngốn điện" ngang với 1 thành phố

Hàng trăm CEO cùng ký thư ngỏ đề nghị dạy khoa học máy tính và AI từ lớp mẫu giáo

Netflix đang biến Tivi thành TikTok kết hợp AI – đây là cách họ làm điều đó !

AI có thể bấm chuột như người thật? Hugging Face vừa ra mắt công cụ miễn phí làm được điều đó!

Agentic RAG là gì mà Google phải viết hẳn 76 trang sách trắng để giải thích?

Người mẫu thật sắp thất nghiệp vì AI? Zalando tiết lộ cách AI giúp tiết kiệm 90% chi phí quảng cáo

Điểm danh 6 tính năng phổ biến nhất của máy lọc không khí hiện nay, ai chuẩn bị mua cần chú ý

Không khí tại các thành phố lớn ô nhiễm nặng nề, đây là loại thiết bị được quan tâm nhiều nhất lúc này

Thương hiệu gia dụng nổi tiếng từ Cộng hoà Séc tạo làn sóng trên thị trường Việt Nam

Siêu máy tính tương lai sẽ "ngốn điện" ngang với 1 thành phố

LG đồng hành cùng Hòa Minzy, Obito và Hứa Kim Tuyền tung ra MV “Nếp Nhà”

Lần đầu tiên một đại gia Việt có tài sản hơn 9 tỉ USD, vượt cả chủ tịch Samsung

Đây là cách "xem YouTube" nhanh nhất có thể bạn chưa thử

Sạc siêu nhanh xe điện: sự tiện lợi phải trả giá bằng tuổi thọ pin

Cách phục hồi ảnh cũ bằng AI miễn phí nhanh gọn, ai cũng làm được

Samsung công bố hàng loạt TV Neo QLED 8K đến QLED 4K vừa đạt chuẩn chấm lượng tử đích thực từ tổ chức của Đức

Đánh giá nổi bật

Template errors

Có thể bạn quan tâm

Xuất hiện mô hình AI từ Trung Quốc dám "thách thức" ChatGPT

Writer

DeepSeek-R1: Bước tiến trong khả năng lý luận​

Những thách thức và hạn chế​

Thay đổi trong cách phát triển AI​

Hậu thuẫn tài chính mạnh mẽ​

Siêu máy tính tương lai sẽ "ngốn điện" ngang với 1 thành phố

Hàng trăm CEO cùng ký thư ngỏ đề nghị dạy khoa học máy tính và AI từ lớp mẫu giáo

Netflix đang biến Tivi thành TikTok kết hợp AI – đây là cách họ làm điều đó !

AI có thể bấm chuột như người thật? Hugging Face vừa ra mắt công cụ miễn phí làm được điều đó!

Agentic RAG là gì mà Google phải viết hẳn 76 trang sách trắng để giải thích?

Người mẫu thật sắp thất nghiệp vì AI? Zalando tiết lộ cách AI giúp tiết kiệm 90% chi phí quảng cáo

DeepSeek-R1: Bước tiến trong khả năng lý luận

Những thách thức và hạn chế

Thay đổi trong cách phát triển AI

Hậu thuẫn tài chính mạnh mẽ