Anthropic tung Claude 4: "Quái vật" AI mới vượt trội GPT-4.1 và Gemini 2.5 Pro về lập trình, tự xử lý tác vụ 7 tiếng liên tục

Hoàng Anh · 24/05/2025

Với hai phiên bản Claude Opus 4 và Claude Sonnet 4, Anthropic khẳng định vị thế trong cuộc đua AI, mang đến khả năng suy luận phức tạp, lập trình đỉnh cao và nhiều tính năng mới như "thinking summaries" và "extended thinking", hứa hẹn thay đổi cuộc chơi.

Anthropic "tăng tốc" trong cuộc đua AI với Claude 4 Series

Công ty nghiên cứu và phát triển Trí tuệ Nhân tạo (AI) Anthropic vừa chính thức trình làng hai mô hình AI mới nhất thuộc dòng Claude 4: Claude Opus 4 và Claude Sonnet 4. Sự ra mắt này đánh dấu một bước tiến quan trọng, khẳng định năng lực vượt trội của Claude trong các tác vụ đòi hỏi khả năng lập trình phức tạp và giải quyết vấn đề ở mức độ cao, đồng thời gửi một lời thách thức mạnh mẽ đến các đối thủ lớn như OpenAI, Google hay Meta.

Claude Opus 4: "Vua AI lập trình" mới, làm việc không mệt mỏi

Trong hai mô hình mới, Claude Opus 4 được Anthropic tự hào gọi là mô hình AI mạnh nhất mà họ từng phát triển. Điểm đặc biệt ấn tượng của Opus 4 là khả năng làm việc liên tục trong nhiều giờ. Theo các thử nghiệm với khách hàng doanh nghiệp, mô hình này có thể hoạt động một cách tự động suốt 7 tiếng đồng hồ liên tục, mở ra nhiều tiềm năng ứng dụng thực tiễn to lớn cho các "tác nhân AI" (AI agents) tự hành trong tương lai.

Không dừng lại ở đó, Anthropic còn tự tin khẳng định Claude Opus 4 là "mẫu AI lập trình tốt nhất thế giới" hiện nay. Trong các bài đánh giá nội bộ của công ty liên quan đến khả năng viết mã (coding) và sử dụng các công cụ tìm kiếm để hỗ trợ lập trình, Opus 4 đã vượt mặt các đối thủ sừng sỏ như Google Gemini 2.5 Pro, OpenAI GPT-4.1 và thậm chí cả mô hình suy luận o3 của OpenAI.

Claude Sonnet 4: Hiệu quả và chi phí tối ưu

Bên cạnh "quái vật" Opus 4, Anthropic cũng giới thiệu Claude Sonnet 4. Đây là phiên bản được tối ưu hóa cho hiệu quả và chi phí, thay thế cho phiên bản Sonnet 3.7 đã được phát hành vào tháng 2 năm nay. Anthropic cho biết Sonnet 4 cung cấp khả năng lập trình và suy luận vượt trội so với người tiền nhiệm, đồng thời đưa ra các câu trả lời chính xác hơn.

Cả hai mô hình mới này đều có một cải tiến quan trọng: khả năng sử dụng các giải pháp "lách luật" hoặc các phương pháp không chính thống để hoàn thành tác vụ đã giảm tới 65%. Điều này cho thấy sự cải thiện về tính đáng tin cậy và tuân thủ của các mô hình Claude. Ngoài ra, chúng cũng có khả năng lưu trữ thông tin dài hạn tốt hơn khi được cấp quyền truy cập vào các tệp tin cục bộ của người dùng.

Những tính năng mới hỗ trợ người dùng

Cùng với hai mô hình AI mới, Anthropic cũng giới thiệu hai tính năng mới nhằm nâng cao trải nghiệm người dùng:

"Thinking summaries" (Tóm tắt quá trình suy nghĩ): Tính năng này cho phép AI tóm tắt lại quá trình suy luận logic của nó để đi đến một câu trả lời hoặc giải pháp, giúp người dùng dễ hiểu hơn về "cách nghĩ" của AI.
"Extended thinking" (Tư duy mở rộng): Tính năng này cho phép người dùng linh hoạt chuyển đổi giữa các chế độ hoạt động của AI – tập trung vào khả năng suy luận thuần túy hoặc tăng cường sử dụng các công cụ bên ngoài (như tìm kiếm web) – nhằm cải thiện độ chính xác và tính toàn diện của kết quả đầu ra.

Khả năng tiếp cận và công cụ cho nhà phát triển

Claude Opus 4 và Claude Sonnet 4 hiện đã có mặt và sẵn sàng cho các nhà phát triển sử dụng thông qua nền tảng API của Anthropic, cũng như trên các nền tảng đám mây lớn như Amazon Bedrock và Google Cloud Vertex AI. Người dùng các gói trả phí sẽ được truy cập đầy đủ cả hai mô hình này cùng với tính năng "extended thinking" (hiện đang ở giai đoạn beta). Trong khi đó, người dùng miễn phí chỉ có thể sử dụng mô hình Claude Sonnet 4.
Ngoài ra, công cụ dòng lệnh Claude Code của Anthropic, được thiết kế chuyên biệt cho các tác vụ lập trình, cũng đã được phát hành rộng rãi sau một giai đoạn thử nghiệm giới hạn bắt đầu từ tháng 2.

Anthropic cho biết công ty sẽ đẩy nhanh tốc độ cập nhật và cải tiến các mô hình của mình để có thể cạnh tranh tốt hơn với các đối thủ hàng đầu trong ngành công nghiệp AI đang phát triển như vũ bão. Sự ra mắt của Claude 4 series là một minh chứng rõ ràng cho tham vọng và năng lực của Anthropic.

Anthropic tung Claude 4: "Quái vật" AI mới vượt trội GPT-4.1 và Gemini 2.5 Pro về lập trình, tự xử lý tác vụ 7 tiếng liên tục

Hoàng Anh

Topaz

1,3 tỷ mật khẩu bị rò rỉ, đẩy hàng triệu tài khoản trực tuyến vào nguy hiểm

LANDFALL: Biến ảnh gửi qua WhatsApp thành vũ khí tấn công người dùng Samsung

Liên minh 3 nhóm hacker khét tiếng thành thế lực đe dọa toàn cầu

Cảnh báo: Mã độc giả mạo Telegram X chiếm toàn bộ điện thoại và thiết bị của bạn

Hơn 48.000 thiết bị Cisco đối mặt làn sóng tấn công từ ba lỗ hổng nghiêm trọng

Cháy trung tâm dữ liệu, hơn 600 dịch vụ chính phủ Hàn Quốc tê liệt

Khi dữ liệu số bị lộ: Hacker có thể làm gì với các thông tin tài chính của bạn?

Apple vá lỗ hổng nghiêm trọng trong hệ thống xử lý hình ảnh: Người dùng cần cập nhật ngay

HP OmniBook X Flip 14: Laptop chuẩn Copilot+ PC với AI mạnh mẽ, thiết kế linh hoạt cho người dùng hiện đại

Những hiểu nhầm với quy định mới về xác nhận SIM chính chủ