Anthropic tung Claude 4: "Quái vật" AI mới vượt trội GPT-4.1 và Gemini 2.5 Pro về lập trình, tự xử lý tác vụ 7 tiếng liên tục

Với hai phiên bản Claude Opus 4 và Claude Sonnet 4, Anthropic khẳng định vị thế trong cuộc đua AI, mang đến khả năng suy luận phức tạp, lập trình đỉnh cao và nhiều tính năng mới như "thinking summaries" và "extended thinking", hứa hẹn thay đổi cuộc chơi.

image_75(1).jpg

Anthropic "tăng tốc" trong cuộc đua AI với Claude 4 Series

Công ty nghiên cứu và phát triển Trí tuệ Nhân tạo (AI) Anthropic vừa chính thức trình làng hai mô hình AI mới nhất thuộc dòng Claude 4: Claude Opus 4 và Claude Sonnet 4. Sự ra mắt này đánh dấu một bước tiến quan trọng, khẳng định năng lực vượt trội của Claude trong các tác vụ đòi hỏi khả năng lập trình phức tạp và giải quyết vấn đề ở mức độ cao, đồng thời gửi một lời thách thức mạnh mẽ đến các đối thủ lớn như OpenAI, Google hay Meta.


Claude Opus 4: "Vua AI lập trình" mới, làm việc không mệt mỏi

Trong hai mô hình mới, Claude Opus 4 được Anthropic tự hào gọi là mô hình AI mạnh nhất mà họ từng phát triển. Điểm đặc biệt ấn tượng của Opus 4 là khả năng làm việc liên tục trong nhiều giờ. Theo các thử nghiệm với khách hàng doanh nghiệp, mô hình này có thể hoạt động một cách tự động suốt 7 tiếng đồng hồ liên tục, mở ra nhiều tiềm năng ứng dụng thực tiễn to lớn cho các "tác nhân AI" (AI agents) tự hành trong tương lai.

image_75(2).jpg

Không dừng lại ở đó, Anthropic còn tự tin khẳng định Claude Opus 4 là "mẫu AI lập trình tốt nhất thế giới" hiện nay. Trong các bài đánh giá nội bộ của công ty liên quan đến khả năng viết mã (coding) và sử dụng các công cụ tìm kiếm để hỗ trợ lập trình, Opus 4 đã vượt mặt các đối thủ sừng sỏ như Google Gemini 2.5 Pro, OpenAI GPT-4.1 và thậm chí cả mô hình suy luận o3 của OpenAI.

Claude Sonnet 4: Hiệu quả và chi phí tối ưu

Bên cạnh "quái vật" Opus 4, Anthropic cũng giới thiệu Claude Sonnet 4. Đây là phiên bản được tối ưu hóa cho hiệu quả và chi phí, thay thế cho phiên bản Sonnet 3.7 đã được phát hành vào tháng 2 năm nay. Anthropic cho biết Sonnet 4 cung cấp khả năng lập trình và suy luận vượt trội so với người tiền nhiệm, đồng thời đưa ra các câu trả lời chính xác hơn.

image_75(3).jpg

Cả hai mô hình mới này đều có một cải tiến quan trọng: khả năng sử dụng các giải pháp "lách luật" hoặc các phương pháp không chính thống để hoàn thành tác vụ đã giảm tới 65%. Điều này cho thấy sự cải thiện về tính đáng tin cậy và tuân thủ của các mô hình Claude. Ngoài ra, chúng cũng có khả năng lưu trữ thông tin dài hạn tốt hơn khi được cấp quyền truy cập vào các tệp tin cục bộ của người dùng.

Những tính năng mới hỗ trợ người dùng

Cùng với hai mô hình AI mới, Anthropic cũng giới thiệu hai tính năng mới nhằm nâng cao trải nghiệm người dùng:
  1. "Thinking summaries" (Tóm tắt quá trình suy nghĩ): Tính năng này cho phép AI tóm tắt lại quá trình suy luận logic của nó để đi đến một câu trả lời hoặc giải pháp, giúp người dùng dễ hiểu hơn về "cách nghĩ" của AI.
  2. "Extended thinking" (Tư duy mở rộng): Tính năng này cho phép người dùng linh hoạt chuyển đổi giữa các chế độ hoạt động của AI – tập trung vào khả năng suy luận thuần túy hoặc tăng cường sử dụng các công cụ bên ngoài (như tìm kiếm web) – nhằm cải thiện độ chính xác và tính toàn diện của kết quả đầu ra.

Khả năng tiếp cận và công cụ cho nhà phát triển

Claude Opus 4 và Claude Sonnet 4 hiện đã có mặt và sẵn sàng cho các nhà phát triển sử dụng thông qua nền tảng API của Anthropic, cũng như trên các nền tảng đám mây lớn như Amazon Bedrock và Google Cloud Vertex AI. Người dùng các gói trả phí sẽ được truy cập đầy đủ cả hai mô hình này cùng với tính năng "extended thinking" (hiện đang ở giai đoạn beta). Trong khi đó, người dùng miễn phí chỉ có thể sử dụng mô hình Claude Sonnet 4.
Ngoài ra, công cụ dòng lệnh Claude Code của Anthropic, được thiết kế chuyên biệt cho các tác vụ lập trình, cũng đã được phát hành rộng rãi sau một giai đoạn thử nghiệm giới hạn bắt đầu từ tháng 2.

Anthropic cho biết công ty sẽ đẩy nhanh tốc độ cập nhật và cải tiến các mô hình của mình để có thể cạnh tranh tốt hơn với các đối thủ hàng đầu trong ngành công nghiệp AI đang phát triển như vũ bão. Sự ra mắt của Claude 4 series là một minh chứng rõ ràng cho tham vọng và năng lực của Anthropic.
 

1,3 tỷ mật khẩu bị rò rỉ, đẩy hàng triệu tài khoản trực tuyến vào nguy hiểm

  • 10,786
  • 0
Một kho dữ liệu khổng lồ vừa bị tung lên web "đen", làm dấy lên cảnh báo về nguy cơ đột nhập tài khoản trên phạm vi toàn cầu. Quy mô rò rỉ lần này...

LANDFALL: Biến ảnh gửi qua WhatsApp thành vũ khí tấn công người dùng Samsung

  • 10,684
  • 0
Các chuyên gia an ninh mạng vừa phát hiện một loại phần mềm gián điệp cực kỳ tinh vi có tên LANDFALL, đang âm thầm tấn công người dùng điện thoại...

Liên minh 3 nhóm hacker khét tiếng thành thế lực đe dọa toàn cầu

  • 14,272
  • 0
Một “liên minh” mới của giới tội phạm mạng đang khiến các chuyên gia bảo mật lo ngại. Ba nhóm hacker khét tiếng: Scattered Spider, LAPSUS$ và...

Cảnh báo: Mã độc giả mạo Telegram X chiếm toàn bộ điện thoại và thiết bị của bạn

  • 11,744
  • 0
Các chuyên gia vừa cảnh báo về một chiến dịch mã độc trên Android, giả mạo ứng dụng Telegram X, có khả năng chiếm quyền kiểm soát gần như toàn bộ...

Hơn 48.000 thiết bị Cisco đối mặt làn sóng tấn công từ ba lỗ hổng nghiêm trọng

  • 10,821
  • 0
Cisco đang gặp cảnh báo an ninh mạng nghiêm trọng khi ba lỗ hổng mới được phát hiện trên các sản phẩm cốt lõi của hãng. Hai lỗ hổng ảnh hưởng đến...

Cháy trung tâm dữ liệu, hơn 600 dịch vụ chính phủ Hàn Quốc tê liệt

  • 12,486
  • 0
Một vụ cháy nghiêm trọng tại Trung tâm Dữ liệu Quốc gia ở thành phố Daejeon đã khiến hơn 600 hệ thống CNTT của chính phủ Hàn Quốc đồng loạt ngừng...

Khi dữ liệu số bị lộ: Hacker có thể làm gì với các thông tin tài chính của bạn?

  • 14,367
  • 1
Các vụ tấn công mạng gần đây cho thấy sự hoạt động của tin tặc đã và đang gia tăng trở lại, đe dọa đến an ninh dữ liệu của người dùng số. Đặt tình...

Apple vá lỗ hổng nghiêm trọng trong hệ thống xử lý hình ảnh: Người dùng cần cập nhật ngay

  • 15,535
  • 0
Apple vừa phát hành bản vá bảo mật để khắc phục lỗ hổng nguy hiểm CVE-2025-43300 trong hệ thống xử lý hình ảnh. Lỗ hổng này cho phép tin tặc chiếm...

HP OmniBook X Flip 14: Laptop chuẩn Copilot+ PC với AI mạnh mẽ, thiết kế linh hoạt cho người dùng hiện đại

  • 16,256
  • 0
Sự xuất hiện của dòng laptop chuẩn Copilot+ PC đang tạo nên làn sóng mới trong thị trường máy tính, nơi AI trở thành lõi công nghệ mang lại hiệu...

Những hiểu nhầm với quy định mới về xác nhận SIM chính chủ

  • 350
  • 0
Nhiều người hiểu chưa đúng về quy định mới liên quan đến xác thực thông tin thuê bao di động, có hiệu lực từ 15/4, khiến lo ngại bị khóa SIM...
Back