Bước ngoặt 1 triệu token của Claude: Nước cờ khiến Google và OpenAI phải dè chừng

Anthropic đã chính thức tạo ra một cơn địa chấn trong giới công nghệ AI khi tuyên bố đưa cửa sổ ngữ cảnh lên tới 1 triệu token chuyển từ giai đoạn thử nghiệm (beta) sang phiên bản phát hành chính thức (GA) trên hai mô hình chủ lực là Claude Opus 4.6 và Claude Sonnet 4.6. Không dừng lại ở việc nâng cấp sức chứa dữ liệu khổng lồ, thay đổi mang tính bước ngoặt nhất khiến các đối thủ cạnh tranh phải thực sự đau đầu chính là quyết định xóa bỏ hoàn toàn khoản phụ phí đắt đỏ mà các lập trình viên từng phải gánh chịu khi yêu cầu hệ thống xử lý những đoạn câu lệnh (prompt) siêu dài.

1773456692290.png

Xóa bỏ rào cản chi phí và nâng cấp giới hạn tài liệu đa phương tiện​

Trong quá khứ, khi tính năng này còn ở giai đoạn thử nghiệm, bất kỳ yêu cầu truy vấn nào vượt quá ngưỡng 200.000 token đầu vào đều bị áp dụng mức giá phạt vô cùng khắc nghiệt. Cụ thể, người dùng từng phải trả mức phí gấp đôi cho mỗi token đầu vào và gấp rưỡi cho token đầu ra. Giờ đây, chính sách định giá đã được Anthropic đồng nhất hoàn toàn bất kể độ dài của văn bản. Mô hình Opus 4.6 duy trì mức giá cố định 5 USD cho mỗi triệu token đầu vào và 25 USD cho đầu ra. Trong khi đó, phiên bản Sonnet 4.6 sở hữu mức giá dễ tiếp cận hơn là 3 USD và 15 USD cho các mốc tương ứng. Điều này đồng nghĩa với việc xử lý một khối lượng dữ liệu khổng lồ lên tới 900.000 token giờ đây được tính giá trung bình trên mỗi token y hệt như một câu lệnh 9.000 token thông thường.

Song song với cuộc cách mạng về giá, nhà phát triển này còn mở rộng giới hạn xử lý dữ liệu đa phương tiện lên gấp 6 lần. Mỗi lượt gọi API hiện tại có thể đính kèm tối đa 600 hình ảnh hoặc trang tài liệu PDF, một bước nhảy vọt so với con số 100 trang của phiên bản trước. Nâng cấp này mang lại giá trị thực tiễn vô cùng to lớn cho các bộ phận pháp lý cần rà soát hàng trăm trang hợp đồng phức tạp, hoặc các chuyên gia nghiên cứu muốn phân tích chéo toàn bộ một kho tài liệu học thuật đồ sộ chỉ trong một lần thao tác duy nhất.

1773456708147.png

Tối ưu hóa kỹ thuật và giải quyết bài toán "quên" ngữ cảnh​

Dưới góc độ kỹ thuật, sự chuyển đổi này diễn ra hoàn toàn liền mạch đối với giới lập trình viên phần mềm. Người dùng không cần phải thay đổi bất kỳ dòng mã (code) nào hay thiết lập thêm các đoạn mã tiêu đề (beta header) phức tạp để kích hoạt cửa sổ ngữ cảnh lớn như trước đây. Hệ thống mới sẽ tự động nhận diện và xử lý mượt mà các yêu cầu vượt mốc 200.000 token. Thậm chí, nếu mã nguồn hiện tại của nhà phát triển vẫn gửi kèm các tiêu đề cũ, hệ thống sẽ tự động bỏ qua để tránh gây ra lỗi gián đoạn dịch vụ.

Đặc biệt, đối với công cụ lập trình dòng lệnh Claude Code, sức chứa 1 triệu token giờ đây đã trở thành tính năng mặc định cho các tài khoản thuộc gói Max, Team và Enterprise khi sử dụng mô hình Opus 4.6. Thay đổi này giải quyết triệt để vấn đề "nén dữ liệu" (compaction) từng gây nhiều phiền toái trong các phiên làm việc kéo dài. Trước đây, hệ thống thường xuyên phải tự động tóm tắt hoặc xóa bớt các đoạn hội thoại cũ để nhường chỗ cho dữ liệu mới, dẫn đến tình trạng AI bất ngờ "quên" mất các thông tin cấu hình quan trọng. Với không gian 1 triệu token, toàn bộ lịch sử lập trình và trao đổi đều được lưu giữ nguyên vẹn từ đầu đến cuối.

1773456732626.png

Định hình lại cục diện cạnh tranh trên thị trường AI thế hệ mới​

Để dập tắt những hoài nghi về việc mở rộng ngữ cảnh có thể làm phân tán sự tập trung và giảm độ sắc bén của AI, Anthropic đã công bố các kết quả kiểm tra hiệu năng đầy ấn tượng. Đáng chú ý nhất, mô hình Opus 4.6 đã xuất sắc đạt điểm số 78,3% trên bài kiểm tra MRCR v2 – một thước đo chuyên sâu về khả năng truy xuất và tìm kiếm thông tin ẩn giấu trong một lượng văn bản khổng lồ. Đây là thành tích cao nhất được ghi nhận trong số các mô hình AI tiên tiến hiện nay, minh chứng cho việc chất lượng phân tích không hề bị suy giảm khi khối lượng dữ liệu phình to. Phiên bản Sonnet 4.6 cũng duy trì được độ chính xác vô cùng ổn định xuyên suốt toàn bộ không gian 1 triệu token.

Khi đặt lên bàn cân cùng các đối thủ sừng sỏ, động thái táo bạo của Anthropic đã giúp Claude trở thành dòng mô hình duy nhất trên thị trường hỗ trợ 1 triệu token ở mức giá phẳng trên cả hai phiên bản mạnh nhất. Trong khi đó, mô hình Gemini 2.5 Pro của Google cũng sở hữu không gian 1 triệu token nhưng vẫn đang áp dụng chính sách thu thêm phụ phí khi người dùng vượt qua ranh giới 200.000 token. Ở một diễn biến khác, GPT-5.4 – mô hình tối tân nhất của OpenAI hiện nay – vẫn đang bị giới hạn phần cứng ở mức 256.000 token, còn phiên bản GPT-4.1 dù có 1 triệu token ở giá cố định nhưng lại không mang sức mạnh của một mẫu flagship. Sự kiện này đang tạo ra một sức ép cạnh tranh cực kỳ lớn, buộc các tập đoàn công nghệ hàng đầu phải nhanh chóng có lời giải cho bài toán chi phí và hiệu năng xử lý dữ liệu lớn.
 

Đính kèm

  • 1773456685446.png
    1773456685446.png
    14 KB · Lượt xem: 143

1,3 tỷ mật khẩu bị rò rỉ, đẩy hàng triệu tài khoản trực tuyến vào nguy hiểm

  • 10,786
  • 0
Một kho dữ liệu khổng lồ vừa bị tung lên web "đen", làm dấy lên cảnh báo về nguy cơ đột nhập tài khoản trên phạm vi toàn cầu. Quy mô rò rỉ lần này...

LANDFALL: Biến ảnh gửi qua WhatsApp thành vũ khí tấn công người dùng Samsung

  • 10,684
  • 0
Các chuyên gia an ninh mạng vừa phát hiện một loại phần mềm gián điệp cực kỳ tinh vi có tên LANDFALL, đang âm thầm tấn công người dùng điện thoại...

Liên minh 3 nhóm hacker khét tiếng thành thế lực đe dọa toàn cầu

  • 14,272
  • 0
Một “liên minh” mới của giới tội phạm mạng đang khiến các chuyên gia bảo mật lo ngại. Ba nhóm hacker khét tiếng: Scattered Spider, LAPSUS$ và...

Cảnh báo: Mã độc giả mạo Telegram X chiếm toàn bộ điện thoại và thiết bị của bạn

  • 11,744
  • 0
Các chuyên gia vừa cảnh báo về một chiến dịch mã độc trên Android, giả mạo ứng dụng Telegram X, có khả năng chiếm quyền kiểm soát gần như toàn bộ...

Hơn 48.000 thiết bị Cisco đối mặt làn sóng tấn công từ ba lỗ hổng nghiêm trọng

  • 10,821
  • 0
Cisco đang gặp cảnh báo an ninh mạng nghiêm trọng khi ba lỗ hổng mới được phát hiện trên các sản phẩm cốt lõi của hãng. Hai lỗ hổng ảnh hưởng đến...

Cháy trung tâm dữ liệu, hơn 600 dịch vụ chính phủ Hàn Quốc tê liệt

  • 12,486
  • 0
Một vụ cháy nghiêm trọng tại Trung tâm Dữ liệu Quốc gia ở thành phố Daejeon đã khiến hơn 600 hệ thống CNTT của chính phủ Hàn Quốc đồng loạt ngừng...

Khi dữ liệu số bị lộ: Hacker có thể làm gì với các thông tin tài chính của bạn?

  • 14,367
  • 1
Các vụ tấn công mạng gần đây cho thấy sự hoạt động của tin tặc đã và đang gia tăng trở lại, đe dọa đến an ninh dữ liệu của người dùng số. Đặt tình...

Apple vá lỗ hổng nghiêm trọng trong hệ thống xử lý hình ảnh: Người dùng cần cập nhật ngay

  • 15,534
  • 0
Apple vừa phát hành bản vá bảo mật để khắc phục lỗ hổng nguy hiểm CVE-2025-43300 trong hệ thống xử lý hình ảnh. Lỗ hổng này cho phép tin tặc chiếm...

HP OmniBook X Flip 14: Laptop chuẩn Copilot+ PC với AI mạnh mẽ, thiết kế linh hoạt cho người dùng hiện đại

  • 16,256
  • 0
Sự xuất hiện của dòng laptop chuẩn Copilot+ PC đang tạo nên làn sóng mới trong thị trường máy tính, nơi AI trở thành lõi công nghệ mang lại hiệu...

Những hiểu nhầm với quy định mới về xác nhận SIM chính chủ

  • 350
  • 0
Nhiều người hiểu chưa đúng về quy định mới liên quan đến xác thực thông tin thuê bao di động, có hiệu lực từ 15/4, khiến lo ngại bị khóa SIM...
Back