Tại sao một thiết kế mới có thể giúp doanh nghiệp cắt nửa chi phí AI mà vẫn giữ hiệu năng?

Trương Quang · 06/11/2025

Liệu có cách nào giúp doanh nghiệp tận dụng AI mạnh mẽ mà không “cháy túi” vì chi phí vận hành khổng lồ?

Giữ bình tĩnh, vì AI có thể sắp rẻ hơn rất nhiều

Trong khi nhiều lãnh đạo doanh nghiệp đang đau đầu vì chi phí khổng lồ khi triển khai các mô hình AI, một thiết kế kiến trúc mới vừa được Tencent AI và Đại học Thanh Hoa công bố đang mở ra một hướng đi đầy hứa hẹn.

Những mô hình AI tạo sinh hiện nay rất ấn tượng, nhưng để huấn luyện và vận hành chúng, lượng tài nguyên tính toán cần thiết là khổng lồ. Điều này khiến chi phí tăng vọt, kéo theo những lo ngại về năng lượng và môi trường. Nguyên nhân sâu xa nằm ở cách AI hiện tại tạo ra văn bản, khi nó phải xử lý từng từ, từng ký tự một cách tuần tự, gây ra điểm nghẽn hiệu suất.

Với các doanh nghiệp xử lý khối lượng dữ liệu lớn như tài chính, IoT hay thương mại điện tử, điều này khiến việc phân tích hay tạo báo cáo trở nên chậm chạp và tốn kém. Nhưng mô hình mới mang tên CALM Continuous Autoregressive Language Model có thể thay đổi toàn bộ cách AI hoạt động.

Khi AI không còn nghĩ từng từ

Thay vì dự đoán từng “token” (từ hoặc ký tự rời rạc), CALM chuyển sang dự đoán các vectơ liên tục, nghĩa là gộp nhiều từ lại thành một khối thông tin thống nhất. Ví dụ, thay vì xử lý “the”, “cat”, “sat” thành ba bước riêng, CALM nén chúng thành một đơn vị.

Kết quả thật ấn tượng: mô hình thử nghiệm của CALM chỉ cần ít hơn 44% FLOP cho quá trình huấn luyện và 34% cho suy luận so với một Transformer thông thường nhưng vẫn giữ hiệu năng tương đương. Với quy mô doanh nghiệp, điều này có thể tiết kiệm hàng trăm triệu đô la mỗi năm trong chi phí tính toán tương đương hơn 2.600 nghìn tỷ VNĐ trên phạm vi toàn cầu.

Tuy nhiên, việc chuyển sang không gian liên tục cũng khiến nhóm nghiên cứu phải xây dựng lại gần như toàn bộ bộ công cụ AI. CALM không thể dựa trên những cơ chế quen thuộc như softmax hay Perplexity vì nó không còn hoạt động theo xác suất truyền thống. Thay vào đó, họ giới thiệu một cơ chế mới mang tên Energy Transformer và thước đo BrierLM, giúp mô hình được “thưởng” khi dự đoán chính xác mà không cần tính xác suất.

Họ thậm chí còn phải tạo ra thuật toán lấy mẫu không xác suất, cho phép điều chỉnh độ chính xác và độ đa dạng đầu ra mà không phụ thuộc vào các phân phối thống kê phức tạp.

Tương lai của AI doanh nghiệp: hiệu quả hơn, bền vững hơn

CALM có thể là dấu hiệu đầu tiên cho thấy kỷ nguyên “to hơn là tốt hơn” của AI đang dần kết thúc. Thay vì chỉ mở rộng quy mô mô hình và tiêu tốn tài nguyên khổng lồ, hướng tiếp cận mới tập trung vào hiệu quả kiến trúc làm cho mỗi bước xử lý của AI mang nhiều ý nghĩa hơn.

Nếu được phát triển thương mại, những mô hình như CALM có thể giúp doanh nghiệp triển khai AI một cách kinh tế, bền vững và ít rủi ro hơn, từ trung tâm dữ liệu cho đến các ứng dụng biên. Việc giảm FLOP trên mỗi bước xử lý không chỉ cắt giảm chi phí mà còn là lợi thế cạnh tranh mới, khi tốc độ và chi phí trở thành yếu tố sống còn trong thời đại AI hóa.

Có lẽ đã đến lúc các doanh nghiệp không chỉ hỏi “AI của tôi mạnh đến đâu?” mà nên hỏi “AI của tôi hiệu quả đến mức nào?”.
Đọc chi tiết tại đây: https://www.artificialintelligence-...ew-model-design-fix-high-enterprise-ai-costs/

Tại sao một thiết kế mới có thể giúp doanh nghiệp cắt nửa chi phí AI mà vẫn giữ hiệu năng?

Trương Quang

Writer

Giữ bình tĩnh, vì AI có thể sắp rẻ hơn rất nhiều

Khi AI không còn nghĩ từng từ

Tương lai của AI doanh nghiệp: hiệu quả hơn, bền vững hơn

1,3 tỷ mật khẩu bị rò rỉ, đẩy hàng triệu tài khoản trực tuyến vào nguy hiểm

LANDFALL: Biến ảnh gửi qua WhatsApp thành vũ khí tấn công người dùng Samsung

Liên minh 3 nhóm hacker khét tiếng thành thế lực đe dọa toàn cầu

Cảnh báo: Mã độc giả mạo Telegram X chiếm toàn bộ điện thoại và thiết bị của bạn

Hơn 48.000 thiết bị Cisco đối mặt làn sóng tấn công từ ba lỗ hổng nghiêm trọng

Cháy trung tâm dữ liệu, hơn 600 dịch vụ chính phủ Hàn Quốc tê liệt

Khi dữ liệu số bị lộ: Hacker có thể làm gì với các thông tin tài chính của bạn?

Apple vá lỗ hổng nghiêm trọng trong hệ thống xử lý hình ảnh: Người dùng cần cập nhật ngay

HP OmniBook X Flip 14: Laptop chuẩn Copilot+ PC với AI mạnh mẽ, thiết kế linh hoạt cho người dùng hiện đại

Những hiểu nhầm với quy định mới về xác nhận SIM chính chủ

Tại sao một thiết kế mới có thể giúp doanh nghiệp cắt nửa chi phí AI mà vẫn giữ hiệu năng?

Writer

Giữ bình tĩnh, vì AI có thể sắp rẻ hơn rất nhiều​

Khi AI không còn nghĩ từng từ​

Tương lai của AI doanh nghiệp: hiệu quả hơn, bền vững hơn​

Giữ bình tĩnh, vì AI có thể sắp rẻ hơn rất nhiều

Khi AI không còn nghĩ từng từ

Tương lai của AI doanh nghiệp: hiệu quả hơn, bền vững hơn