Tại sao một thiết kế mới có thể giúp doanh nghiệp cắt nửa chi phí AI mà vẫn giữ hiệu năng?

Liệu có cách nào giúp doanh nghiệp tận dụng AI mạnh mẽ mà không “cháy túi” vì chi phí vận hành khổng lồ?
1762401958075.png

Giữ bình tĩnh, vì AI có thể sắp rẻ hơn rất nhiều​

Trong khi nhiều lãnh đạo doanh nghiệp đang đau đầu vì chi phí khổng lồ khi triển khai các mô hình AI, một thiết kế kiến trúc mới vừa được Tencent AI và Đại học Thanh Hoa công bố đang mở ra một hướng đi đầy hứa hẹn.

Những mô hình AI tạo sinh hiện nay rất ấn tượng, nhưng để huấn luyện và vận hành chúng, lượng tài nguyên tính toán cần thiết là khổng lồ. Điều này khiến chi phí tăng vọt, kéo theo những lo ngại về năng lượng và môi trường. Nguyên nhân sâu xa nằm ở cách AI hiện tại tạo ra văn bản, khi nó phải xử lý từng từ, từng ký tự một cách tuần tự, gây ra điểm nghẽn hiệu suất.

Với các doanh nghiệp xử lý khối lượng dữ liệu lớn như tài chính, IoT hay thương mại điện tử, điều này khiến việc phân tích hay tạo báo cáo trở nên chậm chạp và tốn kém. Nhưng mô hình mới mang tên CALM Continuous Autoregressive Language Model có thể thay đổi toàn bộ cách AI hoạt động.

Khi AI không còn nghĩ từng từ​

Thay vì dự đoán từng “token” (từ hoặc ký tự rời rạc), CALM chuyển sang dự đoán các vectơ liên tục, nghĩa là gộp nhiều từ lại thành một khối thông tin thống nhất. Ví dụ, thay vì xử lý “the”, “cat”, “sat” thành ba bước riêng, CALM nén chúng thành một đơn vị.

Kết quả thật ấn tượng: mô hình thử nghiệm của CALM chỉ cần ít hơn 44% FLOP cho quá trình huấn luyện và 34% cho suy luận so với một Transformer thông thường nhưng vẫn giữ hiệu năng tương đương. Với quy mô doanh nghiệp, điều này có thể tiết kiệm hàng trăm triệu đô la mỗi năm trong chi phí tính toán tương đương hơn 2.600 nghìn tỷ VNĐ trên phạm vi toàn cầu.

Tuy nhiên, việc chuyển sang không gian liên tục cũng khiến nhóm nghiên cứu phải xây dựng lại gần như toàn bộ bộ công cụ AI. CALM không thể dựa trên những cơ chế quen thuộc như softmax hay Perplexity vì nó không còn hoạt động theo xác suất truyền thống. Thay vào đó, họ giới thiệu một cơ chế mới mang tên Energy Transformer và thước đo BrierLM, giúp mô hình được “thưởng” khi dự đoán chính xác mà không cần tính xác suất.

Họ thậm chí còn phải tạo ra thuật toán lấy mẫu không xác suất, cho phép điều chỉnh độ chính xác và độ đa dạng đầu ra mà không phụ thuộc vào các phân phối thống kê phức tạp.

Tương lai của AI doanh nghiệp: hiệu quả hơn, bền vững hơn​

CALM có thể là dấu hiệu đầu tiên cho thấy kỷ nguyên “to hơn là tốt hơn” của AI đang dần kết thúc. Thay vì chỉ mở rộng quy mô mô hình và tiêu tốn tài nguyên khổng lồ, hướng tiếp cận mới tập trung vào hiệu quả kiến trúc làm cho mỗi bước xử lý của AI mang nhiều ý nghĩa hơn.

Nếu được phát triển thương mại, những mô hình như CALM có thể giúp doanh nghiệp triển khai AI một cách kinh tế, bền vững và ít rủi ro hơn, từ trung tâm dữ liệu cho đến các ứng dụng biên. Việc giảm FLOP trên mỗi bước xử lý không chỉ cắt giảm chi phí mà còn là lợi thế cạnh tranh mới, khi tốc độ và chi phí trở thành yếu tố sống còn trong thời đại AI hóa.

Có lẽ đã đến lúc các doanh nghiệp không chỉ hỏi “AI của tôi mạnh đến đâu?” mà nên hỏi “AI của tôi hiệu quả đến mức nào?”.
Đọc chi tiết tại đây: https://www.artificialintelligence-...ew-model-design-fix-high-enterprise-ai-costs/
 

1,3 tỷ mật khẩu bị rò rỉ, đẩy hàng triệu tài khoản trực tuyến vào nguy hiểm

  • 10,786
  • 0
Một kho dữ liệu khổng lồ vừa bị tung lên web "đen", làm dấy lên cảnh báo về nguy cơ đột nhập tài khoản trên phạm vi toàn cầu. Quy mô rò rỉ lần này...

LANDFALL: Biến ảnh gửi qua WhatsApp thành vũ khí tấn công người dùng Samsung

  • 10,684
  • 0
Các chuyên gia an ninh mạng vừa phát hiện một loại phần mềm gián điệp cực kỳ tinh vi có tên LANDFALL, đang âm thầm tấn công người dùng điện thoại...

Liên minh 3 nhóm hacker khét tiếng thành thế lực đe dọa toàn cầu

  • 14,272
  • 0
Một “liên minh” mới của giới tội phạm mạng đang khiến các chuyên gia bảo mật lo ngại. Ba nhóm hacker khét tiếng: Scattered Spider, LAPSUS$ và...

Cảnh báo: Mã độc giả mạo Telegram X chiếm toàn bộ điện thoại và thiết bị của bạn

  • 11,744
  • 0
Các chuyên gia vừa cảnh báo về một chiến dịch mã độc trên Android, giả mạo ứng dụng Telegram X, có khả năng chiếm quyền kiểm soát gần như toàn bộ...

Hơn 48.000 thiết bị Cisco đối mặt làn sóng tấn công từ ba lỗ hổng nghiêm trọng

  • 10,821
  • 0
Cisco đang gặp cảnh báo an ninh mạng nghiêm trọng khi ba lỗ hổng mới được phát hiện trên các sản phẩm cốt lõi của hãng. Hai lỗ hổng ảnh hưởng đến...

Cháy trung tâm dữ liệu, hơn 600 dịch vụ chính phủ Hàn Quốc tê liệt

  • 12,486
  • 0
Một vụ cháy nghiêm trọng tại Trung tâm Dữ liệu Quốc gia ở thành phố Daejeon đã khiến hơn 600 hệ thống CNTT của chính phủ Hàn Quốc đồng loạt ngừng...

Khi dữ liệu số bị lộ: Hacker có thể làm gì với các thông tin tài chính của bạn?

  • 14,367
  • 1
Các vụ tấn công mạng gần đây cho thấy sự hoạt động của tin tặc đã và đang gia tăng trở lại, đe dọa đến an ninh dữ liệu của người dùng số. Đặt tình...

Apple vá lỗ hổng nghiêm trọng trong hệ thống xử lý hình ảnh: Người dùng cần cập nhật ngay

  • 15,534
  • 0
Apple vừa phát hành bản vá bảo mật để khắc phục lỗ hổng nguy hiểm CVE-2025-43300 trong hệ thống xử lý hình ảnh. Lỗ hổng này cho phép tin tặc chiếm...

HP OmniBook X Flip 14: Laptop chuẩn Copilot+ PC với AI mạnh mẽ, thiết kế linh hoạt cho người dùng hiện đại

  • 16,256
  • 0
Sự xuất hiện của dòng laptop chuẩn Copilot+ PC đang tạo nên làn sóng mới trong thị trường máy tính, nơi AI trở thành lõi công nghệ mang lại hiệu...

Những hiểu nhầm với quy định mới về xác nhận SIM chính chủ

  • 350
  • 0
Nhiều người hiểu chưa đúng về quy định mới liên quan đến xác thực thông tin thuê bao di động, có hiệu lực từ 15/4, khiến lo ngại bị khóa SIM...
Back