Cuộc đua AI có hướng rẽ mới: Các mô hình siêu nhanh, nhẹ, chạy trực tiếp trên smartphone hay máy tính

Trà Xanh
Trà Xanh
Phản hồi: 0

Trà Xanh

Writer
Cuộc đua phát triển mô hình ngôn ngữ lớn đa chế độ với hàng trăm, hàng nghìn tỷ tham số vẫn đang diễn ra sôi nổi, với những cái tên đình đám như Google, Microsoft, OpenAI, Meta và thậm chí cả Apple. GPT-5 của OpenAI, dự kiến ra mắt cuối năm nay hoặc đầu năm sau, là một ví dụ điển hình.

Tuy nhiên, bên cạnh cuộc đua "khủng long", các ông lớn công nghệ cũng đang nhắm đến một thị trường mới đầy tiềm năng: mô hình AI "cỡ nhỏ", với số lượng tham số chỉ vài tỷ. Những mô hình này đủ nhỏ gọn để chạy mượt mà trên NPU, chip xử lý của máy tính cá nhân và điện thoại thông minh.

1716195629528.png


Apple đã giới thiệu OpenELM với 270 triệu đến 3 tỷ tham số, trong khi Microsoft ra mắt Phi-3 Mini, dao động từ 3,8 đến 14 tỷ tham số. Meta cũng không kém cạnh với Llama-3 phiên bản 8 tỷ tham số, trong khi startup Pháp Mistral gây chú ý với Mixtral 8x7B. OpenAI vừa công bố GPT-4o với chi phí vận hành thấp hơn đáng kể trên đám mây. Google cũng đang phát triển Gemini Nano và Gemma thế hệ 2, tiếp nối thành công của Gemma 7 tỷ tham số, đủ nhỏ để chạy cục bộ trên thiết bị.

Mặc dù mô hình lớn với số lượng tham số khổng lồ mang đến khả năng tạo sinh nội dung vượt trội, xử lý được các yêu cầu phức tạp, nhưng chúng lại đòi hỏi trung tâm dữ liệu khổng lồ với chi phí vận hành khổng lồ, lên đến hàng chục tỷ USD. Việc thuyết phục doanh nghiệp lựa chọn mô hình AI "khủng long" với chi phí dựa trên hàng triệu token là một thách thức không nhỏ. Chưa kể đến những lo ngại về bảo mật thông tin và quyền riêng tư khi dữ liệu được tải lên đám mây.

Mô hình AI kích thước nhỏ, với khả năng vận hành cục bộ trên thiết bị đầu cuối, giải quyết được bài toán chi phí và bảo mật. Eric Boyd, phó chủ tịch phụ trách nền tảng Azure AI của Microsoft, nhận định: "Mô hình AI chất lượng cao, chi phí thấp mở ra cơ hội phát triển nhiều ứng dụng mới, trước đây bị hạn chế bởi bài toán kinh tế". Nick Clegg, chủ tịch phụ trách quan hệ toàn cầu của Meta, tự tin khẳng định Llama 8 tỷ tham số có sức mạnh tương đương GPT-4, trong khi Microsoft cho biết Phi-3 Small, mô hình 7 tỷ tham số của họ, vượt trội hơn cả GPT-3.5.

1716195636276.png

Cuộc đua giảm chi phí vận hành của các mô hình AI

Ưu điểm lớn nhất của mô hình "cỡ nhỏ" là dữ liệu người dùng được xử lý trực tiếp trên thiết bị, không cần truyền tải đi nơi khác. Charlotte Marshall, luật sư tại Addleshaw Goddard, cho biết đây là yếu tố quan trọng giúp doanh nghiệp, đặc biệt là các ngân hàng, tuân thủ quy định nghiêm ngặt về quản lý dữ liệu khách hàng.

Sam Altman, CEO OpenAI, khẳng định OpenAI cung cấp đa dạng mô hình AI với kích thước khác nhau để đáp ứng nhu cầu đa dạng của khách hàng. Mặc dù OpenAI vẫn tập trung vào mô hình lớn với khả năng mở rộng và tư duy vượt trội, Altman cũng bày tỏ sự hứng thú với tiềm năng của mô hình "cỡ nhỏ".
#trítuệnhântạo #chatGPT
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng

Bị coi là quốc gia kém phát triển, Triều Tiên lấy đâu ra tiền phát triển vũ khí khiến phương Tây e ngại?

  • 238
  • 0
Bất chấp việc được biết đến là một trong những quốc gia nghèo nhất châu Á, Triều Tiên trong những năm gần đây lại liên tục khiến thế giới kinh...

Điểm danh 6 tính năng phổ biến nhất của máy lọc không khí hiện nay, ai chuẩn bị mua cần chú ý

  • 122
  • 0
1. Công nghệ lọc không khí HEPA – Chuẩn mực vàng trong lọc bụi mịn HEPA (High-Efficiency Particulate Air) là công nghệ lọc không khí tiên tiến, có...

Không khí tại các thành phố lớn ô nhiễm nặng nề, đây là loại thiết bị được quan tâm nhiều nhất lúc này

  • 146
  • 0
Hiện nay, máy lọc không khí đang được ngày càng nhiều gia đình sử dụng bởi tính năng lọc sạch không khí tuyệt vời, làm thoáng đãng không gian đặc...

Thương hiệu gia dụng nổi tiếng từ Cộng hoà Séc tạo làn sóng trên thị trường Việt Nam

  • 145
  • 0
Elmich là một thương hiệu gia dụng cao cấp đến từ Cộng hòa Séc, được thành lập vào năm 1995 tại thành phố Ostrava. Với gần 30 năm phát triển...

Siêu máy tính tương lai sẽ "ngốn điện" ngang với 1 thành phố

  • 144
  • 0
Theo báo cáo của Epoch AI (viện nghiên cứu tại San Francisco, công bố cuối tháng 4/2025), đến năm 2030, các siêu máy tính hàng đầu dùng để huấn...

LG đồng hành cùng Hòa Minzy, Obito và Hứa Kim Tuyền tung ra MV “Nếp Nhà”

  • 99
  • 0
LG Electronics Việt Nam vừa giới thiệu MV “Nếp Nhà” với sự kết hợp của ca sĩ Hòa Minzy, rapper Obito và nhạc sĩ Hứa Kim Tuyền. Đây là món quà âm...

Lần đầu tiên một đại gia Việt có tài sản hơn 9 tỉ USD, vượt cả chủ tịch Samsung

  • 206
  • 0
Cổ phiếu VIC của Tập đoàn Vingroup tiếp tục tăng mạnh trong phiên ngày 8-5, góp phần nâng quy mô tài sản ròng của ông Phạm Nhật Vượng vượt 9 tỉ...

Đây là cách "xem YouTube" nhanh nhất có thể bạn chưa thử

  • 248
  • 1
Mô hình Gemini 2.5 Flash có thể tóm tắt nội dung video dài trên YouTube, giúp người dùng tiết kiệm thời gian và nắm bắt thông tin nhanh chóng...

Sạc siêu nhanh xe điện: sự tiện lợi phải trả giá bằng tuổi thọ pin

  • 181
  • 0
Năm 2025 được ca ngợi là "năm bùng nổ sạc siêu nhanh" đối với xe điện. Mặc dù sự tiến bộ nhanh chóng của công nghệ sạc nhanh và sạc siêu nhanh đã...

Cách phục hồi ảnh cũ bằng AI miễn phí nhanh gọn, ai cũng làm được

  • 236
  • 0
Phục hồi ảnh cũ bằng AI miễn phí là giải pháp lý tưởng cho những ai muốn tái hiện lại hình ảnh xưa mà không cần biết quá nhiều về Photoshop hay kỹ...
Back
Top