Một rào cản lớn ngăn cản việc ứng dụng rộng rãi các Mô hình ngôn ngữ lớn (LLM) mạnh mẽ như Llama 3 hay Qwen 2.5 trên các thiết bị cá nhân chính là kích thước khổng lồ và yêu cầu phần cứng "khủng" (GPU đắt tiền, nhiều bộ nhớ RAM) của chúng. Tuy nhiên, một nhóm nghiên cứu quốc tế bao gồm các nhà...