Độ chính xác của Gemini đã tăng vọt từ 21% lên 97%, Google chỉ sử dụng một thủ thuật duy nhất

Linh Pham

Intern Writer
Một kỹ thuật gợi ý đơn giản đã giúp một mô hình ngôn ngữ lớn tăng độ chính xác từ 21,33% lên 97,33%, mà không cần phải phát triển thêm khả năng suy luận. Phát hiện này đến từ nhóm nghiên cứu của Google, khi họ sử dụng phương pháp lặp lại các câu hỏi đầu vào, sao chép và dán chúng nhiều lần, thay vì sử dụng các chiến thuật phức tạp như "Chuỗi suy nghĩ" hay "Học đa mẫu".

1768743981178.png


Trong nghiên cứu có tiêu đề "Việc lặp lại lời nhắc giúp cải thiện các LLM không dựa trên lý luận", nhóm nghiên cứu chỉ ra rằng việc lặp lại câu hỏi đầu vào giúp tăng hiệu suất của các mô hình ngôn ngữ phổ biến như Gemini, GPT-4o, và Claude mà không cần sử dụng những chiến lược tâm lý phức tạp. Khi lặp lại câu hỏi, các mô hình không chỉ cung cấp câu trả lời chính xác hơn mà còn cải thiện độ chính xác trong các tác vụ liên quan đến truy xuất thông tin từ văn bản dài.

1768743995003.png


Kỹ thuật lặp lại từ khóa có vẻ rất đơn giản và dễ dàng thực hiện, nhưng kết quả lại rất ấn tượng. Nguyên nhân của sự thay đổi đột ngột này có thể được giải thích bằng một khiếm khuyết trong kiến trúc Transformer. Cụ thể, khi mô hình đọc văn bản từ trái sang phải, nó không thể "nhìn lại" thông tin đã đọc trước đó. Điều này dẫn đến sự thiếu hụt nhận thức, khiến mô hình không thể áp dụng ngữ cảnh một cách chính xác. Khi lặp lại câu hỏi, mô hình có cơ hội "nhìn lại" và kết hợp tất cả các thông tin trước đó, dẫn đến sự cải thiện rõ rệt trong hiệu suất.

Đặc biệt, kỹ thuật này không làm tăng thời gian phản hồi của mô hình. Điều này là nhờ vào khả năng xử lý song song của các GPU hiện đại trong giai đoạn "Điền trước", khi mô hình tiếp nhận và xử lý dữ liệu đầu vào. Việc sao chép dữ liệu đầu vào và lặp lại chúng chỉ thêm một chút thời gian vào quá trình xử lý, nhưng không làm giảm hiệu suất hay độ chính xác. Nhờ đó, các mô hình nhỏ và nhanh hơn có thể đạt được độ chính xác ngang bằng hoặc thậm chí vượt trội so với các mô hình lớn hơn mà không cần phải nâng cấp phần cứng hay tăng chi phí.

1768744014745.png


Mặc dù kỹ thuật lặp lại từ khóa mang lại hiệu quả đáng kể trong các nhiệm vụ không liên quan đến suy luận, nhưng nó không phải là một giải pháp hoàn hảo cho tất cả các tình huống. Khi mô hình cần phải thực hiện suy luận phức tạp, ví dụ như trong các bài toán đòi hỏi logic hay lý luận bước, phương pháp lặp lại không mang lại sự cải thiện tương tự. Hơn nữa, khi kết hợp với các chiến thuật khác như "chuỗi suy nghĩ", phương pháp lặp lại có thể không hiệu quả, và đôi khi còn gây ra sự gián đoạn trong quá trình suy luận của mô hình.

1768744064183.png

1768744036505.png


Nghiên cứu này chỉ ra rằng việc lặp lại câu hỏi không những làm tăng độ chính xác mà còn không làm tăng chi phí hay thời gian phản hồi của hệ thống. Điều này mang lại một lợi thế lớn cho các nhà phát triển AI, vì họ không cần phải đầu tư vào các mô hình siêu lớn, đắt đỏ và chậm chạp để cải thiện hiệu suất. Thay vào đó, họ có thể sử dụng chiến lược "bộ lặp" đơn giản để cải thiện hiệu quả của các mô hình hiện tại.

Mặc dù phương pháp lặp lại từ khóa đã chứng tỏ hiệu quả trong việc cải thiện độ chính xác của các mô hình LLM trong các tác vụ truy xuất thông tin, nhưng nghiên cứu cũng chỉ ra rằng các mô hình hiện tại vẫn còn những điểm mù và hạn chế. Điều này mở ra một hướng đi mới cho các nghiên cứu tiếp theo, với mục tiêu xây dựng những mô hình ngôn ngữ cải tiến, không chỉ khắc phục các điểm mù nhân quả mà còn tối ưu hóa khả năng suy luận và tư duy của mô hình.

Nhờ vào sự phát hiện này, việc tối ưu hóa các mô hình ngôn ngữ có thể trở nên đơn giản hơn và tiết kiệm chi phí hơn. Phương pháp lặp lại từ khóa giúp các mô hình đạt được hiệu suất cao mà không cần phải phát triển thêm các khả năng suy luận phức tạp. Mặc dù có giới hạn trong một số tác vụ, đây vẫn là một bước tiến quan trọng trong việc phát triển công nghệ AI và mở ra cơ hội mới cho các ứng dụng thực tế.
 
Sửa lần cuối bởi điều hành viên:

1,3 tỷ mật khẩu bị rò rỉ, đẩy hàng triệu tài khoản trực tuyến vào nguy hiểm

  • 10,786
  • 0
Một kho dữ liệu khổng lồ vừa bị tung lên web "đen", làm dấy lên cảnh báo về nguy cơ đột nhập tài khoản trên phạm vi toàn cầu. Quy mô rò rỉ lần này...

LANDFALL: Biến ảnh gửi qua WhatsApp thành vũ khí tấn công người dùng Samsung

  • 10,684
  • 0
Các chuyên gia an ninh mạng vừa phát hiện một loại phần mềm gián điệp cực kỳ tinh vi có tên LANDFALL, đang âm thầm tấn công người dùng điện thoại...

Liên minh 3 nhóm hacker khét tiếng thành thế lực đe dọa toàn cầu

  • 14,272
  • 0
Một “liên minh” mới của giới tội phạm mạng đang khiến các chuyên gia bảo mật lo ngại. Ba nhóm hacker khét tiếng: Scattered Spider, LAPSUS$ và...

Cảnh báo: Mã độc giả mạo Telegram X chiếm toàn bộ điện thoại và thiết bị của bạn

  • 11,744
  • 0
Các chuyên gia vừa cảnh báo về một chiến dịch mã độc trên Android, giả mạo ứng dụng Telegram X, có khả năng chiếm quyền kiểm soát gần như toàn bộ...

Hơn 48.000 thiết bị Cisco đối mặt làn sóng tấn công từ ba lỗ hổng nghiêm trọng

  • 10,821
  • 0
Cisco đang gặp cảnh báo an ninh mạng nghiêm trọng khi ba lỗ hổng mới được phát hiện trên các sản phẩm cốt lõi của hãng. Hai lỗ hổng ảnh hưởng đến...

Cháy trung tâm dữ liệu, hơn 600 dịch vụ chính phủ Hàn Quốc tê liệt

  • 12,486
  • 0
Một vụ cháy nghiêm trọng tại Trung tâm Dữ liệu Quốc gia ở thành phố Daejeon đã khiến hơn 600 hệ thống CNTT của chính phủ Hàn Quốc đồng loạt ngừng...

Khi dữ liệu số bị lộ: Hacker có thể làm gì với các thông tin tài chính của bạn?

  • 14,367
  • 1
Các vụ tấn công mạng gần đây cho thấy sự hoạt động của tin tặc đã và đang gia tăng trở lại, đe dọa đến an ninh dữ liệu của người dùng số. Đặt tình...

Apple vá lỗ hổng nghiêm trọng trong hệ thống xử lý hình ảnh: Người dùng cần cập nhật ngay

  • 15,534
  • 0
Apple vừa phát hành bản vá bảo mật để khắc phục lỗ hổng nguy hiểm CVE-2025-43300 trong hệ thống xử lý hình ảnh. Lỗ hổng này cho phép tin tặc chiếm...

HP OmniBook X Flip 14: Laptop chuẩn Copilot+ PC với AI mạnh mẽ, thiết kế linh hoạt cho người dùng hiện đại

  • 16,256
  • 0
Sự xuất hiện của dòng laptop chuẩn Copilot+ PC đang tạo nên làn sóng mới trong thị trường máy tính, nơi AI trở thành lõi công nghệ mang lại hiệu...

Những hiểu nhầm với quy định mới về xác nhận SIM chính chủ

  • 350
  • 0
Nhiều người hiểu chưa đúng về quy định mới liên quan đến xác thực thông tin thuê bao di động, có hiệu lực từ 15/4, khiến lo ngại bị khóa SIM...
Back