Tại sao tôi lại mất niềm tin vào khả năng lập trình của GPT-5 sau khi kiểm tra lại?

Minh Nguyệt

Intern Writer
Bài viết thể hiện sự nghi ngờ về năng lực lập trình của GPT-5, cho rằng AI còn hay mắc lỗi, thiếu ổn định và có lúc hành xử kỳ quặc, khiến lập trình viên khó yên tâm để giao việc.

Người viết chia sẻ trải nghiệm cá nhân khi kiểm tra khả năng lập trình của GPT-5. Ban đầu, họ thử yêu cầu GPT-5 viết một plugin WordPress. Kết quả lần đầu khá suôn sẻ, nhưng các lần thử tiếp theo toàn gặp lỗi: màn hình trắng, lỗi code, hoặc plugin không hoạt động đúng. Điều này khiến họ nghi ngờ độ ổn định của AI.

Tiếp đó, họ thử một bài kiểm tra khác liên quan đến AppleScript và Chrome. GPT-5 lúc thì đưa thông tin sai (AppleScript có hàm đổi chữ hoa thường – thực tế không có), lúc thì tạo ra giải pháp phức tạp quá mức dù vẫn chạy được.

OpenAI có đưa ra "tờ hướng dẫn" về cách dùng GPT-5 trong lập trình với 6 khuyến nghị. Nhưng khi người viết áp dụng thì vẫn thấy code lỗi nặng, chưa đáng tin cậy.

Một điều kỳ lạ khác là khi GPT-5 tạo plugin, nó tự động gắn tên tác giả là “Advanced Geekery Labs” – vốn là thương hiệu của người viết (kênh YouTube và bản tin của họ), dù họ chưa hề đưa thông tin đó vào yêu cầu. Điều này càng làm họ thấy bất an về việc AI có thể “tự tiện” gán thông tin.

Cuối cùng, họ kết luận rằng không thoải mái khi dùng GPT-5 cho dự án lập trình, vì AI thiếu sự ổn định, dễ sinh lỗi và có hành vi khó giải thích. Họ cũng đặt câu hỏi liệu những phương pháp “tốt nhất” mà OpenAI đưa ra có thực sự giải quyết vấn đề gốc rễ, hay chỉ là giải pháp tạm thời.
Gần đây, mình đã có trải nghiệm khá căng thẳng trong việc kiểm tra khả năng lập trình của GPT-5. Đầu tiên, hãy cùng mình điểm qua một số khía cạnh thú vị về công việc này nhé. OpenAI đã công bố một danh sách các phương pháp tốt nhất để sử dụng GPT-5, và mình quyết định thử nghiệm chúng với các bài kiểm tra lập trình trước đó mà GPT-5 đã thất bại. Ban đầu, việc này có vẻ đơn giản, nhưng thực sự không dễ dàng như mình nghĩ.

Để bắt đầu, mình đã thử lại bài kiểm tra đầu tiên - yêu cầu GPT-5 tạo ra một plugin WordPress hoàn chỉnh với giao diện người dùng và một số logic kinh doanh. Ý tưởng là nhập một danh sách tên, sau đó ngẫu nhiên hóa chúng và tách biệt các tên trùng lặp. Khi thực hiện bài kiểm tra này lần đầu, GPT-5 đã không thành công; nút "Ngẫu nhiên hóa" đã đưa trình duyệt đến một trang không liên quan. Mặc dù mình đã có thể thuyết phục GPT-5 sửa lỗi, nhưng thất bại ban đầu vẫn để lại ấn tượng mạnh mẽ. Lần này, khi chạy lại bài kiểm tra với cùng một yêu cầu, mọi thứ diễn ra suôn sẻ, khiến mình khá bất ngờ. Tuy nhiên, sự vui mừng chưa kéo dài lâu.
gettyimages-1304649755.jpg

Khi mình thử kiểm tra lại lần nữa với cùng một yêu cầu, nút "Ngẫu nhiên hóa" đưa mình vào tình huống được gọi là "màn hình trắng chết chóc" của WordPress. Điều này cho thấy có điều gì đó không ổn trong mã nguồn. Mình đã thử nghiệm tổng cộng năm lần với cùng một yêu cầu, và chỉ có lần đầu tiên là thành công. Các lần sau, mình nhận được những màn hình trắng, các thông điệp lỗi đầy rẫy, hay thậm chí là bị chuyển hướng sang trang khác mà không có gì xảy ra.

Tiếp theo, mình quyết định thử nghiệm bài kiểm tra thứ tư, yêu cầu GPT-5 viết mã liên lạc với Chrome, AppleScript và một công cụ khác có tên là Keyboard Maestro. Mình nhận ra một điều thú vị về AppleScript là ngôn ngữ này không phân biệt chữ hoa chữ thường. Thực tế, nếu so sánh "AppleScript" và "applescript", nó sẽ coi chúng là giống nhau. Lần đầu tiên chạy bài kiểm tra này, GPT-5 đã "hô biến" rằng AppleScript có một hàm tích hợp để đổi chữ thành chữ thường, điều này là không đúng và mã đã thất bại. Nhưng trong lần thử lại này, GPT-5 lại quyết định làm theo một cách rất phức tạp để thực hiện điều đó. Mặc dù đoạn mã hoạt động, nhưng cách thực hiện lại quá kỳ quặc và không cần thiết chút nào.

OpenAI còn phát hành một "tờ hướng dẫn" cho lập trình với GPT-5, với sáu khuyến nghị chính. Tuy nhiên, khi mình thử nghiệm một trong những hướng dẫn đó, kết quả vẫn không khả quan. Mình đã chạy lại đoạn mã tối ưu hóa và nhận thấy có ít nhất ba lỗi nghiêm trọng trong đó. Điều này chỉ càng khiến mình cảm thấy mệt mỏi hơn với khả năng lập trình của GPT-5.

Sau đó, mình cũng thử nghiệm lại yêu cầu của plugin WordPress thông qua bộ tối ưu hóa. Lần này, plugin đã hoạt động và mình còn thử tạo mã thêm lần nữa, và nó lại thành công. Có vẻ như việc tối ưu hóa là một giải pháp khả thi nếu GPT-5 không hoạt động tốt. Thế nhưng, mọi thứ lại trở nên kỳ lạ một lần nữa khi đầu mục được tạo bởi GPT-5 đề tên tác giả là "Advanced Geekery Labs". Đây là tên kênh YouTube và bản tin hàng tuần của mình, nhưng mình chưa bao giờ đề cập đến điều này trong hướng dẫn cho plugin. Khi mình hỏi GPT-5 về nguồn gốc của cái tên đó, nó đã bảo rằng nó "vô tình mở rộng" từ thương hiệu "Advanced Geekery" mà mình đã đề cập trước đó.

Chân thành mà nói, mình vẫn cảm thấy không tin tưởng vào GPT-5. Những điều này khiến mình nghi ngờ về khả năng mà AI có thể can thiệp vào mã của mình mà không có nhận thức rõ ràng. Để kết thúc, mình không cảm thấy thoải mái với việc sử dụng GPT-5 cho các dự án lập trình của mình. Nó giống như một người anh em đang gặp khó khăn và đầy vấn đề. Nếu bạn đã từng thử sử dụng GPT-5 cho các dự án lập trình, mình rất muốn nghe ý kiến của bạn về những bất cập mà bạn gặp phải. Liệu những phương pháp "tốt nhất" của OpenAI có thực sự hữu ích hay chỉ là những giải pháp tạm thời cho những vấn đề sâu xa hơn? Hãy để lại ý kiến của bạn trong phần bình luận nhé!

Nguồn tham khảo: Zdnet
 
Sửa lần cuối bởi điều hành viên:

1,3 tỷ mật khẩu bị rò rỉ, đẩy hàng triệu tài khoản trực tuyến vào nguy hiểm

  • 10,786
  • 0
Một kho dữ liệu khổng lồ vừa bị tung lên web "đen", làm dấy lên cảnh báo về nguy cơ đột nhập tài khoản trên phạm vi toàn cầu. Quy mô rò rỉ lần này...

LANDFALL: Biến ảnh gửi qua WhatsApp thành vũ khí tấn công người dùng Samsung

  • 10,684
  • 0
Các chuyên gia an ninh mạng vừa phát hiện một loại phần mềm gián điệp cực kỳ tinh vi có tên LANDFALL, đang âm thầm tấn công người dùng điện thoại...

Liên minh 3 nhóm hacker khét tiếng thành thế lực đe dọa toàn cầu

  • 14,272
  • 0
Một “liên minh” mới của giới tội phạm mạng đang khiến các chuyên gia bảo mật lo ngại. Ba nhóm hacker khét tiếng: Scattered Spider, LAPSUS$ và...

Cảnh báo: Mã độc giả mạo Telegram X chiếm toàn bộ điện thoại và thiết bị của bạn

  • 11,744
  • 0
Các chuyên gia vừa cảnh báo về một chiến dịch mã độc trên Android, giả mạo ứng dụng Telegram X, có khả năng chiếm quyền kiểm soát gần như toàn bộ...

Hơn 48.000 thiết bị Cisco đối mặt làn sóng tấn công từ ba lỗ hổng nghiêm trọng

  • 10,821
  • 0
Cisco đang gặp cảnh báo an ninh mạng nghiêm trọng khi ba lỗ hổng mới được phát hiện trên các sản phẩm cốt lõi của hãng. Hai lỗ hổng ảnh hưởng đến...

Cháy trung tâm dữ liệu, hơn 600 dịch vụ chính phủ Hàn Quốc tê liệt

  • 12,486
  • 0
Một vụ cháy nghiêm trọng tại Trung tâm Dữ liệu Quốc gia ở thành phố Daejeon đã khiến hơn 600 hệ thống CNTT của chính phủ Hàn Quốc đồng loạt ngừng...

Khi dữ liệu số bị lộ: Hacker có thể làm gì với các thông tin tài chính của bạn?

  • 14,367
  • 1
Các vụ tấn công mạng gần đây cho thấy sự hoạt động của tin tặc đã và đang gia tăng trở lại, đe dọa đến an ninh dữ liệu của người dùng số. Đặt tình...

Apple vá lỗ hổng nghiêm trọng trong hệ thống xử lý hình ảnh: Người dùng cần cập nhật ngay

  • 15,535
  • 0
Apple vừa phát hành bản vá bảo mật để khắc phục lỗ hổng nguy hiểm CVE-2025-43300 trong hệ thống xử lý hình ảnh. Lỗ hổng này cho phép tin tặc chiếm...

HP OmniBook X Flip 14: Laptop chuẩn Copilot+ PC với AI mạnh mẽ, thiết kế linh hoạt cho người dùng hiện đại

  • 16,256
  • 0
Sự xuất hiện của dòng laptop chuẩn Copilot+ PC đang tạo nên làn sóng mới trong thị trường máy tính, nơi AI trở thành lõi công nghệ mang lại hiệu...

Những hiểu nhầm với quy định mới về xác nhận SIM chính chủ

  • 350
  • 0
Nhiều người hiểu chưa đúng về quy định mới liên quan đến xác thực thông tin thuê bao di động, có hiệu lực từ 15/4, khiến lo ngại bị khóa SIM...
Back