OpenAI ra mắt GPT-4o: Chatbot "toàn năng" xử lý được cả giọng nói và hình ảnh, người dùng miễn phí cũng được sử dụng

Mẫn Nhi
Mẫn Nhi
Phản hồi: 0

Mẫn Nhi

Admin xinh gái
Mẫn Nhi

Mẫn Nhi Đã xác thực

Hôm thứ Hai, OpenAI công bố mô hình ngôn ngữ lớn trí tuệ nhân tạo mới nhất của mình, được cho là sẽ làm cho ChatGPT thông minh hơn và dễ sử dụng hơn.

Mô hình mới, được gọi là GPT-4o, là bản cập nhật từ mô hình GPT-4 trước đó của công ty, ra mắt chỉ hơn một năm trước. Mô hình này sẽ có sẵn cho khách hàng không trả phí, nghĩa là bất kỳ ai cũng có thể truy cập công nghệ tiên tiến nhất của OpenAI thông qua ChatGPT.

Dựa trên buổi trình diễn hôm thứ Hai của công ty, GPT-4o sẽ biến ChatGPT thành một trợ lý cá nhân kỹ thuật số có thể tham gia vào các cuộc trò chuyện bằng lời nói theo thời gian thực. Nó cũng sẽ có thể tương tác bằng văn bản và "hình ảnh", nghĩa là nó có thể xem ảnh chụp màn hình, ảnh, tài liệu hoặc biểu đồ do người dùng tải lên và trò chuyện về chúng.

1715650696599.png


Giám đốc Công nghệ của OpenAI, Mira Murati, cho biết phiên bản cập nhật của ChatGPT giờ đây cũng sẽ có khả năng ghi nhớ, nghĩa là nó có thể học hỏi từ các cuộc trò chuyện trước đó với người dùng và có thể dịch thuật theo thời gian thực.

"Đây là lần đầu tiên chúng tôi thực sự tiến một bước lớn về tính dễ sử dụng," Murati cho biết trong buổi giới thiệu trực tiếp từ trụ sở của công ty ở San Francisco. "Sự tương tác này trở nên tự nhiên hơn và dễ dàng hơn rất nhiều."

Phiên bản mới ra mắt khi OpenAI tìm cách giữ vị trí dẫn đầu trong cuộc cạnh tranh ngày càng tăng trong cuộc đua vũ trang AI. Các đối thủ bao gồm Google và Meta đã và đang nỗ lực xây dựng các mô hình ngôn ngữ lớn ngày càng mạnh mẽ, cung cấp năng lượng cho chatbot và có thể được sử dụng để đưa công nghệ AI vào nhiều sản phẩm khác.

Sự kiện của OpenAI diễn ra một ngày trước hội nghị nhà phát triển I/O thường niên của Google, tại đó dự kiến sẽ công bố các bản cập nhật cho mô hình AI Gemini của mình. Giống như GPT-4o mới, Gemini của Google cũng đa phương thức, nghĩa là nó có thể diễn giải và tạo văn bản, hình ảnh và âm thanh. Bản cập nhật của OpenAI cũng diễn ra trước các thông báo về AI dự kiến từ Apple tại Hội nghị các nhà phát triển toàn cầu vào tháng tới, có thể bao gồm các cách thức mới để tích hợp AI vào iPhone hoặc iOS tiếp theo.

Trong khi đó, bản phát hành GPT mới nhất có thể là một lợi ích cho Microsoft, công ty đã đầu tư hàng tỷ đô la vào OpenAI để nhúng công nghệ AI của mình vào các sản phẩm của chính Microsoft.

Các giám đốc điều hành của OpenAI đã trình diễn một cuộc trò chuyện bằng lời nói với ChatGPT để nhận hướng dẫn theo thời gian thực về cách giải một bài toán, kể chuyện trước khi đi ngủ và nhận lời khuyên về mã hóa. ChatGPT có thể nói bằng giọng tự nhiên, giống người cũng như giọng robot - và thậm chí còn hát một phần câu trả lời. Công cụ này cũng có thể xem hình ảnh của biểu đồ và thảo luận về nó.

Họ cũng cho thấy mô hình phát hiện cảm xúc của người dùng; trong một trường hợp, nó lắng nghe hơi thở của một giám đốc điều hành và khuyến khích anh ta bình tĩnh lại.

"Anh không phải là máy hút bụi!" giọng nữ của ChatGPT (nghe rất giống giọng của Scarlett Johansson trong bộ phim "Her" năm 2013) nói đùa với nhân viên.

1715650717751.png


ChatGPT cũng có thể trò chuyện bằng nhiều ngôn ngữ bằng cách dịch và trả lời tự động. Theo OpenAI, công cụ này hiện hỗ trợ hơn 50 ngôn ngữ.

"Chế độ thoại (và video) mới là giao diện máy tính tốt nhất mà tôi từng sử dụng," Giám đốc điều hành OpenAI, Sam Altman, cho biết trong một bài đăng trên blog sau thông báo. "Nó giống như AI từ trong phim vậy; và tôi vẫn hơi ngạc nhiên khi nó có thật. Việc đạt được thời gian phản hồi và khả năng biểu đạt ở cấp độ con người hóa ra lại là một thay đổi lớn."

Murati cho biết OpenAI sẽ ra mắt ứng dụng ChatGPT trên máy tính để bàn với các tính năng của GPT-4o, mang đến cho người dùng một nền tảng khác để tương tác với công nghệ của công ty. GPT-4o cũng sẽ có sẵn cho các nhà phát triển muốn xây dựng chatbot tùy chỉnh của riêng họ từ cửa hàng GPT của OpenAI, một tính năng hiện cũng sẽ có sẵn cho người dùng không trả phí.

Công nghệ và tính năng được cập nhật sẽ được triển khai cho ChatGPT trong những tháng tới. Người dùng ChatGPT miễn phí sẽ có số lượng tương tác hạn chế với mô hình GPT-4o mới trước khi công cụ tự động hoàn nguyên về dựa vào mô hình GPT-3.5 cũ; người dùng trả phí sẽ có quyền truy cập vào số lượng tin nhắn lớn hơn với mô hình mới nhất.

OpenAI cho biết hơn 100 triệu người đã đang sử dụng ChatGPT. Tuy nhiên, trải nghiệm ChatGPT được cập nhật - và khả năng tương tác với nó trên máy tính để bàn và thông qua các cuộc trò chuyện bằng giọng nói được cải thiện - có thể mang đến cho nhiều người hơn lý do để sử dụng công nghệ của nó. Động thái này diễn ra vào thời điểm tích hợp AI vào các sản phẩm tiêu dùng được sử dụng rộng rãi hơn của Google và Meta, như Instagram và Google Assistant, có thể khiến công nghệ của các công ty này trở nên dễ tiếp cận và sử dụng rộng rãi hơn.
#chatGPT #OpenAI #GPT4o #Trítuệnhântạo #GPT4otoàntri
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng

Thương hiệu gia dụng nổi tiếng từ Cộng hoà Séc tạo làn sóng trên thị trường Việt Nam

  • 144
  • 0
Elmich là một thương hiệu gia dụng cao cấp đến từ Cộng hòa Séc, được thành lập vào năm 1995 tại thành phố Ostrava. Với gần 30 năm phát triển...

Siêu máy tính tương lai sẽ "ngốn điện" ngang với 1 thành phố

  • 143
  • 0
Theo báo cáo của Epoch AI (viện nghiên cứu tại San Francisco, công bố cuối tháng 4/2025), đến năm 2030, các siêu máy tính hàng đầu dùng để huấn...

LG đồng hành cùng Hòa Minzy, Obito và Hứa Kim Tuyền tung ra MV “Nếp Nhà”

  • 99
  • 0
LG Electronics Việt Nam vừa giới thiệu MV “Nếp Nhà” với sự kết hợp của ca sĩ Hòa Minzy, rapper Obito và nhạc sĩ Hứa Kim Tuyền. Đây là món quà âm...

Lần đầu tiên một đại gia Việt có tài sản hơn 9 tỉ USD, vượt cả chủ tịch Samsung

  • 206
  • 0
Cổ phiếu VIC của Tập đoàn Vingroup tiếp tục tăng mạnh trong phiên ngày 8-5, góp phần nâng quy mô tài sản ròng của ông Phạm Nhật Vượng vượt 9 tỉ...

Đây là cách "xem YouTube" nhanh nhất có thể bạn chưa thử

  • 248
  • 1
Mô hình Gemini 2.5 Flash có thể tóm tắt nội dung video dài trên YouTube, giúp người dùng tiết kiệm thời gian và nắm bắt thông tin nhanh chóng...

Sạc siêu nhanh xe điện: sự tiện lợi phải trả giá bằng tuổi thọ pin

  • 181
  • 0
Năm 2025 được ca ngợi là "năm bùng nổ sạc siêu nhanh" đối với xe điện. Mặc dù sự tiến bộ nhanh chóng của công nghệ sạc nhanh và sạc siêu nhanh đã...

Cách phục hồi ảnh cũ bằng AI miễn phí nhanh gọn, ai cũng làm được

  • 236
  • 0
Phục hồi ảnh cũ bằng AI miễn phí là giải pháp lý tưởng cho những ai muốn tái hiện lại hình ảnh xưa mà không cần biết quá nhiều về Photoshop hay kỹ...

Samsung công bố hàng loạt TV Neo QLED 8K đến QLED 4K vừa đạt chuẩn chấm lượng tử đích thực từ tổ chức của Đức

  • 134
  • 0
Samsung vừa thông báo rằng dòng TV QLED mới nhất của hãng đã nhận được chứng nhận ‘Màn hình Chấm lượng tử Đích thực’ (Real Quantum Dot Display) từ...

Sếp Apple dự đoán "ngày tàn" của iPhone chỉ trong 10 năm tới: Lý do từ kẻ mà "ai cũng biết là ai"

  • 1,237
  • 0
Phó chủ tịch cấp cao phụ trách mảng dịch vụ của Apple, ông Eddy Cue, vừa đưa ra một nhận định gây sửng sốt về tương lai của chính sản phẩm chủ lực...

"Cú lừa" của Apple và Samsung về dung lượng lưu trữ điện thoại

  • 287
  • 0
Chi phí tăng đáng kể khi nâng cấp bộ nhớ được cho là chiến lược tối đa hóa lợi nhuận của các hãng smartphone, đặc biệt ở phân khúc cao cấp...
Back
Top