Agora và OpenAI ra mắt giải pháp Realtime API, mở ra kỷ nguyên tương tác mượt mà với AI đa phương thức

Với những cải tiến đột phá tích hợp vào Realtime API, bộ máy AI hội thoại của Agora đưa trải nghiệm giao tiếp và tương tác với AI tiến gần hơn tới sự tự nhiên như con người.

1757601518830.png

Agora, nền tảng nổi tiếng về AI hội thoại và công nghệ tương tác thời gian thực, chính thức công bố mở rộng hỗ trợ cho OpenAI Realtime API. Trong bối cảnh nền kinh tế số Việt Nam đang tăng trưởng mạnh, đóng góp 18,3% GDP quốc gia trong năm 2024 và dự báo cán mốc 20,5% (khoảng 52 tỷ USD) vào cuối 2025, đưa Việt Nam trở thành thị trường tiềm năng cho các công nghệ AI hội thoại tiên tiến.

Tích hợp mới của Agora với Realtime API hỗ trợ các tính năng như chào hỏi tự động, tương tác đa phương thức, tập trung chú ý có chọn lọc cùng các công cụ nâng cao khác – tất cả nhằm tạo nên trải nghiệm giao tiếp liền mạch và tự nhiên giữa người và AI.

Đây là bước tiến quan trọng trong hợp tác giữa Agora và OpenAI, khi Realtime API là mô hình ngôn ngữ đa phương thức quy mô lớn (MLLM) đầu tiên được tích hợp trực tiếp trên nền tảng Agora. Giải pháp kết hợp này giúp các nhà phát triển tạo ra AI agent tự nhiên, phản hồi nhanh nhạy và mang tính con người hơn, đồng thời giảm bớt độ phức tạp trong phát triển và khai mở nhiều khả năng tiên tiến trong tương tác thời gian thực.

“Tương tác đa phương thức theo thời gian thực chính là mảnh ghép còn thiếu để AI trở nên thật sự giống con người,” ông Tony Zhao, CEO Agora nhấn mạnh. “Việc tích hợp Realtime API là bước đột phá, mang đến cho nhà phát triển sức mạnh để tạo ra những trải nghiệm AI vượt xa mọi quy chuẩn trước đây.”

Với Conversational AI Engine, Agora tiếp tục nâng cấp trải nghiệm hội thoại AI với các tính năng đưa giao tiếp gần gũi và tự nhiên hơn:
  • Chào hỏi tự động: Khởi tạo cuộc trò chuyện một cách tự nhiên, thân thiện ngay từ ban đầu.
  • Tương tác đa phương thức: Cho phép chuyển đổi linh hoạt giữa giọng nói và văn bản trong cùng một phiên trò chuyện.
  • Nhịp hội thoại tùy chỉnh: Nhà phát triển có thể tinh chỉnh chi tiết cách AI bắt nhịp, ngắt lời và luân chuyển lượt thoại.
  • Trò chuyện không gián đoạn: Công nghệ lọc tiếng ồn độc quyền của Agora giúp loại bỏ giọng nói xen ngang, đảm bảo tính liền mạch trong giao tiếp.
Với Conversational AI Engine, các nhà phát triển dễ dàng khai thác Realtime API và mở ra thêm nhiều tính năng cho cơ hội phát triển các ứng dụng AI đa phương thức. Việc kết hợp giữa mô hình ngôn ngữ thời gian thực của OpenAI, hạ tầng SDRTN toàn cầu của Agora và bộ công cụ lập trình chuyên biệt giúp đẩy nhanh tiến độ ra mắt, đơn giản hóa quá trình phát triển và nâng cao trải nghiệm AI hội thoại cho người dùng.

Điển hình như nhà khởi nghiệp về robot Carbon Origins đã ứng dụng công nghệ này kết hợp với giao diện lập trình thời gian thực của OpenAI để điều khiển thiết bị hạng nặng mà không cần thao tác tay, qua đó cải thiện hiệu suất làm việc.

Ông Amogha Krishna Srirangarajan, CEO kiêm nhà sáng lập Carbon Origins nhận định: “Khi kết hợp Realtime API của OpenAI với công nghệ hội thoại của Agora, chúng tôi có thể điều khiển toàn bộ đội robot tự hành mà không cần thao tác tay. Công nghệ này chính là ‘bộ não’ tự động hóa các danh mục kiểm tra và quy trình phức tạp trong Constellation AI, cho phép con người tập trung vào chiến lược và điều phối, thay vì các thao tác thủ công.”

Sự tích hợp này củng cố thêm vị thế tiên phong của Agora trong lĩnh vực AI hội thoại, tương tác thời gian thực và phát triển tác nhân đa phương thức, với các ứng dụng rộng khắp từ chăm sóc khách hàng, giáo dục, game, gắn kết người hâm mộ cho đến nhiều ngành nghề khác.

Khẳng định vị thế tiên phong, Agora vừa được trao giải “Nền tảng API Truyền thông Xuất sắc nhất” tại API World Conference 2025. Giải thưởng này ghi nhận đóng góp của bộ máy trí tuệ nhân tạo hội thoại trong việc tạo điều kiện cho sự tương tác liền mạch theo thời gian thực giữa con người và hệ thống AI, đồng thời khẳng định tầm nhìn của công ty: mang lại trải nghiệm hội thoại với AI tự nhiên và phản hồi nhanh như giao tiếp trực tiếp giữa con người với con người.
 

Đính kèm

  • 1757601443576.png
    1757601443576.png
    185.4 KB · Lượt xem: 164

1,3 tỷ mật khẩu bị rò rỉ, đẩy hàng triệu tài khoản trực tuyến vào nguy hiểm

  • 10,786
  • 0
Một kho dữ liệu khổng lồ vừa bị tung lên web "đen", làm dấy lên cảnh báo về nguy cơ đột nhập tài khoản trên phạm vi toàn cầu. Quy mô rò rỉ lần này...

LANDFALL: Biến ảnh gửi qua WhatsApp thành vũ khí tấn công người dùng Samsung

  • 10,684
  • 0
Các chuyên gia an ninh mạng vừa phát hiện một loại phần mềm gián điệp cực kỳ tinh vi có tên LANDFALL, đang âm thầm tấn công người dùng điện thoại...

Liên minh 3 nhóm hacker khét tiếng thành thế lực đe dọa toàn cầu

  • 14,272
  • 0
Một “liên minh” mới của giới tội phạm mạng đang khiến các chuyên gia bảo mật lo ngại. Ba nhóm hacker khét tiếng: Scattered Spider, LAPSUS$ và...

Cảnh báo: Mã độc giả mạo Telegram X chiếm toàn bộ điện thoại và thiết bị của bạn

  • 11,744
  • 0
Các chuyên gia vừa cảnh báo về một chiến dịch mã độc trên Android, giả mạo ứng dụng Telegram X, có khả năng chiếm quyền kiểm soát gần như toàn bộ...

Hơn 48.000 thiết bị Cisco đối mặt làn sóng tấn công từ ba lỗ hổng nghiêm trọng

  • 10,821
  • 0
Cisco đang gặp cảnh báo an ninh mạng nghiêm trọng khi ba lỗ hổng mới được phát hiện trên các sản phẩm cốt lõi của hãng. Hai lỗ hổng ảnh hưởng đến...

Cháy trung tâm dữ liệu, hơn 600 dịch vụ chính phủ Hàn Quốc tê liệt

  • 12,486
  • 0
Một vụ cháy nghiêm trọng tại Trung tâm Dữ liệu Quốc gia ở thành phố Daejeon đã khiến hơn 600 hệ thống CNTT của chính phủ Hàn Quốc đồng loạt ngừng...

Khi dữ liệu số bị lộ: Hacker có thể làm gì với các thông tin tài chính của bạn?

  • 14,367
  • 1
Các vụ tấn công mạng gần đây cho thấy sự hoạt động của tin tặc đã và đang gia tăng trở lại, đe dọa đến an ninh dữ liệu của người dùng số. Đặt tình...

Apple vá lỗ hổng nghiêm trọng trong hệ thống xử lý hình ảnh: Người dùng cần cập nhật ngay

  • 15,535
  • 0
Apple vừa phát hành bản vá bảo mật để khắc phục lỗ hổng nguy hiểm CVE-2025-43300 trong hệ thống xử lý hình ảnh. Lỗ hổng này cho phép tin tặc chiếm...

HP OmniBook X Flip 14: Laptop chuẩn Copilot+ PC với AI mạnh mẽ, thiết kế linh hoạt cho người dùng hiện đại

  • 16,256
  • 0
Sự xuất hiện của dòng laptop chuẩn Copilot+ PC đang tạo nên làn sóng mới trong thị trường máy tính, nơi AI trở thành lõi công nghệ mang lại hiệu...

Những hiểu nhầm với quy định mới về xác nhận SIM chính chủ

  • 350
  • 0
Nhiều người hiểu chưa đúng về quy định mới liên quan đến xác thực thông tin thuê bao di động, có hiệu lực từ 15/4, khiến lo ngại bị khóa SIM...
Back