Không kém cạnh OpenAI hay Google, AI của Elon Musk giờ cũng có thể nhìn, nghe, nói như con người

Kiều My
Kiều My
Phản hồi: 0

Kiều My

Editor
Thành viên BQT
Grok, chatbot AI được phát triển bởi xAI - công ty của Elon Musk, đang trong quá trình tích hợp khả năng xử lý thông tin đa phương tiện, cho phép người dùng tương tác bằng cả hình ảnh và văn bản. Thông tin này được tiết lộ thông qua tài liệu dành cho nhà phát triển mà xAI công bố gần đây.

Trước đó, vào tháng 3/2024, Grok đã có bước tiến đáng kể với phiên bản Grok 1.5, sở hữu khả năng lập luận được cải thiện đáng kể. Trong một bài đăng trên blog vào tháng trước, xAI cũng đã gợi ý rằng Grok-1.5V sẽ cung cấp "các mô hình đa phương thức trong một số lĩnh vực nhất định". Bản cập nhật tài liệu dành cho nhà phát triển gần đây cho thấy xAI đang chuẩn bị ra mắt một mô hình AI mới, cho phép người dùng tải ảnh lên Grok và nhận được câu trả lời bằng văn bản. Tài liệu hướng dẫn cách các nhà phát triển có thể sử dụng bộ công cụ phát triển phần mềm (SDK) của xAI để tạo ra phản hồi dựa trên cả văn bản và hình ảnh, với kịch bản Python mẫu minh họa quy trình này.

1716367128745.png


Ra mắt vào tháng 11/2023 và chỉ dành riêng cho người dùng trả phí X Premium Plus, Grok được xem là "tân binh" trong lĩnh vực AI so với các đối thủ lớn như ChatGPT của OpenAI. Điểm nổi bật của Grok là khả năng tiếp cận thông tin theo thời gian thực, bao gồm cả các bài đăng trên nền tảng X. Theo xAI, mô hình Grok được huấn luyện dựa trên nhiều nguồn dữ liệu văn bản công khai trên Internet tính đến quý 3 năm 2023 và tập dữ liệu do người đánh giá xem xét và tuyển chọn. Tuy nhiên, xAI cũng thừa nhận rằng các điểm chuẩn cho mô hình ngôn ngữ lớn thường bị chỉ trích vì các mô hình có thể hoạt động tốt trên điểm chuẩn nếu chúng được đưa vào dữ liệu đào tạo, giống như việc ghi nhớ câu trả lời trong bài kiểm tra thay vì thực sự hiểu nội dung.

Mặc dù vậy, theo bài đăng trên blog của xAI, Grok 1.5 đang dần thu hẹp khoảng cách với GPT-4 trên nhiều tiêu chuẩn đánh giá, từ cấp tiểu học đến các cuộc thi cấp trung học. Chatbot đa phương thức được xem là đích đến tiếp theo của cuộc đua AI, với nhiều ông lớn trong ngành như Google và OpenAI đã công bố những bước tiến mới. Việc thiếu hụt khả năng đa phương tiện đã khiến Grok bị tụt lại phía sau cho đến thời điểm hiện tại. Liệu với những nỗ lực nâng cấp, Grok có thể tạo nên bất ngờ trong cuộc đua đầy thử thách này hay không vẫn còn là một câu hỏi lớn.
#ElonMusk
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng

Bị coi là quốc gia kém phát triển, Triều Tiên lấy đâu ra tiền phát triển vũ khí khiến phương Tây e ngại?

  • 238
  • 0
Bất chấp việc được biết đến là một trong những quốc gia nghèo nhất châu Á, Triều Tiên trong những năm gần đây lại liên tục khiến thế giới kinh...

Điểm danh 6 tính năng phổ biến nhất của máy lọc không khí hiện nay, ai chuẩn bị mua cần chú ý

  • 122
  • 0
1. Công nghệ lọc không khí HEPA – Chuẩn mực vàng trong lọc bụi mịn HEPA (High-Efficiency Particulate Air) là công nghệ lọc không khí tiên tiến, có...

Không khí tại các thành phố lớn ô nhiễm nặng nề, đây là loại thiết bị được quan tâm nhiều nhất lúc này

  • 146
  • 0
Hiện nay, máy lọc không khí đang được ngày càng nhiều gia đình sử dụng bởi tính năng lọc sạch không khí tuyệt vời, làm thoáng đãng không gian đặc...

Thương hiệu gia dụng nổi tiếng từ Cộng hoà Séc tạo làn sóng trên thị trường Việt Nam

  • 145
  • 0
Elmich là một thương hiệu gia dụng cao cấp đến từ Cộng hòa Séc, được thành lập vào năm 1995 tại thành phố Ostrava. Với gần 30 năm phát triển...

Siêu máy tính tương lai sẽ "ngốn điện" ngang với 1 thành phố

  • 144
  • 0
Theo báo cáo của Epoch AI (viện nghiên cứu tại San Francisco, công bố cuối tháng 4/2025), đến năm 2030, các siêu máy tính hàng đầu dùng để huấn...

LG đồng hành cùng Hòa Minzy, Obito và Hứa Kim Tuyền tung ra MV “Nếp Nhà”

  • 99
  • 0
LG Electronics Việt Nam vừa giới thiệu MV “Nếp Nhà” với sự kết hợp của ca sĩ Hòa Minzy, rapper Obito và nhạc sĩ Hứa Kim Tuyền. Đây là món quà âm...

Lần đầu tiên một đại gia Việt có tài sản hơn 9 tỉ USD, vượt cả chủ tịch Samsung

  • 206
  • 0
Cổ phiếu VIC của Tập đoàn Vingroup tiếp tục tăng mạnh trong phiên ngày 8-5, góp phần nâng quy mô tài sản ròng của ông Phạm Nhật Vượng vượt 9 tỉ...

Đây là cách "xem YouTube" nhanh nhất có thể bạn chưa thử

  • 248
  • 1
Mô hình Gemini 2.5 Flash có thể tóm tắt nội dung video dài trên YouTube, giúp người dùng tiết kiệm thời gian và nắm bắt thông tin nhanh chóng...

Sạc siêu nhanh xe điện: sự tiện lợi phải trả giá bằng tuổi thọ pin

  • 181
  • 0
Năm 2025 được ca ngợi là "năm bùng nổ sạc siêu nhanh" đối với xe điện. Mặc dù sự tiến bộ nhanh chóng của công nghệ sạc nhanh và sạc siêu nhanh đã...

Cách phục hồi ảnh cũ bằng AI miễn phí nhanh gọn, ai cũng làm được

  • 236
  • 0
Phục hồi ảnh cũ bằng AI miễn phí là giải pháp lý tưởng cho những ai muốn tái hiện lại hình ảnh xưa mà không cần biết quá nhiều về Photoshop hay kỹ...
Back
Top