Trí tuệ nhân tạo của Google đã có thể nghe và ghi chép

Thứ 7, 13/04/2024 | 12:09:49 [GMT +7] A A

Google vừa công bố một bản cập nhật mới cho phép Gemini Pro, một trong những chatbot trí tuệ nhân tạo của họ, khả năng nghe và ghi chép.

Trí tuệ nhân tạo Gemini Pro đã được Google trang bị cho một "đôi tai" mới. Ảnh: Google

Theo thông tin từ Digital Trends, Google vừa công bố một bản cập nhật mới cho Gemini Pro, một trong những chatbot AI của họ. Bản cập nhật này cho phép chatbot có khả năng chuyển âm thanh thành văn bản, mở ra một loạt các ứng dụng mới và tiện ích cho người dùng.

Gemini 1.5 Pro giờ đây có thể nghe các tệp âm thanh và sau đó trích xuất thông tin văn bản từ chúng. Điều này mang lại lợi ích đặc biệt cho việc xử lý dữ liệu đa phương tiện và làm cho chatbot trở nên linh hoạt hơn trong việc tương tác với người dùng.

Các chức năng mới của Gemini 1.5 Pro đã được cung cấp dưới dạng bản xem trước công khai trên nền tảng phát triển Vertex AI của Google. Điều này cho phép các nhà phát triển tập trung vào việc phát triển ứng dụng và dịch vụ của họ mà không cần lo lắng về việc xây dựng và huấn luyện mô hình AI từ đầu.

Google đã thử nghiệm tính năng này và mở rộng cơ sở của nó sau khi triển khai riêng tư hơn vào tháng 2 khi mô hình này được công bố lần đầu tiên. Công ty đã chia sẻ thông tin chi tiết về bản cập nhật tại hội nghị Cloud Next, đang diễn ra ở Las Vegas, Mỹ.

Gemini 1.5 Pro có khả năng xử lý các loại âm thanh khác nhau thành văn bản, bao gồm chương trình truyền hình, phim, chương trình phát thanh và bản ghi âm cuộc gọi hội nghị. Nó cũng có thể xử lý âm thanh bằng nhiều ngôn ngữ khác nhau và tạo bản ghi từ video.

Tuy nhiên, Google lưu ý rằng mặc dù có khả năng xử lý âm thanh và video, chất lượng của văn bản trích xuất có thể không luôn đáng tin cậy. Điều này được đề cập bởi TechCrunch.

Theo Lao động