Gemini 1.5 Pro de Google ahora puede escuchar audio
[ad_1]
La última versión de la IA de Google, Gemini 1.5 Pro, ahora puede escucharte.
Gemini es el bot renombrado de Google, anteriormente llamado Bard, y Gemini 1.5 Pro es la última versión del modelo, disponible para un número limitado de desarrolladores en febrero de este año. Gemini 1.5 Pro es capaz de procesar texto, código, video y (ahora) transmisiones de audio cargadas, incluido audio de video, que puede escuchar, analizar y extraer información sin la necesidad de una transcripción escrita correspondiente.
La compatibilidad con archivos de audio significa efectivamente que los usuarios pueden usar Gemini 1.5 Pro para recopilar información de conversaciones telefónicas, transcribir entrevistas grabadas o analizar videos con audio, básicamente archivos de audio de cualquier tipo. La IA puede procesar indicaciones que contienen una hora de video. 11 horas de audio, 30.000 líneas de código o más de 700.000 palabras en una sola secuencia.
Google también está poniendo a disposición Gemini 1.5 Pro como una vista previa pública para aquellos con acceso a Vertex AI, pero aún no se vislumbra una prueba beta pública. Actualmente, la mayoría de los usuarios interactúan con la IA de Google a través del chatbot Gemini.
[ad_2]
Deja una respuesta