Saltar al contenido
Inteligencia Artificial

Google lanza Gemini 3.5 Live Translate para traducción de voz instantánea

Google amplía la disponibilidad de su traducción en tiempo real con Gemini 3.5 Live Translate, ofreciendo menor latencia y más de 70 idiomas.

person Luciano Carnevalini calendar_month 13 junio, 2026 schedule 2 min de lectura Agreganos en

Google ha lanzado Gemini 3.5 Live Translate, una nueva herramienta de inteligencia artificial diseñada para la traducción instantánea de voz a voz. Esta innovación promete una mayor accesibilidad y una latencia reducida en más de 70 idiomas, según anunció la compañía.

Este desarrollo es la culminación de años de investigación de Google en el campo de la traducción en tiempo real, una iniciativa que la empresa describe como una de sus "experiencias pioneras en aprendizaje automático". Históricamente, las demostraciones de esta tecnología en eventos de Google solían requerir dispositivos específicos, como teléfonos o auriculares de la marca.

El año pasado, Google ya había dado un paso importante al expandir la disponibilidad de su traducción en tiempo real a más usuarios a través de la aplicación Translate. Ahora, con la llegada de Gemini 3.5 Live Translate, esta capacidad se amplifica aún más, permitiendo a las personas acceder a la traducción instantánea en una variedad más amplia de entornos.

La clave de esta mejora reside en el nuevo modelo de IA, que forma parte de la familia Gemini 3.5 presentada en el evento I/O. Hasta el momento, solo se había lanzado la versión Flash de esta serie, pero Google anticipa que un modelo Pro más potente estará disponible "en las próximas semanas".

Gemini 3.5 Live Translate es un modelo de voz a voz ajustado para detectar y traducir automáticamente en más de 70 idiomas.

Gemini 3.5 Live Translate es un modelo de voz a voz ajustado para detectar y traducir automáticamente en más de 70 idiomas. Esta amplia cobertura lingüística tiene el potencial de reducir significativamente las barreras de comunicación en conversaciones cotidianas y profesionales.

Google asegura que este modelo es lo suficientemente rápido como para seguir el ritmo de una conversación normal, con un retraso mínimo de solo unos segundos respecto al hablante original. Un aspecto crucial es su capacidad para replicar la entonación, el ritmo y el tono de la voz.

Este enfoque en la imitación de la voz natural es fundamental, ya que busca que la traducción suene más auténtica y personal, alejándose de las voces robóticas genéricas. Las demostraciones presentadas por Google, aunque grabadas bajo condiciones controladas, resultan realmente impresionantes por su fluidez y naturalidad.

Para los usuarios, esto implica una mejora sustancial en la fluidez de las interacciones multilingües. La menor dependencia de dispositivos específicos democratiza el acceso a una tecnología que antes estaba más limitada, facilitando la comunicación sin fricciones.

No tendremos que esperar mucho para comprobar por nosotros mismos las habilidades de este modelo. La promesa de una traducción instantánea y natural en tantas lenguas abre un abanico de posibilidades para la comunicación global.

Compartir:
También disponible en: EN

Notas relacionadas

Últimas noticias

Ver todas

Comentarios (0)

Aún no hay comentarios. ¡Sé el primero!

Deja un comentario