Google Gemini Omni revoluciona la creación de vídeo con IA
La nueva herramienta de Google DeepMind promete transformar la edición de vídeo, permitiendo modificaciones complejas y coherentes a partir de cualquier tipo de entrada.

Crear imágenes con inteligencia artificial ya no es novedad, pero la verdadera frontera se encuentra en la capacidad de modificar, dar continuidad y refinar una idea inicial hasta convertirla en algo más elaborado. En el ámbito del vídeo, este desafío es considerablemente mayor, involucrando movimiento, tiempo, física y la crucial coherencia de personajes y escenarios. Google DeepMind ha presentado Gemini Omni, un modelo de IA diseñado para abordar precisamente estos retos y simplificar drásticamente la edición de vídeo.
La comparación que hace Google DeepMind es reveladora: piensa en Gemini Omni como en Nano Banana, pero aplicado al vídeo. Nano Banana, lanzado en agosto de 2025, fue un generador de imágenes de IA que alcanzó una popularidad masiva, sumando 13 millones de usuarios en solo cuatro días y generando más de 5.000 millones de imágenes. Ahora, Gemini Omni Flash, la primera iteración de la familia Gemini Omni, se presenta con la ambición de llevar esa misma versatilidad y escala a la creación de contenido audiovisual.
Según la compañía, Gemini Omni Flash está concebido para crear contenido a partir de cualquier tipo de entrada. Esto significa que los usuarios podrán combinar imágenes, audio, vídeo y texto como punto de partida para generar vídeos de alta calidad. La clave reside en su capacidad para integrar el vasto conocimiento del mundo real que posee Gemini, asegurando una mayor coherencia y realismo en las creaciones.
La edición de vídeo con Gemini Omni se plantea no solo como una herramienta para generar clips desde cero, sino como un sistema interactivo capaz de trabajar sobre una escena existente mediante instrucciones detalladas. Google destaca la posibilidad de modificar elementos concretos o transformar por completo un vídeo de partida, ajustando aspectos como la estética, la acción, el entorno, el ángulo de cámara, el estilo o detalles específicos. Un punto fuerte es su promesa de mantener la consistencia de los personajes y la continuidad de la escena, ofreciendo además una física más creíble.
Los ejemplos de prompts compartidos ilustran el potencial de Gemini Omni. Instrucciones como “Haz que la escultura esté hecha de burbujas” o “Cuando la persona toque el espejo, haz que el espejo ondule con un efecto líquido y elegante, y que su brazo se convierta en un material reflectante” demuestran la granularidad y la potencia de control que ofrece el modelo. Incluso para explicaciones complejas, como un “explicador en claymation sobre el plegamiento de proteínas, todo hecho de arcilla, sin manos, en stop motion y con precisión”, Gemini Omni busca ofrecer resultados detallados y estilizados.
Gemini Omni llega con la promesa de abordar este problema y hacer de la edición una tarea mucho más sencilla.
En cuanto a su disponibilidad, Google ha anunciado que Gemini Omni Flash ya está llegando a los suscriptores de Google AI Plus, Pro y Ultra a través de Gemini y Google Flow. Además, su despliegue gratuito en plataformas como YouTube Shorts y la aplicación YouTube Create App comenzará esta semana. Sin embargo, en pruebas corporativas se ha observado un límite de generación de tres vídeos hasta una fecha específica, lo que sugiere que Google está dosificando el acceso, dada la alta demanda de recursos computacionales que implica la generación de vídeo con IA.
La llegada de Gemini Omni se produce en un momento clave para la generación de vídeo con IA, donde competidores como OpenAI con Sora han generado gran expectación. Si bien Sora prometía mucho, su disponibilidad y resultados finales han sido objeto de debate, con su web y app dejando de estar disponibles a finales de abril de 2026, aunque su API continuará operativa hasta septiembre. Gemini Omni busca consolidarse como una alternativa robusta y accesible, integrándose en el ecosistema de Google para democratizar la creación de contenido audiovisual avanzado.

Temas de la nota
Notas relacionadas

Windows abandona NTLM: Microsoft refuerza la seguridad con Kerberos
Microsoft está dando un paso crucial para fortalecer la seguridad en Windows 11, anunciando el abandono de NTLM, su protocolo de autenticación más antiguo, a favor de Kerberos.

Google lanza Gemma 4 12B: IA local para tu laptop con 16GB de RAM
El nuevo modelo de inteligencia artificial de Google busca democratizar el acceso a la IA generativa, permitiendo su ejecución en computadoras de consumo promedio.

Nvidia desafía a Intel y AMD con el superchip RTX Spark para PC
Nvidia presentó RTX Spark, un procesador que promete llevar la inteligencia artificial avanzada directamente a tu PC, sin depender de la nube, y potenciar el gaming a niveles nunca vistos en equipos convencionales.
Últimas noticias
Ver todas
Stuntman Hollywood: regresa tras 19 años de silencio en PS5, Xbox Series y PC
La icónica saga de acción y acrobacias vehiculares vuelve de la mano de Saber Interactive, prometiendo una dosis de nostalgia y adrenalina para la nueva generación.

La sonda Maven de la NASA declarada fuera de servicio tras seis meses sin comunicación
Después de una anomalía que interrumpió su órbita y agotó sus baterías, la nave Maven, crucial para entender la atmósfera de Marte, finaliza su misión activa. Sus datos seguirán siendo un legado invaluable para la ciencia.

NASA revela nuevo origen de elementos vitales para la vida en la Tierra
Un estudio reciente, publicado en Science Advances, desvela cómo la Tierra primitiva recibió fósforo y nitrógeno, y el papel crucial de Júpiter.
Comentarios (0)
Aún no hay comentarios. ¡Sé el primero!
Deja un comentario