
El martes, Openai anunciado Sora 2, su modelo de AI de videos de videos de segunda generación que ahora puede generar videos en una variedad de estilos con diálogo sincronizado y efectos de sonido, lo cual es el primero para la compañía. Operai también lanzó una nueva aplicación social de iOS que permite a los usuarios insertarse en videos generados por IA a través de lo que Operai llama «cameos».
Operai exhibió el nuevo modelo en un video generado por IA que presenta una versión fotorrealista del CEO de Operai, Sam Altman, hablando con la cámara en una voz ligeramente no natural en medio de fantasías fantásticas, como una carrera de pato competitiva y un jardín brillante.
Con respecto a esa voz, el nuevo modelo puede crear lo que OpenAi llama «paisajes sonoros de fondo sofisticados, discursos y efectos de sonido con un alto grado de realismo». En mayo, Google's VEO 3 Se convirtió en el primer modelo de síntesis de video de un importante laboratorio de IA para generar audio sincronizado y video. Hace solo unos días, Alibaba lanzó WAN 2.5un modelo de video de peso abierto que también puede generar audio. Ahora Openai se ha unido a la fiesta de audio con Sora 2.
https://www.youtube.com/watch?v=gzneghpxwju
Operai demuestra las capacidades de Sora 2 en un video de lanzamiento.
El modelo también presenta mejoras notables de consistencia visual sobre el modelo de video anterior de OpenAI, y también puede seguir instrucciones más complejas en múltiples tomas mientras se mantiene la coherencia entre ellas. El nuevo modelo representa lo que Operai describe como su «momento GPT-3.5 para el video», comparándolo con el avance de ChatGPT durante la evolución de sus modelos de generación de texto a lo largo del tiempo.
Sora 2 parece demostrar una precisión física mejorada sobre el modelo SORA original de Febrero de 2024con OpenAi, afirmar que el modelo ahora puede simular movimientos físicos complejos como rutinas de gimnasia olímpica y axeles triples mientras mantiene la física realista. El año pasado, poco después del lanzamiento de Sora 1 Turbo, Vimos Varias fallas notables de tareas similares de video generación que OpenAI afirma haberse abordado con el nuevo modelo.
«Los modelos de video anteriores son demasiado optimistas: transformarán los objetos y deformarán la realidad para ejecutar con éxito un mensaje de texto», escribió Openii en su anuncio. «Por ejemplo, si un jugador de baloncesto pierde un tiro, la pelota puede teletransportarse espontáneamente al aro. En Sora 2, si un jugador de baloncesto pierde un tiro, se recuperará del tablero».




