Internet

Nuevo software de OpenAI, Sora, puede generar videos asombrosos en respuesta a consultas de texto

Sora es capaz de generar escenas complejas con múltiples personajes, tipos específicos de movimiento y detalles precisos del sujeto y el fondo.

OpenAI presentó Sora, su último modelo de inteligencia artificial generativa que puede convertir mensajes de texto en videos de un minuto.| Foto: AFP vía Getty Images
OpenAI presentó Sora, su último modelo de inteligencia artificial generativa que puede convertir mensajes de texto en videos de un minuto.| Foto: AFP vía Getty Images

OpenAI presentó un nuevo software revolucionario que puede producir videos de alto calibre en respuesta a unas pocas consultas de texto simples: un avance deslumbrante del creador de ChatGPT que también podría llevar las preocupaciones sobre falsificaciones profundas y estafas de contenido con licencia a un nuevo nivel.

PUBLICIDAD

La tecnología, llamada Sora, utiliza su “profundo conocimiento del lenguaje” para crear clips de hasta un minuto de duración que incluyen “personajes atractivos” y “múltiples tomas dentro de un único vídeo generado”, dijo la compañía en un sitio web dedicado a la nueva tecnología.

¿Qué puede hacer Sora?

“Sora es capaz de generar escenas complejas con múltiples personajes, tipos específicos de movimiento y detalles precisos del sujeto y el fondo”, dijo OpenAI. “El modelo comprende no sólo lo que el usuario ha pedido en el mensaje, sino también cómo existen esas cosas en el mundo físico”.

Recomendados

La firma dirigida por Sam Altman proporcionó algunos ejemplos sorprendentes de indicaciones que aparentemente fueron escritas para un guión de Hollywood, según el medio tecnológico Wired, al que se le dio un adelanto de las capacidades de Sora.

“La hermosa y nevada ciudad de Tokio está llena de vida. La cámara se mueve por las bulliciosas calles de la ciudad, siguiendo a varias personas disfrutando del hermoso clima nevado y comprando en los puestos cercanos. Preciosos pétalos de sakura vuelan con el viento junto con los copos de nieve”, decía el mensaje.

Sora convirtió las tres frases en un vibrante vídeo de 17 segundos, muy por debajo del límite de un minuto, que mostraba a una pareja anodina tomados de la mano mientras caminaba por una calle cubierta de nieve bordeada de tiendas con pagodas y con el horizonte de Tokio en la distancia.

Los cerezos en flor (sakura) estaban en plena floración mientras la nieve caía del cielo nublado.

Hubo algunos errores, como que la acera llegara a un callejón sin salida, pero en general fue “un ejercicio alucinante de construcción del mundo”, escribió Wired.

Errores de prueba

“El modelo actual tiene debilidades. Puede tener dificultades para simular con precisión la física de una escena compleja y es posible que no comprenda instancias específicas de causa y efecto”, dijo OpenAI.

“Por ejemplo, una persona puede darle un mordisco a una galleta, pero después, es posible que la galleta no tenga la marca del mordisco”.

Otro ejemplo sorprendente provino de un mensaje que solicitaba “una escena animada de un monstruo bajo y esponjoso arrodillado junto a una vela roja” que tenía “los ojos muy abiertos y la boca abierta”.

El resultado fue una combinación de un Furby con un gremlin que creó una criatura tierna adecuada para “Monsters, Inc.” de Pixar. franquicia. La facilidad con la que Sora interpretó al personaje contradecía los esfuerzos que consumen mucho tiempo y que normalmente requieren los animadores experimentados, lo que genera preocupaciones sobre el impacto que la tecnología tendrá en la industria cinematográfica.

Una mejora futura será la capacidad de generar vídeo a partir de una imagen fija, afirmó la empresa.

Lea tambíen: ¿Cuánto tiempo es lo “recomendable” estar en redes sociales para no afectar la salud mental?

Tags


Lo Último