agencia efeWashington
La empresa OpenAI, uno de los líderes en inteligencia
artificial generativa, presentó este jueves su modelo 'Sora' que acepta
instrucciones en texto y las convierte en escenas de video, realistas, con
múltiples caracteres y movimientos específicos.
Según la firma, establecida en 2015 y dirigida por Sam Altman, que ha
desarrollado ChatGPT y el generador de imágenes fijas DALL-E, 'Sora' es capaz
de crear "escenas complejas con detalles del componente principal y el
trasfondo".
La compañía
también indicó que su modelo puede "entender cómo existen los objetos en
el mundo físico" y tiene la capacidad de "interpretar acertadamente
las instrucciones y de generar caracteres convincentes que expresan emociones
vibrantes".
'Sora' es el término en japones para "cielo" y la compañía
todavía no la ha puesto a disposición del público porque sigue analizándola
para comprender los peligros del sistema, según indicó el diario The New York
Times.
En cambio, OpenAI ha compartido la tecnología con un pequeño grupo de
académicos y otros investigadores externos cuya tarea es detectar las maneras
en las cuales 'Sora' podría usarse con fines maliciosos.
Steven Levy, de la revista Wired, describió su experiencia cuando OpenAi
le permitió ver, aunque no operar, el modelo 'Sora' en respuesta a la
instrucción en texto para crear una escena de la ciudad de Tokio captada por
una cámara que se mueve por las calles, sigue a algunas personas en un día con
nieve.
"El resultado es una vista convincente de lo que es, sin duda,
Tokio en ese momento, cuando coexisten los copos de nieve y los capullos de
cerezos" escribió Levy. "La cámara virtual, colocada en un robot
volador (dron), sigue a una pareja que camina por el paisaje".
La firma indica que 'Sora' permite la creación de muchos mundos, con
escenas realistas o fantásticas, tridimensionales, con movimientos fluidos, y
aun en las escenas que no existen en el mundo real, el modelo aplica las reglas
físicas correctas.
De este modo, OpenAI, que revolucionó el emergente sector de los
servicios de IA regenerativa, dispondrá de un conjunto de servicios que van
desde la generación de texto, imagen estática y video.