Así funciona Sora, la nueva herramienta de OpenAI para crear vídeos con inteligencia artificial
TECNOLOGÍA
Es capaz de convertir texto en vídeos de hasta 60 segundos
Google abre a los desarrolladores Gemini 1.5 Pro, un nuevo modelo de su IA para procesar grandes cantidades de información
La inteligencia artificial podría competir con la mente humana
El mundo avanza y la evolución tecnológica facilita infinidad de recursos técnicos para acelerar el proceso de aprendizaje, convivencia y comodidad de las personas, que ya sienten cómo la inteligencia artificial podría competir con la mente humana.
La empresa líder en este campo es OpenAI, creadora del popular ChatGPT y que cuenta con el respaldo tecnológico y financiero de Microsoft.
El último ingenio de la compañía presidida por Sam Altman fue GPT-4 Turbo, un nuevo modelo aún más potente, pero ya ha presentado el siguiente: Sora, capaz de convertir texto en videos de hasta 60 segundos.
Según la firma, desarrolladora también del generador de imágenes fijas DALL-E, Sora es capaz de crear "escenas complejas con detalles del componente principal y el trasfondo".
La compañía también indicó que su modelo puede "entender cómo existen los objetos en el mundo físico" y tiene la capacidad de "interpretar acertadamente las instrucciones y de generar personajes convincentes que expresan emociones vibrantes".
Sora es el término en japones para "cielo" y la compañía todavía no la ha puesto a disposición del público porque sigue analizándola para comprender los peligros del sistema, según indicó el diario The New York Times.
OpenAI sí ha compartido la tecnología con un pequeño grupo de académicos y otros investigadores externos cuya tarea es detectar las formas en las sora Sora podría usarse con fines maliciosos.
La compañía ha publicado en su web numerosos ejemplos de lo que se puede hacer con Sora, desde escenas urbanas a rurales, con personas, animales y hasta plantas. En esta pieza hemos incluido solamente una pequeña muestra de ellos.
OpenAI indica que Sora permite la creación de muchos mundos, con escenas realistas o fantásticas, tridimensionales, con movimientos fluidos e, incluso en las escenas que no existen en el mundo real, el modelo aplica las reglas físicas correctas.
Cómo funciona
Sora funciona como otras herramientas de IA generativa: el usuario detalla el contenido que desea a través de los conocidos como prompts (instrucciones) y Sora produce a partir de ahí ese vídeo corto.
Ejemplos de estas indicaciones son "hermosa y nevada ciudad de Tokio está bulliciosa. La cámara se mueve por la bulliciosa calle City, siguiendo a varias personas que disfrutan del hermoso clima nevado y de compras en puestos cercanos. Los hermosos pétalos de Sakura vuelan por el viento junto con los copos de nieve".
¿Cómo distinguir lo real de lo no real?
Como no podía ser de otra manera, esta nueva herramienta ha generado debate sobre su impacto.
Para muchos Sora supone un salto significativo en el campo de la inteligencia artificial, al permitir la conversión de texto en vídeos con alto grado de detalle y realismo. No sólo amplía las posibilidades de generación de contenido visual automatizado sino que abre nuevas oportunidades para aplicaciones en entretenimiento, educación y cultura.
"El hiperrealismo en toda su expresión. El problema del futuro próximo será discernir lo real de lo digital. Necesitaremos nuevas habilidades para ese tipo de distinciones", asegura Anabel Maussa, docente, consultora y ponente.
Por ello, desde OpenAI aseguran que aún están trabajando en varias medidas de seguridad antes de que Sora esté disponible en los productos de OpenAI, "con miembros del equipo rojo (expertos en áreas como desinformación, contenido que incita al odio y prejuicios) que están probando el modelo de manera adversa", informan a través de sus redes sociales.
También te puede interesar