OpenAI busca hacerse un hueco en el mundo de las redes sociales. La compañía fundadora del conocido ChatGPT ha dado a conocer el que pretende ser el TikTok de la inteligencia artificial, su nueva herramienta, Sora 2.

Se trata de una aplicación de vídeos con IA que poco tiene que envidiar a los que se publican en la plataforma china. Según la firma que creó Sam Altman, se trata de su modelo de vídeo "más preciso, realista y controlable que los sistemas anteriores".

OpenAI ha ofrecido detalles sobre su nueva generación 20 meses después de lanzar el modelo original de Sora, momento en el que la compañía aseguró que la generación de vídeo comenzó a "parecer funcional". Durante todo este tiempo, la firma de San Francisco ha estado trabajando en mejorar la app y dar un paso al frente tras la firme apuesta de empresas como Google, con su Veo 3, por este tipo de sistemas inteligentes.

"Creemos que estos sistemas serán cruciales para entrenar modelos de IA que comprendan a fondo el mundo físico. Un hito importante para ello es dominar el preentrenamiento y el postentrenamiento con datos de vídeo a gran escala, que se encuentran en sus primeras etapas en comparación con el lenguaje", ha detallado.

Haciendo cosas "excepcionalmente difíciles"

OpenAI ha revelado que con Sora 2 se lanzan a la piscina en el que considera el "punto culminante de GPT-3.5 en vídeo". "Sora 2 puede hacer cosas excepcionalmente difíciles, y en algunos casos, imposibles, para los modelos de generación de vídeo anteriores", ha contado.

Su nueva aplicación de vídeos elaborados con IA permite crear, de la nada, ejercicios de gimnasia olímpica, que una persona haga una voltereta en una tabla de surf o ver a un perro en el espacio.

"Los modelos de video anteriores son demasiado optimistas: transforman objetos y deforman la realidad para ejecutar correctamente una instrucción de texto", ha concretado OpenAI.

Uno de los errores habituales era la falta de naturalidad en el vídeo. Ponen de ejemplo el de un jugador de baloncesto que falla un tiro a canasta. El balón "puede teletransportarse espontáneamente al aro" y con Sora 2 aseguran que "aunque sigue siendo imperfecto, obedece mejor las leyes de la física que los sistemas anteriores".

"Esta es una capacidad fundamental para cualquier simulador de mundos útil: debe ser capaz de modelar el fracaso, no solo el éxito", ha explicado, aunque lo definen como "un gran avance en controlabilidad, capaz de seguir instrucciones complejas que abarcan múltiples tomas, manteniendo con precisión el estado del mundo".

Pese a que los primeros contenidos que ha publicado la compañía de Sam Altman cuentan con detalles que parecen reales, hasta la misma firma reconoce que el modelo "está lejos de ser perfecto y comete muchos errores". "Pero es una validación de que ampliar aún más las redes neuronales en datos de video nos acercará a simular la realidad", ha añadido.

Un 'feed' al estilo TikTok

El nuevo Sora 2, con el mismo temor de la privacidad que se producía en sus primeros modelos de ChatGPT, se va a convertir en una especie de TikTok de la inteligencia artificial.

A través de la nueva aplicación, que solamente se ha lanzado en iOS en Estados Unidos y Canadá y a través de una invitación, se puede usar para "crear, remezclar las generaciones de los demás, descubrir nuevos videos en un feed de Sora personalizable y aparecer tú mismo o tus amigos mediante cameos".

"Con los cameos, puedes aparecer directamente en cualquier escena de Sora con una fidelidad excepcional tras una breve grabación de video y audio en la app para verificar tu identidad y capturar tu imagen", ha expresado.

Respecto a la privacidad, OpenAI ha asegurado que ofrecen a los usuarios "las herramientas y la opción de controlar lo que ven en su feed". "Utilizando los amplios modelos de lenguaje existentes de OpenAI, hemos desarrollado una nueva clase de algoritmos de recomendación que pueden configurarse mediante lenguaje natural", ha contado.

Y el objetivo de la compañía de Sam Altman es precisamente el de convertirlo en una red social al estilo TikTok. Está diseñada para usarla con otras personas y destacan que "la gran mayoría de los usuarios que la han probado afirman que los cameos son lo que la hace diferente y divertida". "Tienes que probarla para entenderla, pero es una forma nueva y única de comunicarte con la gente", ha razonado la firma.

Ante esos miedos sobre la privacidad de los usuarios, la propia OpenAI trata de esclarecer que en esos cameos se protege la imagen de los usuarios y sólo los usuarios tienen el control total de ella. Además, aseguran que se están implantando límites para proteger el bienestar de los adolescentes, con un control parental a través de ChatGPT para que los padres puedan poner límites.

