TN

Temas de hoy:

  • Javier Milei
  • Cristina Kirchner
  • Tensión en Medio Oriente
  • Dólar hoy
  • Lionel Messi
  • Colapinto en el GP de Canadá
  • Mundial de Clubes
  • Tecno
  • EN VIVO
    tnTecnoNovedades

    CausVid, el generador de videos creado en el MIT destapa la olla de la automatización

    Desarrollado en colaboración con Adobe, el sistema permite echar una mirada al detrás de escena de herramientas como Sora de OpenAI y Veo 2 de Google.

    Uriel Bederman
    Por 

    Uriel Bederman

    18 de mayo 2025, 05:43hs
    La herramienta permite crear clips en un abrir y cerrar de ojos: el proceso “clásico” requeriría unos 50 pasos. (Foto: Creada con ChatGPT)
    La herramienta permite crear clips en un abrir y cerrar de ojos: el proceso “clásico” requeriría unos 50 pasos. (Foto: Creada con ChatGPT)

    Una de las manifestaciones más emocionantes en el presente boom de la Inteligencia Artificial es protagonizado por los generadores de video, capaces de crear clips audiovisuales a partir de instrucciones por escrito. Los emblemas en ese mundillo salen de las entrañas de dos gigantes estadounidenses: Sora, de Open AI, y Veo 2, de Google.

    Leé también: “Se hacen solos”: estos son los tres generadores más famosos para convertir texto en videos

    Adentrándonos en ese mundillo, científicos del Instituto Tecnológico de Massachusetts, el célebre MIT, crearon junto al especialista Adobe un generador híbrido denominado “CausVid”. Más allá de sus funciones específicas y de su capacidad para, también, entregar videos basándose en textos; este desarrollo destapa la olla de los sistemas arriba mencionados. Además, ¿por qué su naturaleza mixta le aporta una fortaleza especial?

    El primer paso: ¿cómo funcionan los generadores de video con Inteligencia Artificial?

    Sora y Veo, hemos dicho, son los paradigmas de la generación de videos con IA. La magia de esos sistemas comienza con un prompt, que en la jerga son las instrucciones que escribe el . Por ejemplo, para el siguiente video creado con el modelo de Google la indicación ha sido algo así como “en un bosque nevado, una ardilla vestida con ropa navideña anda en una patineta”. Es posible pedir casi cualquier cosa.

    Video Placeholder
    Estos sistemas operan en base a prompts por escrito. (Video: Google Veo 2)

    Las herramientas ya conocidas (algunas de ellas ya disponibles para los s) generan clips con diversos estilos, desde escenas realistas o dibujos, hasta animaciones similares a las del cine.

    Según explican desde el MIT, podríamos pesar que el proceso en estos generadores es similar a la animación stop-motion, que crean y unen muchas imágenes. Pero no es así. “En lugar de producir fotograma a fotograma, estos sistemas procesan toda la secuencia a la vez. El trabajo es lento y no permite cambios sobre la marcha”, explican.

    ¿Cómo funciona CausVid?

    Creado por científicos del CSAIL, el laboratorio del MIT abocado a la IA, en colaboración con especialistas de Adobe Research, el área de investigación de la empresa conocida por el Photoshop; CausVid se destaca por ser un generador de enfoque híbrido.

    Video Placeholder
    El modelo se destaca por su carácter híbrido. (Video: MIT CSAIL)

    “CausVid combina un modelo preentrenado basado en difusión, con una arquitectura autorregresiva que se encuentra habitualmente en los modelos de generación de texto”, explica Tianwei Yin, uno de los autores principal del artículo en el que se detallan las características de la herramienta. “Este modelo docente impulsado por IA puede prever los pasos futuros para entrenar un sistema fotograma a fotograma y evitar errores de renderizado".

    Leé también: El impacto de la IA en YouTube: doblajes automáticos, nuevos formatos y más contenido de creadores

    ¿Cómo trabaja, en la práctica? Desde la institución estadounidense señalan que lo hace de forma similar a cómo un estudiante atento aprende de un profesor experto. En sus entrañas opera un modelo de difusión que, por su parte, entrena a un sistema que predice velozmente cuál será el siguiente fotograma en el video. Igual que las herramientas mencionadas (Sora y Veo) genera clips audiovisuales a partir de simples instrucciones de texto.

    Un clip generado con CausVid. (Imagen: MIT CSAIL)
    Un clip generado con CausVid. (Imagen: MIT CSAIL)

    CausVid no se limita a las creaciones desde cero y, en ese sentido, puede servir como un editor de video. También puede dotar de movimiento a una fotografía, extender piezas ya existentes o realizar cambios en los resultados que generó, con nuevas entradas a mitad del proceso. Por ejemplo, los s pueden escribir una instrucción inicial (“genera un hombre que cruza una calle”) y después agregar nuevas indicaciones, para completar la escena en forma gradual. A esa consecución de prompts la llaman “entradas de seguimiento”.

    Según observan desde el MIT, esta herramienta es capaz de concretar en pocas acciones un proceso que, de otro modo, requeriría unos 50 pasos.

    Las falencias de los generadores de video, al descubierto

    Este desarrollo que emerge del MIT, hemos dicho, deja al descubierto algunas de las fallas de los modelos de IA ahora conocidos para la generación de videos. Muchos de ellos pueden crear piezas con movimientos fluidos, cuya calidad va degradándose con el correr de los segundos. Esto ocurre porque ocurren inconsistencias fotograma a fotograma, errores que se deben a una acumulación.

    Somos testigos directos del boom de la IA Generativa. (Foto: Creada con ChatGPT)
    Somos testigos directos del boom de la IA Generativa. (Foto: Creada con ChatGPT)

    “La generación de video propensa a errores era común en los enfoques que aprendieron a predecir fotogramas uno a uno (en los modelos de difusión). En cambio, CausVid utiliza un modelo de difusión de alta potencia para enseñar a un sistema más sencillo su experiencia general, lo que le permite crear imágenes fluidas, pero mucho más rápido”, señalan los creadores de este modelo y aseguran que superó a otros de referencia, como Sora de OpenAI. Presumen que los resultados son más estables, de más calidad y que se generan hasta 100 veces más rápido.

    Los alcances de este desarrollo no se agotan en la simple generación de clips. Yin afirma que el modelo podría ser entenado para tareas más específicas, como la creación de videojuegos o el entrenamiento de robots. Por otra parte, los investigadores destacan que este enfoque, al ser más veloz en sus procedimientos, genere una menor huella de carbono, una variable que gana cada vez más atención en el marco del despliegue de la IA.

    Leé también: La Inteligencia Artificial mejora si es charlatana: las alucinaciones aumentan en las respuestas breves

    Se espera que los detalles sobre CausVid sean profundizados en la Conference on Computer Vision and Pattern Recognition que se celebrará en junio, en Nashville, Estados Unidos.

    Las más leídas de Tecno

    1

    Usan la imagen de Lionel Messi y Soledad Pastorutti para promocionar estafas digitales en redes sociales

    Por 

    Rodrigo Álvarez

    2

    La IA promete llevar la atención al cliente al próximo nivel: “Ahora se compra desde el chat”

    Por 

    Uriel Bederman

    3

    Alerta roja: Google advierte a los s de Gmail que actualicen su cuenta

    4

    Disney y Universal demandaron a una herramienta de IA por usar sus personajes sin autorización

    5

    Ni formatear ni reiniciar: el truco para hacer que tu computadora funcione más rápido en segundos

    Suscribite a los newsletters de TN

    Recibí las últimas noticias de TN en tu correo.

    Temas de la nota

    Inteligencia artificialMITInnovaciónVideos

    Más sobre Tecno

    La inteligencia artificial en el Derecho: así impacta la IA en la Justicia y el sistema legal argentino. (Imagen: GeminiAI)

    La inteligencia artificial en el Derecho: así impacta la IA en la Justicia y el sistema legal argentino

    Por 

    Rodrigo Álvarez

    ¿Las amenazas en las herramientas de IA son mayores que en las redes sociales? (Foto: Creada con Microsoft Copilot)

    La IA es provechosa y también peligrosa: ¿cómo proteger a los chicos de los riesgos?

    Por 

    Uriel Bederman

    Una acción sencilla puede contribuir a que el funcionamiento del navegador de Google funcione mejor. (Foto: Freepik).

    Ni formatear ni reiniciar: el truco para hacer que tu computadora funcione más rápido en segundos

    Los comentarios publicados en tn-ar.noticiadealagoas.com podrán ser reproducidos parcial o totalmente en la pantalla de Todo Noticias, como así también las imágenes de los autores.

    © 1996 - 2025, Artear

    Seguinos en las redes

    Descargate la app de TN

    google-playapp-store

    Últimas noticias

    • Cristina Kirchner, entre el baile del balcón y la crudeza de las redes
    • Boom de compras en el exterior: las razones detrás del récord de uso del servicio puerta a puerta
    • El día que los militares bombardearon Plaza de Mayo y quisieron matar a Perón: crónica de locura y destrucción
    • La lucha de un padre que crió solo a sus hijas tras la muerte de su esposa embarazada en la Tragedia de Once

    Secciones

    • Últimas noticias
    • Elecciones 2025
    • Mundial de Clubes
    • Deportivo
    • Show
    • Economía
    • Internacional
    • Opinión
    • Policiales
    • Política
    • Sociedad

    Sitios amigos

    • Grupo Clarín
    • Artear
    • eltrece
    • Ciudad Magazine
    • El Doce
    • Cucinare
    • Canal (á)
    • Clarín
    • Olé
    • Mitre
    • La 100
    • Cienradios
    • TyC Sports
    • La Voz
    • Vía País

    Descargate la app de TN

    google-playapp-store

    Seguinos en las redes

    © 1996 - 2025, Artear

    Mapa del sitio
    Términos y Condiciones
    Políticas de privacidad
    Media Kit