Recientemente Microsoft Research Asia, ha lanzado VASA-1. Un modelo avanzado que permite la creación de avatares que hablan y muy realistas a partir de una imagen estática y un clip de audio. Este proyecto podría cambiar las interacciones digitales, ofreciendo nuevas posibilidades para la comunicación humana y la interacción con inteligencias artificiales. ¡Te invitamos a seguir leyendo para descubrir qué es y qué funciones tiene!
VASA-1: un proyecto innovador de Microsoft
VASA-1 se distingue por su capacidad para producir movimientos de labios sincronizados perfectamente con el audio. Además de capturar una amplia gama de matices faciales y movimientos naturales de cabeza que aportan muchísima autenticidad. Este modelo representa un avance significativo en el campo de las tecnologías de IA enfocadas en la generación de expresiones humanas realistas. Aquí os compartimos un ejemplo de la Mona Lisa rapeando. ¡Es increíble lo auténtico que parece!
Microsoft just dropped VASA-1.
This AI can make single image sing and talk from audio reference expressively. Similar to EMO from Alibaba
10 wild examples:
1. Mona Lisa rapping Paparazzi pic.twitter.com/LSGF3mMVnD
— Min Choi (@minchoi) April 18, 2024
Características principales de VASA-1
La IA de Microsoft, VASA-1, destaca principalmente por varias características innovadoras:
- Realismo y vitalidad: VASA-1 no solo sincroniza los movimientos labiales con precisión sino que también reproduce expresiones faciales y gestos de cabeza que imitan fielmente los comportamientos humanos.
- Controlabilidad de la generación: permite un control detallado sobre los movimientos generados, ofreciendo la posibilidad de ajustar finamente la dirección de la mirada, la distancia de la cabeza a la cámara y la expresión emocional.
- Generalización fuera de distribución: es capaz de manejar entradas que no se encuentran en el conjunto de entrenamiento, como fotos artísticas o clips de audio en idiomas extranjeros.
- Poder de diferenciar las partes del rostro: VASA-1 logra una separación efectiva entre diferentes aspectos de los movimientos faciales. Esto permite manipulaciones específicas sin afectar otros atributos.
- Eficiencia en tiempo real: diseñado para operar en tiempo real con videos de alta calidad, lo que lo hace adecuado para aplicaciones en tiempo real como las comunicaciones en vivo y directo.
¿Cuál es el potencial de VASA-1 en diferentes sectores?
El potencial de VASA-1 para transformar diversos sectores es considerable. En el sector educativo, podría mejorar la interactividad de los sistemas de aprendizaje virtual mediante tutores IA que responden y se comportan como humanos. En la salud, podría facilitar la comunicación entre pacientes y profesionales médicos con avatares que ofrecen una presencia tranquilizadora y empática.
10. Realism and liveliness – example 2 pic.twitter.com/ZaS3MYJbTm
— Min Choi (@minchoi) April 18, 2024
En el vídeo se puede ver cómo el avatar realiza gestos muy naturales. Todo esto, ha sido generado con una simple imagen y un audio.
Posibles riesgos de uso de VASA-1 según Microsoft
Microsoft es consciente de los riesgos potenciales de mal uso de tecnologías como VASA-1, especialmente en lo que respecta a la suplantación de identidad humana. La empresa se compromete a evitar que su tecnología se utilice para crear contenidos engañosos. Actualmente, los videos generados por VASA-1 contienen detalles identificables que señalan que aún no se alcanza una autenticidad completa.
El compromiso de Microsoft con el desarrollo responsable de la IA subraya la importancia de usar esta tecnología para avanzar en el bienestar humano, destacando aplicaciones como mejorar la equidad educativa y la accesibilidad comunicativa.
Microsoft ha decidido no lanzar ninguna demostración, API, producto o detalles de implementación adicionales hasta estar seguros de que la tecnología se utilizará de manera responsable y acorde con las regulaciones apropiadas.
VASA-1 podría revolucionar muchos sectores como la educación, publicidad, Marketing, entre otros. Pero a día de hoy, no va a ser posible utilizar. Ahora bien, si algún día se abre al público general, ¿cómo crees que VASA-1 podría impactar tu vida o tu campo de trabajo? ¡Compártenos tu opinión en los comentarios!
Fuente de la noticia: https://www.microsoft.com/en-us/research/project/vasa-1/
Si te ha gustado la noticia, no te puedes perder: Limitless Pendant el asistente personal de IA portátil para escuchar todo