Connect with us

Ciencia y tecnología

VASA-1 de Microsoft puede simular una persona con una foto y una pista de audio

Published

on

VASA-1 de Microsoft puede simular una persona con una foto y una pista de audio
Agrandar / Una imagen de muestra de Microsoft para «VASA-1: caras parlantes realistas impulsadas por audio generadas en tiempo real».

El martes, Microsoft Research Asia reveló VASA-1, un modelo de IA capaz de crear un vídeo animado sincronizado de una persona hablando o cantando a partir de una única foto y una pista de audio existente. En el futuro, podría impulsar avatares virtuales que se muestren localmente y no requieran una transmisión de video, o permitir que cualquier persona con herramientas similares tome una foto de alguien encontrado en línea y les dé la sensación de que dice lo que quiere.

«Esto allana el camino para interacciones en tiempo real con avatares realistas que imitan los comportamientos conversacionales humanos», se lee en el resumen del estudio. trabajo de investigación adjunto titulado «VASA-1: Caras parlantes realistas generadas por audio generadas en tiempo real». Es obra de Sicheng Xu, Guojun Chen, Yu-Xiao Guo, Jiaolong Yang, Chong Li, Zhenyu Zang, Yizhong Zhang, Xin Tong y Baining Guo.

El marco VASA (abreviatura de “Visual Affective Skills Animator”) utiliza el aprendizaje automático para analizar una imagen estática y un clip de audio de voz. Luego es capaz de generar un vídeo realista con expresiones faciales precisas, movimientos de cabeza y sincronización de labios con audio. No clona ni simula voces (como otras investigaciones de Microsoft), sino que se basa en una entrada de audio existente que puede grabarse o hablarse especialmente para un propósito particular.

Microsoft afirma que el modelo supera significativamente a los métodos anteriores de animación de voz en términos de realismo, expresividad y eficacia. A nosotros, esto nos parece una mejora con respecto a los modelos de animación de un solo cuadro anteriores.

READ  Spotify renueva su aplicación con transmisiones de descubrimiento estilo TikTok, Smart Shuffle para listas de reproducción y más

Los esfuerzos de investigación de IA para animar una sola foto de una persona o personaje se remontan al menos a algunos años, pero más recientemente, los investigadores han trabajado para sincronizar automáticamente un video generado con una pista de audio. En febrero, un modelo de IA llamado EMO: Gesto de retrato viviente del grupo de investigación del Instituto de Computación Inteligente de Alibaba ha causado sensación con un enfoque similar al VASA-1 que puede sincronizar automáticamente una foto animada con una pista de audio proporcionada (lo llaman «Audio2Video»).

Capacitado en clips de YouTube.

Los investigadores de Microsoft entrenaron VASA-1 en el Conjunto de datos VoxCeleb2 creado en 2018 por tres investigadores de la Universidad de Oxford. Este conjunto de datos contiene “más de un millón de declaraciones de 6.112 celebridades”, según el sitio web VoxCeleb2, extraídas de vídeos subidos a YouTube. VASA-1 sería capaz de generar videos con una resolución de 512 x 512 píxeles a hasta 40 cuadros por segundo con una latencia mínima, lo que significa que podría usarse para aplicaciones en tiempo real como videoconferencias.

Para mostrar el modelo, Microsoft creó una página de investigación VASA-1 que muestra muchos ejemplos de vídeos de la herramienta en acción, incluidas personas cantando y hablando en sincronización con pistas de audio pregrabadas. Muestran cómo se puede controlar el modelo para expresar diferentes estados de ánimo o cambiar su apariencia. Los ejemplos también incluyen generaciones más elegantes, como Mona Lisa rapeando sobre una pista de audio de Anne Hathaway interpretando una Canción “Paparazzi” sobre Conan O'Brien.

READ  ¿El año de Windows en Arm? Google lanza versiones oficiales de Chrome.

Los investigadores dicen que, por razones de privacidad, cada fotografía de muestra en su página fue generada por IA. EstiloGAN2 o DALL-E 3 (aparte de la Mona Lisa). Pero está claro que la técnica también podría aplicarse a fotografías de personas reales, aunque es probable que funcione mejor si una persona parece una celebridad en el conjunto de datos de entrenamiento. Aún así, los investigadores dicen que su intención no es manipular a humanos reales.

«Exploramos la generación de habilidades visuales y afectivas para personajes virtuales e interactivos [sic], NO te hagas pasar por nadie en el mundo real. Esto es sólo una demostración de investigación y no hay planes de lanzamiento de productos ni API”, se lee en el sitio.

Si bien los investigadores de Microsoft promocionan posibles aplicaciones positivas, como mejorar la equidad educativa, mejorar la accesibilidad y brindar apoyo terapéutico, la tecnología también podría ser fácilmente utilizada indebidamente. Por ejemplo, podría permitir a las personas simular chats de vídeo, hacer que parezca que personas reales están diciendo cosas que en realidad nunca dijeron (especialmente cuando se combinan con una pista de voz clonada) o autorizar el acoso basado en una sola foto en las redes sociales.

En este momento, el video generado todavía parece imperfecto en algunos aspectos, pero podría ser bastante atractivo para algunas personas si no supieran qué esperar de la animación generada por IA. Los investigadores dicen que son conscientes de esto, razón por la cual no publican abiertamente el código que impulsa el modelo.

«Nos oponemos a cualquier comportamiento destinado a crear contenido engañoso o perjudicial para personas reales y nos gustaría aplicar nuestra técnica para avanzar en la detección de falsificaciones», escriben los investigadores. «Actualmente, los vídeos generados con este método todavía contienen artefactos identificables, y el análisis digital muestra que todavía hay una brecha para lograr la autenticidad de los vídeos reales».

READ  HTC Vive Air no es un auricular real, pero tiene una gran idea

VASA-1 es sólo una demostración de investigación, pero Microsoft está lejos de ser el único grupo que desarrolla una tecnología similar. Si nos basamos en la historia reciente de la IA generativa, es potencialmente sólo cuestión de tiempo antes de que una tecnología similar se convierta en código abierto y esté disponible gratuitamente, y lo más probable es que su realismo siga mejorando con el tiempo.

Soy un profesional de gestión deportiva con conocimientos adecuados sobre la industria del deporte en España. Tengo varias habilidades que me han ayudado a trabajar en diferentes sectores del deporte en España, incluyendo eventos deportivos, desarrollo de base para el deporte e infraestructura deportiva.

Continue Reading
Click to comment

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Ciencia y tecnología

La fuga de Pixel 9, 9 Pro, 9 Pro XL y 9 Pro Fold sugiere colores apagados

Published

on

La fuga de Pixel 9, 9 Pro, 9 Pro XL y 9 Pro Fold sugiere colores apagados

Los nombres codificados por colores de los próximos dispositivos de Google a menudo se filtran mucho antes que los recursos oficiales o las imágenes en vivo. Hoy, los colores de Pixel 9, Pixel 9 Pro, Pixel 9 Pro XL y Pixel 9 Pro Fold van de la mano con los fondos de pantalla.

Nombres codificados por colores, que es posible que no todos se publiquen o cambien antes de esta fecha, compartidos por Autoridad de Android están:

Píxel 9

  • Obsidiana
  • Porcelana
  • Jade
  • Peonía

Píxeles 9 Pro y 9 Pro XL

  • Obsidiana
  • Porcelana
  • Avellana
  • Rosa

Píxel 9 Pro plegable

  • Obsidiana
  • Porcelana u “oro”

La obsidiana es de un negro simple, como se ve en imágenes en vivo filtradas. Una cosa a tener en cuenta es el papel que desempeñarán los acabados brillante (Pixel 9) y mate (Pixel 9 Pro) en el panel posterior.

La porcelana es la otra cosa que estos cuatro teléfonos tienen en común. En el Pixel 8a (visto arriba), se inclina mucho hacia el beige en lugar del blanco brillante.

En términos de colores únicos, tenemos a Jade en el Pixel 9. El año pasado, Jade terminó siendo un color avellana oscuro en el Pixel 8 que podría confundirse con gris. Era incluso más oscuro que el Hazel del 7 Pro. Peony sería otra repetición que resultaría en Rose en el lanzamiento.

Píxel 7 Pro, Píxel 8

En la serie Pixel 9 Pro, tenemos a Hazel y Rose. Estos son, en particular, los colores finales de lanzamiento del teléfono pequeño del año pasado. Sin embargo, si estos son solo nombres en clave hoy, eso sugiere que el color/nombre será diferente en el lanzamiento.

READ  Samsung clona la pantalla de bloqueo de iOS 16 en la última actualización de OneUI

Ambos serían un poco más discretos que el Mint and Bay que tenemos hoy en el 8 Pro, y Google no espera opacar la vitalidad que ayudó al Pixel 8 Pro azul a destacarse. El rosa definitivamente no se ve tan atrevido como el coral del Pixel 7a.

Píxel 7a, Píxel 8

En la parte frontal del Pixel 9 Pro Fold, nos preparamos para una posible repetición con la porcelana actual definitivamente teñida de oro en mis ojos.

Plegado de píxeles

FTC: Utilizamos enlaces de afiliados automáticos que generan ingresos. Más.

Continue Reading

Ciencia y tecnología

Según se informa, iOS 17.5 resurge imágenes que fueron eliminadas hace años

Published

on

Según se informa, iOS 17.5 resurge imágenes que fueron eliminadas hace años

Un error en iOS 17.5 haría que las fotos eliminadas hace años resurjan para algunos usuarios de iPhone, dice a publicaciones en Reddit. Los usuarios de iPhone afectados afirman que después de la actualización a iOS 17.5, lanzada el lunes, hace años se eliminaron varias imágenes de la aplicación Fotos.

17 de mayo de 2024 actualizar a continuación…

iOS 17.5 tiene un problema bastante grande con la aplicación Fotos

Las imágenes en cuestión aparecerían como las imágenes más recientes en la aplicación Fotos después de instalar iOS 17.5. Un usuario dice:

Durante una conversación con mi pareja, fui a enviar una foto y vi que las últimas fotos eran material NSFW que hicimos hace años cuando vivíamos separados. ¿Se eliminó permanentemente hace años, pero mágicamente ha vuelto?

Revisé mi iPad y también tiene fotos (obras de arte que hice hace años). Me siento tan incómodo.

«Lo mismo ocurre. Tengo cuatro fotos de 2010 que reaparecen como las últimas fotos cargadas en iCloud. Las he eliminado varias veces», escribió otro usuario en el hilo de Reddit.

Hay varios informes de situaciones similares en el hilo de Reddit. Algunos usuarios ven reaparecer en sus bibliotecas imágenes eliminadas de hace años, mientras que otros ven imágenes de principios de este año.

De forma predeterminada, la aplicación Fotos tiene una función «Eliminadas recientemente» que mantiene las imágenes eliminadas durante 30 días. Eso no es lo que está sucediendo aquí, ya que la mayoría de las imágenes en cuestión tienen meses o años, no días.

Apple no ha comentado sobre el tema, pero surge naturalmente innumerable inquietudes y preguntas sobre privacidad y retención de datos. Algunos usuarios de Reddit creen que iOS 17.5 puede haber realizado cambios en la aplicación Fotos que requirieron que la aplicación reindexara las bibliotecas de fotos.

READ  Spotify renueva su aplicación con transmisiones de descubrimiento estilo TikTok, Smart Shuffle para listas de reproducción y más

Aún así, incluso si la aplicación Fotos se somete a algún tipo de proceso de reindexación en iOS 17.5, no hay excusa para que reaparezcan las imágenes que los usuarios pensaban que habían sido eliminadas.

¿Has notado que reaparecen imágenes antiguas en tu aplicación Fotos después de actualizar a iOS 17.5? Háganos saber en los comentarios.

Actualizado el 17 de mayo de 2024:

Como usuario en Reddit reclamos que sus fotos antiguas reaparecieron en un iPad que vendieron, tengo razones para creer que esta afirmación no es cierta.

Apple aún tiene que comentar sobre estos informes. Actualizaremos esta historia a medida que surjan más detalles.

FTC: Utilizamos enlaces de afiliados automáticos que generan ingresos. Más.

Continue Reading

Ciencia y tecnología

Una interrupción global afectó al iPhone iMessage anoche

Published

on

Una interrupción global afectó al iPhone iMessage anoche

No eres tú, es Apple.

Si no recibiste un mensaje de texto ayer, es porque iMessage no estuvo disponible durante aproximadamente una hora.

Poco después de las 6 p. m. del jueves por la noche, se informaron más de 14.000 interrupciones de iMessage, según Outage Tracker. detector de fallas.


El sitio web System Status de Apple informó un problema con iMessage, pero dice que ya se resolvió. DenPhoto – stock.adobe.com

Algunos usuarios recibieron un mensaje de «No entregado» al intentar utilizar la aplicación, y otros se vieron obligados a enviar un texto que no era de iMessage con la temida burbuja verde.

oficial de Apple Estado del sistema El rastreador marcó el problema de iMessage como «resuelto» alrededor de las 7:30 p. m. del jueves, y señaló que algunos usuarios no pudieron utilizar el servicio entre las 5:49 p. m. y las 6:35 p. m.

El rastreador también dijo que los usuarios estaban experimentando problemas con Apple Messages for Business y FaceTime.

También se han informado cortes en Canadá y el Reino Unido.

No está claro qué causó las interrupciones, pero algunos usuarios informaron haber logrado reenviar mensajes.

El Post se ha puesto en contacto con Apple para solicitar comentarios.

Algunos usuarios también acudieron en masa a X, anteriormente Twitter, para expresar su frustración por la interrupción.


Una persona sosteniendo un iPhone.
Al menos 500 australianos han informado problemas con su servicio iMessage a Down Detector en las últimas 24 horas. chinnarach – stock.adobe.com

«Apple está arruinando las relaciones al desactivar iMessage», una persona bromeó.

“El mensaje está roto. besa la burbuja verde”, otro a escrito.

«No es de extrañar que iMessage no haya respondido en 2 semanas», alguien más bromeó.

Continue Reading

Trending