Connect with us

Ciencia y tecnología

Google lleva la IA a Google Messages, Android Auto, Wear OS y más

Published

on

Google lleva la IA a Google Messages, Android Auto, Wear OS y más

Créditos de imagen: Sean Gallup/Getty Images

La implementación de Gemini por parte de Google para la generación de imágenes con IA es objeto de muchas críticas. Pero eso no impide que el gigante de las búsquedas y los dispositivos móviles se suba a la ola de la IA y la implemente en más servicios. Hoy, Google anunció un nuevo conjunto de funciones para teléfonos, automóviles y dispositivos portátiles: use Gemini para crear mensajes, subtítulos de imágenes generados por IA, resumir texto a través de IA para Android Auto, así como acceso a pases en Wear OS.

Las nuevas funciones se revelaron en el Mobile World Congress (MWC) de Barcelona, ​​un evento en el que Google, como empresa detrás de Android, ha desempeñado un papel importante durante años.

La compañía anunció que a partir de esta semana, Google Messages obtendrá una función que le permitirá acceder a Gemini dentro de la aplicación. La función se encuentra actualmente en versión beta y solo es compatible con inglés.

Google también está implementando una función para Android Auto que lee resúmenes de mensajes de texto largos y contextualiza los chats grupales. Anunciada por primera vez el mes pasado, la función también ofrece respuestas rápidas sugeridas.

El gigante de las búsquedas también está lanzando algunas funciones relacionadas con la accesibilidad en el MWC. En primer lugar, la aplicación Lookout de la compañía, que ayuda a las personas con discapacidad visual con cosas como etiquetas de alimentos y documentos, ahora generará subtítulos con tecnología de inteligencia artificial para imágenes con subtítulos o texto alternativo faltantes o inexactos. La función ahora se está implementando para todos los usuarios de todo el mundo con soporte en inglés. El año pasado, Google actualizó la aplicación Lookout con un asistente basado en inteligencia artificial, que permitía a los usuarios hacer preguntas sobre imágenes.

READ  Genial, ahora Google tiene un terrorífico generador de imágenes con IA

Google también está implementando soporte mejorado para lectores de pantalla para Lens en Maps. Los usuarios pueden apuntar la cámara de su teléfono a su alrededor y TalkBack leerá información sobre lugares y señales.

En el frente de la productividad, Google está ampliando el soporte para notas escritas a mano en documentos en teléfonos o tabletas Android usando solo un dedo o un lápiz. Puede elegir entre diferentes estilos y colores de lápiz para resaltar ciertos puntos de un documento.

Además, la compañía está lanzando soporte para Spotify a través de un conmutador de salida en la pantalla de inicio de Android. Esto significa que puedes volver a escuchar una canción o un podcast de una fuente a otra con Spotify. Anteriormente, esta función solo era compatible con YouTube Music.

Google también está actualizando la aplicación de Fitbit con soporte para obtener datos de diferentes fuentes como AllTrails, Oura Ring y MyFitnessPal. La compañía rediseñó la aplicación con un nuevo diseño de tres pestañas el año pasado. La pestaña Hoy muestra datos como ejercicio, pasos, calorías quemadas y pisos subidos. Y la pestaña «Tú» te muestra datos de diferentes aplicaciones, así como los datos propios de Fitbit.

También hay algunas actualizaciones relacionadas con Wear OS como parte de este anuncio. Ahora puede acceder a pases de Google Wallet, como tarjetas de embarque, entradas para eventos, membresías de gimnasios y tarjetas de fidelidad, directamente desde el reloj. Además, puede obtener indicaciones para el transporte público mediante la voz. Además, existe una opción para reflejar las direcciones del teléfono u obtener instrucciones de navegación guiadas por una brújula.

READ  Práctico iPhone 14 Pro: nuevos colores, Dynamic Island en acción y más [Videos]

Soy un profesional de gestión deportiva con conocimientos adecuados sobre la industria del deporte en España. Tengo varias habilidades que me han ayudado a trabajar en diferentes sectores del deporte en España, incluyendo eventos deportivos, desarrollo de base para el deporte e infraestructura deportiva.

Continue Reading
Click to comment

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Ciencia y tecnología

Nothing Phone (2) y los auriculares se benefician de la integración ChatGPT

Published

on

Nothing Phone (2) y los auriculares se benefician de la integración ChatGPT

Tras el lanzamiento de Nothing Ear y Ear(a) esta semana, Nothing también está lanzando una nueva actualización para Nothing Phone(2) que trae muchas actualizaciones, incluida la integración ChatGPT.

Nothing OS 2.5.5 se está implementando ahora en Phone (2), todavía no en Phone (1) y Phone (2a), con varias incorporaciones nuevas. Hay soporte para UltraHDR de Android (llamado «Ultra XDR» en los teléfonos Nothing), una opción de refuerzo de RAM, un nuevo widget de grabadora, un nuevo widget de batería y más.

Sin embargo, la mayor incorporación es la integración nativa de ChatGPT en los productos Nothing.

Nothing Phone (2) obtendrá algunos widgets con ChatGPT, uno para entrada de voz y el otro para texto, y habrá un nuevo botón en la captura de pantalla y en las ventanas emergentes del portapapeles para importar este contenido a ChatGPT.

Nada explica:

Se agregaron nuevos widgets de ChatGPT para iniciar ChatGPT en diferentes modos desde su pantalla de inicio para un acceso más rápido.

Se agregó un botón en la ventana emergente de captura de pantalla y portapapeles para pegar contenido directamente en una nueva conversación en ChatGPT.

La integración de Nothing's ChatGPT también se extiende a Ear y Ear(a). Debes estar emparejado con un teléfono Nothing, pero una vez emparejados, ambos auriculares pueden iniciar chats de voz con ChatGPT sin tener que quitar el teléfono.

EL El registro de cambios completo para Nothing OS 2.5.5 está disponible en el sitio web de Nothing Ahora.

Obtenga más información sobre Nada:

Sigue a Ben: Gorjeo/X, TemasY Instagram

Continue Reading

Ciencia y tecnología

VASA-1 de Microsoft puede simular una persona con una foto y una pista de audio

Published

on

VASA-1 de Microsoft puede simular una persona con una foto y una pista de audio
Agrandar / Una imagen de muestra de Microsoft para «VASA-1: caras parlantes realistas impulsadas por audio generadas en tiempo real».

El martes, Microsoft Research Asia reveló VASA-1, un modelo de IA capaz de crear un vídeo animado sincronizado de una persona hablando o cantando a partir de una única foto y una pista de audio existente. En el futuro, podría impulsar avatares virtuales que se muestren localmente y no requieran una transmisión de video, o permitir que cualquier persona con herramientas similares tome una foto de alguien encontrado en línea y les dé la sensación de que dice lo que quiere.

«Esto allana el camino para interacciones en tiempo real con avatares realistas que imitan los comportamientos conversacionales humanos», se lee en el resumen del estudio. trabajo de investigación adjunto titulado «VASA-1: Caras parlantes realistas generadas por audio generadas en tiempo real». Es obra de Sicheng Xu, Guojun Chen, Yu-Xiao Guo, Jiaolong Yang, Chong Li, Zhenyu Zang, Yizhong Zhang, Xin Tong y Baining Guo.

El marco VASA (abreviatura de “Visual Affective Skills Animator”) utiliza el aprendizaje automático para analizar una imagen estática y un clip de audio de voz. Luego es capaz de generar un vídeo realista con expresiones faciales precisas, movimientos de cabeza y sincronización de labios con audio. No clona ni simula voces (como otras investigaciones de Microsoft), sino que se basa en una entrada de audio existente que puede grabarse o hablarse especialmente para un propósito particular.

Microsoft afirma que el modelo supera significativamente a los métodos anteriores de animación de voz en términos de realismo, expresividad y eficacia. A nosotros, esto nos parece una mejora con respecto a los modelos de animación de un solo cuadro anteriores.

READ  Netflix está probando un temporizador para dormir para tus convulsiones nocturnas

Los esfuerzos de investigación de IA para animar una sola foto de una persona o personaje se remontan al menos a algunos años, pero más recientemente, los investigadores han trabajado para sincronizar automáticamente un video generado con una pista de audio. En febrero, un modelo de IA llamado EMO: Gesto de retrato viviente del grupo de investigación del Instituto de Computación Inteligente de Alibaba ha causado sensación con un enfoque similar al VASA-1 que puede sincronizar automáticamente una foto animada con una pista de audio proporcionada (lo llaman «Audio2Video»).

Capacitado en clips de YouTube.

Los investigadores de Microsoft entrenaron VASA-1 en el Conjunto de datos VoxCeleb2 creado en 2018 por tres investigadores de la Universidad de Oxford. Este conjunto de datos contiene “más de un millón de declaraciones de 6.112 celebridades”, según el sitio web VoxCeleb2, extraídas de vídeos subidos a YouTube. VASA-1 sería capaz de generar videos con una resolución de 512 x 512 píxeles a hasta 40 cuadros por segundo con una latencia mínima, lo que significa que podría usarse para aplicaciones en tiempo real como videoconferencias.

Para mostrar el modelo, Microsoft creó una página de investigación VASA-1 que muestra muchos ejemplos de vídeos de la herramienta en acción, incluidas personas cantando y hablando en sincronización con pistas de audio pregrabadas. Muestran cómo se puede controlar el modelo para expresar diferentes estados de ánimo o cambiar su apariencia. Los ejemplos también incluyen generaciones más elegantes, como Mona Lisa rapeando sobre una pista de audio de Anne Hathaway interpretando una Canción “Paparazzi” sobre Conan O'Brien.

READ  SpaceX Starship aterriza verticalmente, luego explota en la prueba final

Los investigadores dicen que, por razones de privacidad, cada fotografía de muestra en su página fue generada por IA. EstiloGAN2 o DALL-E 3 (aparte de la Mona Lisa). Pero está claro que la técnica también podría aplicarse a fotografías de personas reales, aunque es probable que funcione mejor si una persona parece una celebridad en el conjunto de datos de entrenamiento. Aún así, los investigadores dicen que su intención no es manipular a humanos reales.

«Exploramos la generación de habilidades visuales y afectivas para personajes virtuales e interactivos [sic], NO te hagas pasar por nadie en el mundo real. Esto es sólo una demostración de investigación y no hay planes de lanzamiento de productos ni API”, se lee en el sitio.

Si bien los investigadores de Microsoft promocionan posibles aplicaciones positivas, como mejorar la equidad educativa, mejorar la accesibilidad y brindar apoyo terapéutico, la tecnología también podría ser fácilmente utilizada indebidamente. Por ejemplo, podría permitir a las personas simular chats de vídeo, hacer que parezca que personas reales están diciendo cosas que en realidad nunca dijeron (especialmente cuando se combinan con una pista de voz clonada) o autorizar el acoso basado en una sola foto en las redes sociales.

En este momento, el video generado todavía parece imperfecto en algunos aspectos, pero podría ser bastante atractivo para algunas personas si no supieran qué esperar de la animación generada por IA. Los investigadores dicen que son conscientes de esto, razón por la cual no publican abiertamente el código que impulsa el modelo.

«Nos oponemos a cualquier comportamiento destinado a crear contenido engañoso o perjudicial para personas reales y nos gustaría aplicar nuestra técnica para avanzar en la detección de falsificaciones», escriben los investigadores. «Actualmente, los vídeos generados con este método todavía contienen artefactos identificables, y el análisis digital muestra que todavía hay una brecha para lograr la autenticidad de los vídeos reales».

READ  Los fanáticos pensaron que PlayStation estaba provocando la compatibilidad con versiones anteriores de PS1, PS2, PS3, pero es solo un nuevo anuncio

VASA-1 es sólo una demostración de investigación, pero Microsoft está lejos de ser el único grupo que desarrolla una tecnología similar. Si nos basamos en la historia reciente de la IA generativa, es potencialmente sólo cuestión de tiempo antes de que una tecnología similar se convierta en código abierto y esté disponible gratuitamente, y lo más probable es que su realismo siga mejorando con el tiempo.

Continue Reading

Ciencia y tecnología

El gamepad Kishi Ultra de Razer funciona con casi todo, incluidos algunos plegables

Published

on

El gamepad Kishi Ultra de Razer funciona con casi todo, incluidos algunos plegables

Razer acaba de lanzar el , sucesor del popular . Está repleto de mejoras, incluido un factor de forma más grande para acomodar dispositivos móviles más robustos como tabletas de 8 pulgadas e incluso algunos plegables. El controlador también ofrece compatibilidad con USB-C, por lo que debería funcionar con casi cualquier dispositivo, siempre que sea adecuado. Recuerde, incluso los productos Apple modernos.

Razer dice que el controlador fue «diseñado para ofrecer una experiencia de consola auténtica en la serie iPhone 15, iPad Mini y tabletas Android con pantallas de 8 pulgadas». Para ello, cuenta con la tecnología háptica Sensa HD patentada por la compañía, que incluye una bobina háptica cerca de cada mano para aumentar la inmersión. La compañía afirma que esta experiencia superará la que se encuentra con los controladores de consola tradicionales. El nuevo SDK de Interhaptics incluso permitirá a los desarrolladores «crear experiencias hápticas personalizadas».

Esta inmersión se mejora aún más con la integración con el sistema de iluminación Chroma RGB de Razer. Esto permite esquemas de iluminación personalizables, lo que permite a los jugadores llevar consigo «parte de la configuración de su sala de juegos». Más allá de la iluminación y la háptica, el controlador presenta los botones ABXY Mecha-Tactile patentados de la compañía y un D-pad de 8 direcciones. Hay disparadores de efecto Hall del tamaño de una consola, botones multifunción programables L4/R4 y joysticks de tamaño completo, completos con anillos antifricción. El factor de forma ampliado también significa que debería funcionar con la mayoría de los dispositivos sin tener que quitar la carcasa.

Una imagen que muestra el controlador Nexus y la aplicación.

Razer

El controlador puede acceder a la aplicación Nexus sin suscripción de Razer, que genera una asignación de botones personalizada para miles de juegos compatibles en iOS y Android. Esto significa que será una experiencia plug and play para la gran mayoría del contenido disponible, sin tener que manipular la configuración de control. Además, la aplicación Nexus permite a los usuarios grabar y compartir juegos.

READ  Genial, ahora Google tiene un terrorífico generador de imágenes con IA

El Razer Kishi Ultra está disponible ahora y cuesta $150. Al controlador se le suma una versión actualizada del Kishi V2, que ahora se conecta a través de USB-C. Éste cuesta $100.

Esta publicación contiene enlaces afiliados; Si hace clic en dicho enlace y realiza una compra, podemos ganar una comisión.

Continue Reading

Trending