Connect with us

Ciencia y tecnología

PaLM-E de Google es un cerebro robótico de propósito general que recibe órdenes – Ars Technica

Published

on

PaLM-E de Google es un cerebro robótico de propósito general que recibe órdenes – Ars Technica
Agrandar / Un brazo robótico controlado por PaLM-E agarra una bolsa de papas fritas en un video de demostración.

Búsqueda de Google

El lunes, un grupo de investigadores de inteligencia artificial de Google y la Universidad Técnica de Berlín dio a conocer PALMEADOun modelo multimodal de lenguaje visual incorporado (VLM) con 562 mil millones configuraciones que integra visión y lenguaje para control robótico. Afirman que es el VLM más grande jamás desarrollado y puede realizar una variedad de tareas sin necesidad de volver a capacitarse.

Según Google, cuando se le da un comando de alto nivel, como «tráeme los chips de arroz del cajón», PaLM-E puede generar un plan de acción para una plataforma de robot móvil con un brazo (desarrollado por Google Robotics) y realizar el acciones mismas.

PaLM-E hace esto mediante el análisis de datos de la cámara del robot sin necesidad de una representación de escena preprocesada. Esto elimina la necesidad de que un ser humano preprocese o anote los datos y permite un control robótico más autónomo.

En un video de demostración proporcionado por Google, PaLM-E realiza «Tráeme los chips de arroz del cajón», que incluye varios pasos de planificación, así como la integración de comentarios visuales de la cámara del robot.https://cdn.arstechnica.net/wp-content/uploads/2023/03/planning_4x_compressed.mp4?_=1

En un video de demostración proporcionado por Google, PaLM-E realiza «Tráeme los chips de arroz del cajón», que incluye varios pasos de planificación, así como la integración de comentarios visuales de la cámara del robot.

También es resistente y puede reaccionar a su entorno. Por ejemplo, el modelo PaLM-E puede guiar a un robot para obtener una bolsa de papas fritas de una cocina, y con PaLM-E integrado en el circuito de control, se vuelve resistente a las interrupciones que pueden ocurrir durante la tarea. En un ejemplo de video, un investigador agarra las fichas del robot y las mueve, pero el robot localiza las fichas y las recupera.

READ  Google Discover aparece en YouTube en el carrusel "Videos cortos"

Dentro otro ejemplo, el mismo modelo PaLM-E controla de forma autónoma un robot a través de tareas con secuencias complejas que antes requerían la guía humana. de Google trabajo de investigación explica cómo PaLM-E transforma las instrucciones en acciones:

Demostramos el rendimiento de PaLM-E en tareas de manipulación móvil desafiantes y diversas. Seguimos en gran medida la configuración de Ahn et al. (2022), donde el robot tiene que planificar una secuencia de acciones de navegación y manipulación en base a una instrucción de un humano. Por ejemplo, dada la instrucción «Derramé mi bebida, ¿puedes traerme algo para limpiarla?», el robot debe planificar una secuencia que contenga «1. Encuentra una esponja, 2. Recoge la esponja, 3. Trae al usuario, 4. Deja la esponja». Inspirándonos en estas tareas, desarrollamos 3 casos de uso para probar las capacidades de razonamiento incorporadas de PaLM-E: predicción de disponibilidad, detección de fallas y planificación a largo plazo. Las políticas de bajo nivel provienen de RT-1 (Brohan et al., 2022), un modelo de transformador que toma imágenes RGB e instrucciones en lenguaje natural, y genera comandos de control de efectores finales.

PaLM-E es un próximo predictor de token, y se llama «PaLM-E» porque se basa en el modelo de lenguaje extendido (LLM) existente de Google llamado «Palmera(que es similar a la tecnología detrás de ChatGPT). Google hizo que PaLM se «incorporara» agregando información sensorial y control robótico.

Dado que se basa en un modelo de lenguaje, PaLM-E toma observaciones continuas, como imágenes o datos de sensores, y las codifica en una secuencia de vectores que tienen el mismo tamaño que los tokens de lenguaje. Esto permite que el modelo «entienda» la información sensorial de la misma manera que procesa el lenguaje.

READ  El CEO de OnePlus confirma que el primer reloj inteligente de la compañía llegará a principios del próximo año
Un video de demostración proporcionado por Google que muestra un robot guiado por PaLM-E siguiendo la instrucción «Tráeme una estrella verde». Los investigadores dicen que la estrella verde «es un objeto al que este robot no estuvo expuesto directamente».https://cdn.arstechnica.net/wp-content/uploads/2023/03/green_star.mp4?_=2

Un video de demostración proporcionado por Google que muestra un robot guiado por PaLM-E siguiendo la instrucción «Tráeme una estrella verde». Los investigadores dicen que la estrella verde «es un objeto al que este robot no estuvo expuesto directamente».

Ademas de Transformador robótico RT-1PaLM-E se basa en el trabajo anterior de Google en Vit-22B, un modelo de Vision Transformer revelado en febrero. ViT-22B ha sido entrenado en varias tareas visuales, como clasificación de imágenes, detección de objetos, segmentación semántica y subtítulos de imágenes.

Google Robotics no es el único grupo de investigación que trabaja en control robótico con redes neuronales. Este trabajo en particular se parece al reciente artículo «ChatGPT for Robotics» de Microsoft, que experimentó con la combinación de datos visuales y modelos de lenguaje grandes para el control robótico de una manera similar.

Dejando a un lado la robótica, los investigadores de Google observaron varios efectos interesantes que aparentemente se derivan del uso de un modelo de lenguaje grande como núcleo de PaLM-E. Por un lado, exhibe una «transferencia positiva», lo que significa que puede transferir el conocimiento y las habilidades que ha adquirido de una tarea a otra, lo que resulta en un «rendimiento significativamente superior» en comparación con los modelos de robots de una sola tarea.

READ  Intel Core i9-13900K ocupa el primer lugar como el procesador de subproceso único más rápido en PassMark Benchmark

Además, ellos observado una tendencia en todo el modelo: «Cuanto más grande es el modelo de lenguaje, más conserva sus capacidades lingüísticas cuando se entrena en lenguaje visual y tareas robóticas; cuantitativamente, el Modelo 562B PaLM-E conserva casi todas sus habilidades lingüísticas».

Y los investigadores afirmar que PaLM-E presenta capacidades emergentes como la cadena multimodal de razonamiento de pensamiento (que permite que el modelo analice una secuencia de entradas que incluyen información tanto lingüística como visual) e inferencia de múltiples imágenes (usando múltiples imágenes como entrada para hacer una inferencia o predicción) aunque se entrenó solo en indicaciones de una sola imagen. En este sentido, PaLM-E parece continuar la tendencia surgen sorpresas a medida que los modelos de aprendizaje profundo se vuelven más complejos con el tiempo.

Los investigadores de Google planean explorar más aplicaciones de PaLM-E para escenarios del mundo real, como la automatización del hogar o la robótica industrial. Y esperan que PaLM-E inspire más investigaciones sobre el razonamiento multimodal y la IA incorporada.

“Multimodal” es una palabra de moda que escucharemos cada vez más a medida que las empresas busquen una inteligencia artificial general que aparentemente pueda realizar tareas generales como un ser humano.

Soy un profesional de gestión deportiva con conocimientos adecuados sobre la industria del deporte en España. Tengo varias habilidades que me han ayudado a trabajar en diferentes sectores del deporte en España, incluyendo eventos deportivos, desarrollo de base para el deporte e infraestructura deportiva.

Continue Reading
Click to comment

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Ciencia y tecnología

Take-Two compra Gearbox Entertainment a Embracer por 460 millones de dólares

Published

on

Take-Two compra Gearbox Entertainment a Embracer por 460 millones de dólares

Embracer Group ha vendido Gearbox Entertainment de su grupo de estudios de videojuegos y Take-Two Interactive compró la compañía por 460 millones de dólares. La venta es parte de la reestructuración masiva y en curso de Embracer destinada a reducir costos después de que un acuerdo planeado por 2 mil millones de dólares con Savvy Games Group, respaldado por Arabia Saudita, fracasara en 2023. La venta se produce tres años después de que Embracer adquiriera Gearbox por 1.3 mil millones de dólares en 2021.

La medida significa que Embracer ya no posee las entidades de desarrollo de Gearbox, como Gearbox Software, Gearbox Montreal y Gearbox Studio Quebec, ni franquicias como Borderlands/Tiny Tina's Wonderlands, Homeworld, Risk of Rain, Brothers in Arms y Duke Nukem. Estos activos serán adquiridos por Take-Two, propietario de Rockstar Games y 2K, entre otros. Se espera que el cierre de la transacción se produzca durante el primer trimestre del año fiscal 2024/25, en espera de las aprobaciones regulatorias habituales.

En un Comunicado de prensa de Take-TwoGearbox confirma que tiene seis títulos en preparación. Cinco son secuelas, y dos de esas secuelas provienen de las franquicias Borderlands y Homeworld. También tiene una nueva IP anunciada en desarrollo.

Sin embargo, Embracer conserva otras sucursales/subsidiarias de Gearbox. Esto incluye Gearbox Publishing San Francisco (que pronto cambiará de nombre), que posee los derechos de publicación de la franquicia Remnant, Hyper Light Breaker y otros próximos títulos no anunciados. Además, Embracer conserva Cryptic Studios (Neverwinter Online, Star Trek Online), Lost Boys Interactive y Captured Dimensions. Según el comunicado de prensa, estas empresas serán «bienvenidas e integradas en otras partes del Grupo Embracer en el próximo período».

READ  La función de donación de suscripciones de YouTube se lanza el miércoles, pero en versión beta para empezar

El país de las maravillas de la pequeña Tina

En un comunicado de prensa, Lars Wingefors, director ejecutivo de Embracer, escribe:

“El anuncio de hoy marca el resultado del proceso final de desinversión estructurada y es un paso importante para transformar Embracer hacia el futuro con una deuda neta significativamente menor y un flujo de caja libre mejorado. A través de esta transacción, reducimos los riesgos comerciales y mejoramos la rentabilidad a medida que nos transformamos en un negocio más simple y enfocado. Después de evaluar varias opciones para Gearbox, me complace haber llegado a una solución que beneficia a todas las partes interesadas. Randy y el equipo han sido excelentes miembros del equipo durante los últimos años y quiero agradecerles a todos por eso. Como uno de los desarrolladores de juegos más grandes del mundo, estoy seguro de que Gearbox continuará innovando y prosperando en su nuevo hogar dentro de Take-Two.

El fundador y director ejecutivo de Gearbox, Randy Pitchford, agrega:

“Como importante accionista a largo plazo del Grupo Embracer, creo en la estrategia del Grupo Embracer para el futuro y estoy plenamente convencido de que esta transacción es el mejor escenario posible y un acuerdo neto positivo claro para el Grupo Embracer, para TakeTwo y, por supuesto. , para Gearbox Entertainment. Mi principal interés sigue siendo Gearbox, incluido nuestro talento y nuestros clientes. Personalmente quiero asegurarles a los fans de nuestros juegos que este acuerdo garantizará que las experiencias que tenemos en desarrollo en Gearbox sean las mejores posibles.

A principios de este mes, Embracer anunció la venta de Sabre Interactive por 500 millones de dólares. También despidió empleados en varios estudios, canceló una serie de juegos en desarrollo y cerró por completo Free Radical Design y Volition Games.

READ  Intel Core i9-13900K ocupa el primer lugar como el procesador de subproceso único más rápido en PassMark Benchmark
Continue Reading

Ciencia y tecnología

Protéjase de los ataques de restablecimiento de contraseña del iPhone: cómo hacerlo

Published

on

Protéjase de los ataques de restablecimiento de contraseña del iPhone: cómo hacerlo

En uno de los últimos ataques al iPhone, partes maliciosas abusan del sistema de restablecimiento de contraseña de ID de Apple para inundar a los usuarios con mensajes de iOS para recuperar sus cuentas. Aquí le mostramos cómo protegerse contra ataques de restablecimiento de contraseña de iPhone (a menudo llamados «bombardeo MFA»).

Recientemente hemos oído hablar de usuarios de Apple que han sido objeto de bombardeos MFA (también conocidos como fatiga MFA o bombardeos de empuje). Este no es un ataque nuevo, pero puede ser una estafa convincente porque envía a las víctimas mensajes oficiales para restablecer la contraseña de iOS.

Como lo detalla Krebs sobre la seguridad (a través de Parthe Patel), los atacantes que abusan de esta vulnerabilidad parecen hacerlo a través del número de teléfono de un usuario de Apple, que puede bombardear su iPhone y otros dispositivos Apple con más de 100 mensajes MFA (autenticación multifactor) para restablecer la contraseña y pasar su ID de Apple.

Cómo protegerse contra ataques de restablecimiento de contraseña de iPhone

  1. Declive, declive, declive
    • Dado que las solicitudes de restablecimiento de contraseña son una alerta a nivel del sistema, esto parece convincente, pero asegúrese de elegir «No permitir» para todos
    • Los atacantes agotan a sus víctimas bombardeándolas con cientos de mensajes, a veces durante varios días; sigan eligiendo. «No permitir» y opcionalmente utilice el paso 3 a continuación
    • Nota: Si ve un mensaje de restablecimiento de contraseña en la web que puede ser otra estafa de phishing, cerrar la pagina porque cualquiera de los botones podría conducir a un enlace malicioso
  2. No contestes llamadas telefónicas – incluso si el identificador de llamadas dice «Soporte Apple» o similar
    • Los atacantes utilizan la suplantación de llamadas, lo que puede hacer que el número entrante aparezca como el número de teléfono oficial de soporte técnico de Apple y pueden verificar información personal, haciendo que la estafa parezca legítima.
    • Luego intentan obtener una contraseña de un solo uso para hacerse cargo de su cuenta de Apple.
    • En caso de duda, rechace la llamada y llame nuevamente a Apple (800.275.2273 en EE. UU.). La suplantación de llamadas no debería poder interceptar su llamada saliente al Apple real.
    • Apple lo destaca No lo hará llamadas salientes “a menos que el cliente solicite ser contactado” y usted debe nunca compartas códigos de un solo uso con nadie
  3. Cambia temporalmente tu número de teléfono asociado con su ID de Apple
    • Si continúa recibiendo mensajes, cambiar su número de teléfono vinculado a su ID de Apple debería detenerlos.
    • Sin embargo, tenga en cuenta interferirá con iMessage y FaceTime

Mas detalles

Protégete de los ataques de restablecimiento de contraseña del iPhone, cómo hacerlo

Como se muestra en Krebs sobre la seguridad artículo, parece que hay un problema de limitación de velocidad con el sistema de restablecimiento de contraseña de ID de Apple.

¿Qué sistema de autenticación sensato enviaría docenas de solicitudes de cambio de contraseña en cuestión de momentos, cuando las primeras solicitudes ni siquiera fueron procesadas por el usuario? ¿Podría ser esto el resultado de un error en los sistemas de Apple?

Con suerte, Apple está trabajando en una solución para que partes malintencionadas no puedan abusar de este sistema. Pero desafortunadamente, la estafa de restablecimiento de contraseña salió a la luz gracias a usuarios durante al menos dos años (probablemente más).

READ  Misión histórica de NASA / SpaceX despega para la ISS

Una víctima reciente dijo que un ingeniero senior de Apple le aconsejó habilitar la función de clave de recuperación para su ID de Apple para detener las notificaciones de restablecimiento de contraseña. Sin embargo, tras pruebas adicionales, resultó que este no era el caso y la clave de recuperación de Apple verificada por Krebs en Seguridad no impide que se solicite restablecer la contraseña.

Relacionado:

Imágenes de 9to5Mac

FTC: Utilizamos enlaces de afiliados automáticos que generan ingresos. Más.

Continue Reading

Ciencia y tecnología

La actualización 6.1 de la interfaz de usuario llegará a los teléfonos Galaxy más antiguos de EE. UU. –

Published

on

La actualización 6.1 de la interfaz de usuario llegará a los teléfonos Galaxy más antiguos de EE. UU. –

Aamir Siddiqui / Autoridad de Android

TL;DR

  • Samsung ha comenzado a implementar la actualización One UI 6.1 en los buques insignia Galaxy más antiguos.
  • La actualización lleva las funciones de Galaxy AI a los teléfonos.
  • Ahora está disponible en los Estados Unidos. Otras regiones también deberían recibirlo pronto.

Fiel a su promesa, Samsung ha comenzado a implementar la actualización One UI 6.1 en los Estados Unidos. La muy esperada actualización incluye funciones Galaxy AI para teléfonos Samsung Galaxy más antiguos.

Actualmente vemos informes de la actualización implementada para la serie Galaxy S23. Verizon también enumeró la actualización para el gama S23EL Galaxy Z Fold 5y el Galaxy Z Flip 5. El software también lleva el parche de seguridad de marzo a los buques insignia de Samsung más antiguos.

Con One UI 6.1 integrado, los teléfonos Galaxy más antiguos obtienen las siguientes funciones nuevas de IA:

  • Círculo para buscar
  • Traducción en vivo
  • Soporte por chat en Samsung Messages
  • Intérprete
  • Resumir y formatear automáticamente en Samsung Notes
  • Transcribir y traducir en Grabadora de Voz
  • edición generativa

Puede obtener más información sobre todas las funciones de Galaxy AI en detalle aquí.

Si la última actualización de One UI 6.1 aún no ha llegado a su buque insignia Galaxy elegible, no se preocupe. Con la implementación en marcha, la OTA debería estar disponible para descargar muy pronto. Además de los teléfonos Galaxy antes mencionados, la actualización también se implementará en la serie Galaxy Tab S9.

Continue Reading

Trending