Connect with us

Ciencia y tecnología

El chatbot Bard de Google recibe la actualización Gemini Pro a nivel mundial

Published

on

El chatbot Bard de Google recibe la actualización Gemini Pro a nivel mundial

Créditos de imagen: TechCrunch

Google anunció hoy que su chatbot Bard ahora funciona con el modelo Gemini Pro en todo el mundo y admite más de 40 idiomas, incluidos árabe, chino, holandés, francés, alemán, hindi, japonés, portugués, español, tamil, telugu y malayalam.

En diciembre, Google lanzó sus nuevos modelos de IA generativa con el modelo insignia Gemini Ultra, «lite» Gemini Pro y Gemini Nano, diseñados para funcionar en dispositivos como el Pixel 8. Al mismo tiempo, la compañía lanzó la actualización Bard con Gemini Pro para conversaciones. . En inglés. Google no cuantificó las mejoras, pero dijo que el chatbot sería mejor en términos de comprensión y resumen de contenido, razonamiento, lluvia de ideas, redacción y planificación.

Bard ha pasado por algunas iteraciones en el backend. En el momento de su presentación inicial en febrero de 2023, funcionaba con LaMDA (modelo de lenguaje para aplicaciones de diálogo); más adelante en el año se actualizó con un nuevo modelo llamado PaLM 2; Ahora, Bard con tecnología Gemini Pro estará disponible en más de 230 países. Sí, estos nombres y versiones son confusos.

En septiembre, Google lanzó una función de «doble verificación» que aprovechaba la Búsqueda de Google para evaluar si arrojaba resultados similares a los generados por Bard. En ese momento, la función sólo estaba disponible en inglés. Google ahora está ampliando el soporte a más de 40 idiomas.

Créditos de imagen: Google

Además, el gigante de las búsquedas está introduciendo soporte para la generación de imágenes a través de la plantilla Imagen 2, lanzada en diciembre. Actualmente, la función solo admite inglés. Los usuarios pueden ingresar una consulta como «crear una imagen de un automóvil futurista» en la interfaz del chatbot.

Imagen de ejemplo generada a través de Bard. Créditos de imagen: Google

La compañía dijo que las imágenes creadas por Bard tendrán un ID del sintetizador Marca de agua digital, desarrollada por DeepMind, incrustada en píxeles. Sin embargo, debe utilizar las herramientas de Google para identificar estas imágenes.

Créditos de imagen: Google

En octubre, la compañía impulsó el Asistente de Google con las capacidades de inteligencia artificial de Bard para que los usuarios pudieran planificar un viaje o hacer una lista de compras. En noviembre, Bard se abrió en inglés para adolescentes, con restricciones que impiden que Bard genere contenido peligroso, como sustancias ilegales o restringidas por edad.

READ  Intel dice que el nuevo procesador Core i9 para computadora portátil es más rápido que el chip M1 Max de Apple

Soy un profesional de gestión deportiva con conocimientos adecuados sobre la industria del deporte en España. Tengo varias habilidades que me han ayudado a trabajar en diferentes sectores del deporte en España, incluyendo eventos deportivos, desarrollo de base para el deporte e infraestructura deportiva.

Continue Reading
Click to comment

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Ciencia y tecnología

Los creadores del corto basado en Sora explican las fortalezas y limitaciones del video generado por IA

Published

on

Los creadores del corto basado en Sora explican las fortalezas y limitaciones del video generado por IA

Créditos de imagen: niños tímidos

La herramienta de generación de video de OpenAI, Sora, sorprendió a la comunidad de IA en febrero con un video fluido y realista que parece muy por delante de sus competidores. Pero el debut cuidadosamente organizado omitió muchos detalles, detalles que fueron completados por un cineasta al que se le concedió acceso anticipado para crear un cortometraje utilizando a Sora.

Shy Kids es un equipo de producción digital con sede en Toronto que fue seleccionado por OpenAI como uno de los pocos producir cortometrajes principalmente con fines promocionales de OpenAI, aunque tenían una libertad creativa considerable creando una “cabeza de aire”. En un entrevista con el medio de noticias de efectos visuales fxguideEl artista de postproducción Patrick Cederberg describió «realmente usar a Sora» como parte de su trabajo.

Quizás la conclusión más importante para la mayoría es simplemente esta: aunque el artículo de OpenAI que destaca los cortos deja al lector asumir que surgieron más o menos completamente formados de Sora, la realidad es que se trataba de producciones profesionales, completas con guiones gráficos, edición y corrección de color y trabajos posteriores como rotoscopia y VFX. Al igual que Apple dice «filmado con iPhone» pero no muestra la configuración del estudio, la iluminación profesional y el trabajo de color después del hecho, la publicación de Sora solo habla de lo que permite hacer a las personas, no de la forma en que realmente lo hicieron.

La entrevista de Cederberg es interesante y poco técnica, así que si estás interesado, ve a fxguide y léelo. Pero aquí hay algunas cosas interesantes sobre el uso de Sora que nos dicen que, por muy impresionante que sea, el modelo puede ser un salto menos gigante de lo que pensábamos.

El control sigue siendo en esta etapa lo más deseable y también lo más difícil de alcanzar. …Lo mejor que pudimos conseguir fue ser hiperdescriptivos en nuestras indicaciones. Explicar el vestuario de los personajes, así como el tipo de globo, fue nuestra forma de garantizar la coherencia, porque plano a plano/generación en generación, todavía no existe una función para un control total sobre la coherencia.

En otras palabras, cuestiones simples en el cine tradicional, como elegir el color de la ropa de un personaje, requieren soluciones y controles elaborados en un sistema generativo, porque cada plano se crea independientemente de los demás. Obviamente, esto podría cambiar, pero ciertamente hay mucho más trabajo en este momento.

READ  Se revelan cuatro prototipos 'secretos' de BMW M CSL que casi suceden

cartel de youtube

Los resultados de Sora también tuvieron que ser monitoreados para detectar elementos no deseados: Cederberg describió cómo el modelo generaba regularmente en el globo una cara que el personaje principal tiene como cabeza, o un hilo que colgaba delante de él. Estos tenían que ser eliminados por correo, otro proceso tedioso, si no recibían el mensaje para excluirlos.

Realmente no es posible lograr tiempos y movimientos precisos de los personajes o de la cámara: «Hay un pequeño control temporal sobre dónde suceden estas diferentes acciones en la generación real, pero no es preciso…c «Es una especie de disparo en la oscuridad», Cederberg dicho.

Por ejemplo, cronometrar un gesto como un saludo es un proceso muy aproximado y basado en sugerencias, a diferencia de las animaciones manuales. Y una toma como una panorámica sobre el cuerpo del personaje puede reflejar o no lo que quiere el cineasta, por lo que en este caso el equipo representó una toma compuesta en orientación vertical y recortó en posproducción. Los clips generados también a menudo estaban en cámara lenta sin ningún motivo en particular.

Ejemplo de un disparo como sale de Sora y como acabó en el corto. Créditos de imagen: niños tímidos

De hecho, el uso de lenguaje cinematográfico común como «pan right» o «dolly» era generalmente inconsistente, dijo Cederberg, lo que el equipo encontró bastante sorprendente.

«Los investigadores, antes de acercarse a los artistas para jugar con esta herramienta, en realidad no pensaban como cineastas», dijo.

Como resultado, el equipo ejecutó cientos de generaciones, cada una de las cuales duró entre 10 y 20 segundos, y terminó usando solo unas pocas. Cederberg estimó la proporción en 300:1, pero, por supuesto, probablemente a todos nos sorprendería la proporción en una sesión fotográfica normal.

READ  Android se burla de las "actualizaciones de mensajería" en Google I/O 2022

el equipo en realidad Hice un pequeño video detrás de escena. explicando algunos de los problemas que encontraron, si tiene curiosidad. Como gran parte del contenido adyacente a la IA, Los comentarios son bastante críticos con todo el proyecto. – pero no tan virulenta como la publicidad impulsada por IA que hemos visto ridiculizada recientemente.

cartel de youtube

La última cuestión interesante se refiere a los derechos de autor: si le pides a Sora que te regale un clip de “Star Wars”, él se negará. Y si intentas eludirlo con «un hombre vestido con una espada láser en una nave espacial retro-futurista», también se negará, porque mediante algún mecanismo reconoce lo que estás intentando hacer. También se negó a hacer un “plano de Aronofsky” o un “zoom de Hitchcock”.

Por un lado, tiene mucho sentido. Pero eso plantea la pregunta: si Sora sabe qué es, ¿eso significa que el modelo fue entrenado en ese contenido para reconocer mejor que está infringiendo? OpenAI, que mantiene sus tarjetas de datos de entrenamiento en secreto, hasta el punto de lo absurdo, como ocurre con Entrevista de la CTO Mira Murati con Joanna Stern – Es casi seguro que nunca nos lo dirá.

En cuanto a Sora y su uso en el cine, es claramente una herramienta poderosa y útil en su lugar, pero su lugar no es «crear películas desde cero». De nuevo. Como dijo otro villano, “eso viene después”.

Continue Reading

Ciencia y tecnología

El evento iPad 'Let Loose' de Apple también incluirá un evento especial en Londres

Published

on

El evento iPad 'Let Loose' de Apple también incluirá un evento especial en Londres

Apple celebrará un evento especial el 7 de mayo, durante el cual se espera que «se deje llevar» y lance grandes cambios en la línea iPad. En un giro interesante, parece que también habrá un evento paralelo organizado por Apple en Londres ese día.

¿Un evento de Apple en Londres?

En su cobertura del anuncio del evento de Apple hace unos días, el Independiente incluyó este dato:

Apple retransmitirá el lanzamiento en vídeo en directo en todo el mundo, pero irá acompañado de un evento en Londres, lo que podría explicar el lanzamiento inusualmente temprano. La compañía casi ha realizado sus lanzamientos en California, y hacerlo en el Reino Unido representa una ruptura con la tradición.

Sobre las discusiones, Joe Rossignol dice que «confirmó que Apple organizará una reunión de varios días para conocidos periodistas, blogueros y creadores de contenido de redes sociales en Londres» para el evento «Let Loose» del 7 de mayo.

“Habrá participantes de varios países europeos e incluso de Australia. Creo que se llevará a cabo en Apple Battersea y habrá tiempo práctico con nuevos productos”, dice Joe.

El evento en Londres, por supuesto, será sólo por invitación y no estará abierto al público.

Tomar de 9to5Mac

Para el evento «Scary Fast» de octubre centrado en Mac, Apple no celebró un evento presencial en Cupertino. Sin embargo, invitó a la prensa y a influencers a algunas ciudades del mundo para ver el vídeo del evento y familiarizarse con los productos.

Es probable que esto sea lo que suceda en última instancia con el evento “Let Loose” del próximo mes, pero esta vez también con una reunión en persona en Londres. Esto también podría explicar en parte el horario extraño del evento a las 7 a. m. PT/10 a. m. ET, que son las 3 p. m. ET en Londres.

READ  Gemini ya está disponible en móviles Android en más países e idiomas

Más que cualquier otra cosa, esto podría ser una señal de que Vision Pro está a punto de debutar fuera de los Estados Unidos. Durante el evento también esperamos el lanzamiento de un nuevo iPad Pro, iPad Air, Magic Keyboard y Apple Pencil.

¡Veremos! Todavía queda poco más de una semana para que sea oficialmente el momento de soltarse…

Seguir oportunidad: Temas, Gorjeo, InstagramY Mastodonte.

FTC: Utilizamos enlaces de afiliados automáticos que generan ingresos. Más.

Continue Reading

Ciencia y tecnología

Wear OS 5, que llegará este año, muestra que Google finalmente está avanzando con los relojes inteligentes

Published

on

Wear OS 5, que llegará este año, muestra que Google finalmente está avanzando con los relojes inteligentes

Que quieres saber

  • Antes del Google I/O del próximo mes, Google reveló un cronograma preliminar para las sesiones de desarrolladores.
  • Una de estas sesiones es una vista previa de Wear OS 5 y es la primera confirmación oficial de Google de que llegará una actualización de Wear OS este año.
  • La descripción de la sesión “Construyendo el futuro de Wear OS” incluye algunos detalles preliminares sobre lo que traerá la actualización.

Google I/O 2024 está pasando rápidamente a primer plano, ya que el evento comienza en unas pocas semanas y podría traer nuevos anuncios de hardware y software de Google. La compañía nos dio nuestra primera idea real de qué esperar cuando lanzó un Calendario preliminar de E/S 2024 el jueves 25 de abril. Este cronograma incluye la confirmación anticipada de que pronto estará disponible una actualización de Wear OS.

Hay cuatro categorías principales de eventos en Google I/O este año: móvil, web, ML/AI y nube. Una de las sesiones móviles se titula “Construyendo el futuro de Wear OS«, y enumera explícitamente Wear OS 5, la versión inédita de Wear OS que se espera que llegue este año, como un objetivo. En enero, se detectaron referencias a Wear OS 5 en una versión de Android 14, lo que insinúa que se estaba realizando una actualización.

Continue Reading

Trending