Connect with us

Ciencia y tecnología

Midjourney lanza personajes consistentes para imágenes de generación de IA

Published

on

Midjourney lanza personajes consistentes para imágenes de generación de IA

Únase a los líderes en Boston el 27 de marzo para una velada exclusiva de networking, ideas y conversaciones. Solicite una invitación aquí.


El popular servicio de generación de imágenes con IA Camino medio ha lanzado una de sus funciones más solicitadas: la capacidad de recrear personajes constantemente a través de nuevas imágenes.

Hasta ahora, esto ha sido un gran obstáculo para los generadores de imágenes de IA, por su propia naturaleza.

Esto se debe a que la mayoría de los generadores de imágenes de IA se basan en «modelos de difusión«, herramientas similares o basadas en el algoritmo de generación de imágenes de difusión estable de código abierto de Stability AI, que funcionan aproximadamente tomando texto ingresado por un usuario e intentando reconstruir una imagen píxel por píxel que coincida con esta descripción, como hemos aprendido de experiencias similares. . etiquetas de imagen y texto en su conjunto de datos de entrenamiento masivo (y controvertido) que consta de millones de imágenes creadas por humanos.

Por qué las personas consistentes son tan poderosas (y esquivas) para las imágenes generativas de IA

Sin embargo, como es el caso de los modelos de lenguaje grande (LLM) basados ​​en texto, como ChatGPT de OpenAI o el nuevo Command-R de Cohere, el problema con todas las aplicaciones de IA generativa radica en la inconsistencia de sus respuestas: la IA genera algo nuevo para cada mensaje. ingresado, incluso si se repite el mensaje o se utilizan algunas de las mismas palabras clave.

Esto es ideal para generar contenidos completamente nuevos (en el caso de Midjourney, imágenes). Pero, ¿qué pasa si estás escribiendo el guión gráfico de una película, novela, novela gráfica, cómic u otro medio visual que quieras el mismo ¿Uno o más personajes para moverse y aparecer en diferentes escenas, escenarios, con diferentes expresiones faciales y accesorios?

Este escenario preciso, que generalmente es necesario para la continuidad narrativa, ha sido hasta ahora muy difícil de lograr con la IA generativa. Pero Midjourney lo está intentando ahora introduciendo una nueva etiqueta, “–cref” (abreviatura de “referencia de personaje”) que los usuarios pueden agregar al final de sus indicaciones de texto en Midjourney Discord que intentará coincidir con la cara del personaje. características, tipo de cuerpo e incluso ropa a partir de una URL que el usuario pega después de dicha etiqueta.

A medida que la función avanza y se perfecciona, Midjourney podría pasar de ser un juguete genial o una fuente de ideas a una herramienta más profesional.

Cómo utilizar la nueva función Carácter consistente a mitad del viaje

La etiqueta funciona mejor con imágenes de Midjourney generadas previamente. Entonces, por ejemplo, el flujo de trabajo para un usuario sería generar o recuperar primero la URL de un carácter generado previamente.

Empecemos desde cero y digamos que generamos un nuevo personaje con este mensaje: «un hombre calvo y musculoso con una cuenta y un parche en el ojo».

Escalaremos la imagen que nos guste, luego presione la tecla Control y haga clic en ella en el servidor de Midjourney Discord para encontrar la opción «Copiar enlace».

Luego podemos escribir un nuevo mensaje en “usar un esmoquin blanco mientras estamos en una villa –cref [URL]» y pegue la URL de la imagen que acabamos de generar, y Midjourney intentará generar el mismo carácter que antes en nuestro parámetro recién ingresado.

READ  Los juegos de la colección PlayStation Plus también funcionan en PlayStation 4

Como verá, los resultados están lejos de ser precisos con respecto al carácter original (o incluso a nuestro mensaje original), pero ciertamente son alentadores.

Además, el usuario puede controlar hasta cierto punto el «peso» de cómo la nueva imagen reproduce el carácter original aplicando la etiqueta «–cw» seguida de un número del 1 al 100 al final de su nuevo mensaje (después del “– cref [URL]»cadena, así: » –cref [URL] –cw 100”. Cuanto menor sea el número “cw”, más variación tendrá la imagen resultante. Cuanto mayor sea el número “cw”, más estrechamente seguirá la nueva imagen resultante a la referencia original.

Como puede ver en nuestro ejemplo, ingresar un «cw 8» muy débil en realidad devuelve lo que queríamos: el esmoquin blanco. Pero ahora le ha quitado el parche distintivo a nuestro personaje.

Bueno, nada que una pequeña “variación regional” no pueda resolver, ¿verdad?

Ok, entonces el parche está en el ojo malo… ¡pero ya estamos llegando!

También puede combinar varios caracteres en uno utilizando dos etiquetas “–cref” una al lado de la otra con sus respectivas URL.

La función se lanzó esta tarde, pero artistas y creadores ya la están probando. Pruébelo usted mismo si tiene Midjourney. Y lea la nota completa del fundador David Holz a continuación:

Hola a todos @aquí, hoy estamos probando una nueva función de «Referencia de personaje». Es similar a la función «Referencia de estilo», excepto que en lugar de hacer coincidir un estilo de referencia, intenta hacer coincidir el personaje con una imagen de «Referencia de personaje».

Cómo funciona

  • Pegar --cref URL después de su mensaje con una URL a una imagen de un personaje
  • Puedes usar --cw para modificar la referencia de 'fuerza' de 100 a 0
  • fuerza 100 (--cw 100) es el valor predeterminado y usa cara, cabello y ropa.
  • En fuerza 0 (--cw 0) solo se centrará en la cara (bueno para cambiar de ropa/peinado, etc.)

¿Para qué está destinado esto?

  • Esta característica funciona mejor cuando se utilizan personajes creados a partir de imágenes de Midjourney. No está diseñado para personas/fotos reales (y probablemente las distorsionará como lo hacen las indicaciones de imágenes normales)
  • Cref funciona igual que las indicaciones de imágenes normales, excepto que se «centra» en los rasgos del personaje.
  • La precisión de esta técnica es limitada, no copiará exactamente hoyuelos, pecas o logotipos de camisetas.
  • Cref funciona tanto para los modelos normales Niji como para MJ y también se puede combinar con --sref

Características avanzadas

  • Puede utilizar varias URL para mezclar información/caracteres de varias imágenes como esta --cref URL1 URL2 (Esto es similar a las indicaciones de múltiples imágenes o estilos)

¿Cómo funciona en web alfa?

  • Arrastra o pega una imagen en la barra de imaginación; ahora tiene tres íconos. seleccionando estos conjuntos, ya sea una imagen, una referencia de estilo o una referencia de personaje. Mayús+selecciona una opción para usar una imagen para múltiples categorías

Recuerde que mientras MJ V6 esté en versión alfa, esta y otras características pueden cambiar repentinamente, pero la versión beta oficial de V6 llegará pronto. Nos encantaría escuchar las opiniones de todos sobre ideas y características. Esperamos que disfrutes de este primer lanzamiento y que te ayude a disfrutar de la historia y la construcción del mundo.

La misión de VentureBeat es ser una plaza digital para que los tomadores de decisiones técnicas adquieran conocimientos sobre tecnología y transacciones comerciales transformadoras. Descubra nuestros Briefings.

READ  Apple explica cómo funciona Spatial Audio en Apple TV con tvOS 15

Soy un profesional de gestión deportiva con conocimientos adecuados sobre la industria del deporte en España. Tengo varias habilidades que me han ayudado a trabajar en diferentes sectores del deporte en España, incluyendo eventos deportivos, desarrollo de base para el deporte e infraestructura deportiva.

Continue Reading
Click to comment

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Ciencia y tecnología

Samsung podría dividir notificaciones y configuraciones rápidas en Android 15

Published

on

Samsung podría dividir notificaciones y configuraciones rápidas en Android 15

La actualización de Android 15 de Samsung está a la vuelta de la esquina y, por lo que parece, se perfila como una gran actualización. Según información filtrada, uno de los mayores cambios que Samsung hará en su versión de Android 15 será la división de notificaciones y configuraciones rápidas, un cambio que cada vez es más común en las skins de Android.

En 2014, en Android Lollipop, Google actualizó Android desde un diseño de configuración rápida de dos paneles a un solo menú. En ese momento, esto tomó la forma de notificaciones que aparecían primero, con Configuración rápida. otro barridoPoco después, Google los fusionó Para ir aún más lejos, coloque algunos botones de configuración rápida en el área de notificación y el resto se ocultará con un segundo deslizamiento. Aunque la apariencia general ha cambiado, este comportamiento se ha mantenido hasta el día de hoy.

Al menos este es el caso de Android en su forma más pura. En muchos casos, las máscaras OEM en Android cambiarán esto.

HyperOS de Xiaomi y MagicOS de Honor son dos ejemplos clave de este cambio. En ambos casos, las notificaciones y la configuración rápida se dividen en dos paneles de pantalla completa. Con ambos, puedes deslizar el dedo en ciertas partes de la pantalla para moverte entre los paneles, y también puedes deslizar el dedo (al menos en el caso de Honor) desde el lado derecho de la pantalla para abrir directamente la configuración rápida.

Al parecer Samsung está planeando algo similar.

Junto con un montón de otras filtraciones de la actualización One UI 7 de Samsung, el filtrador Chun Bhai citar fuentes Según información de la compañía, Samsung dividirá el panel de notificaciones y configuración rápida en dos paneles separados. El primer panel solo mostrará notificaciones, mientras que el segundo mostrará un diseño de Configuración rápida actualizado, que se dice que tiene un diseño «más redondeado». Al igual que Xiaomi y Honor, Samsung permitirá a los usuarios deslizarse entre paneles.

READ  El chatbot Bard de Google recibe la actualización Gemini Pro a nivel mundial

Esto también ha quedado parcialmente demostrado en algunas filtraciones más recientes.

Apple también utiliza un diseño de dos paneles para el «Centro de notificaciones» y el «Centro de control», aunque no puedes cambiar entre ellos. Dado que hay varios otros cambios inspirados en iOS en One UI 7, parece razonable suponer que al menos parte de la inspiración de Samsung aquí es hacer las cosas más familiares para los usuarios de Apple.

Se rumorea que Samsung lanzará su primera versión beta de One UI 7, que también viene con otras características inspiradas en Apple, la próxima semana.

Obtenga más información sobre Samsung:

Sigue a Ben: Gorjeo/X, HijoY Instagram

FTC: Utilizamos enlaces de afiliados automáticos que generan ingresos. Más.

Continue Reading

Ciencia y tecnología

Las fundas del Pixel 9 Pro de Google tienen fugas con una barra de protección de cámara en ángulo

Published

on

Las fundas del Pixel 9 Pro de Google tienen fugas con una barra de protección de cámara en ángulo

Dada la nueva forma, los diseños de carcasas de Google para Pixel 9 Pro y 9 Pro XL cambiarán de manera más significativa este año, y hoy una filtración revela el aspecto y los colores disponibles.

compartido por títulos de AndroidVemos cómo la carcasa del Pixel 9 Pro cubre completamente los rieles laterales propensos a las huellas dactilares. En particular, es continuo y cubre completamente la parte inferior en lugar de dejar una parte abierta para el acceso sin obstáculos al puerto USB-C. Esto es lo que hace Apple en algunas de sus cajas, pero Google se apega a sus funciones existentes.

La funda del Pixel 9 Pro parece estar hecha de un material de silicona que tendrá buen agarre. El interior está forrado con un material similar a una tela, mientras que el botón de encendido y el control de volumen están cubiertos.

Cabe destacar la fuerte pendiente utilizada para proteger la barra alta de la cámara. En lugar de una pared vertical que rodee los lados de la píldora, la carcasa tiene un ángulo hacia arriba para encontrarse con ella.

Según el informe de hoy, el estuche del Pixel 9 Pro viene en carbón, porcelana, avellana, rosa y aloe. Este último no coincide con ningún color de teléfono existente y es bastante vivo.

Sin embargo, parece haber dos tonos de conchas rosas, uno de los cuales no se menciona en el artículo. Según lo que está disponible para el 9 Pro XL, el color más claro a continuación es el rosa, pero el otro color tiene un tono más oscuro.

El Pixel 9 Pro XL solo está disponible en cuatro colores: carbón, porcelana, avellana y rosa.

Continue Reading

Ciencia y tecnología

Google podría continuar el legado de Chromecast con una caja 'TV Streamer'

Published

on

Google podría continuar el legado de Chromecast con una caja 'TV Streamer'

Que quieres saber

  • Un informe afirma que Google está abandonando el diseño del dongle y buscando una caja «TV Streamer» para continuar con el linaje Chromecast.
  • Las fotos filtradas muestran que la caja presenta un diseño en ángulo sobre un pequeño pedestal con un control remoto rediseñado que elimina el ícono del Asistente y mueve el control de volumen.
  • A principios de este año se rumoreaba que Google estaba trabajando en un sucesor del Chromecast 4K, lo que se relaciona con una foto remota filtrada en octubre.

Circulan muchos rumores sobre la «próxima generación de Chromecast», pero un nuevo informe afirma que Google no va por la ruta del dongle.

Algunas imágenes compartidas con 9to5Google Las fotos que se muestran aquí afirman ser de la nueva caja “Google TV Streamer”, que se supone que reemplazará el dongle Chromecast. Las fotos de estilo de vida sugieren que el estuche diseñado para colocarse sobre una mesa tendrá forma de pizarra. Este TV Streamer también parece mucho más ancho que alto. Se desconocen funciones adicionales además del streaming.

Continue Reading

Trending