Connect with us

Ciencia y tecnología

El nuevo generador de imágenes de IA de OpenAI traspasa los límites en cuanto a detalle y rápida fidelidad – Ars Technica

Published

on

El nuevo generador de imágenes de IA de OpenAI traspasa los límites en cuanto a detalle y rápida fidelidad – Ars Technica

Miércoles, OpenAI anuncio DALL-E 3, la última versión de su modelo de síntesis de imágenes AI que ofrece integración total con ChatGPT. DALL-E 3 renderiza imágenes siguiendo de cerca descripciones complejas y manejando la generación de texto en la imagen (como etiquetas y letreros), lo que desafió a los modelos anteriores. Actualmente en vista previa de búsqueda, estará disponible para los clientes de ChatGPT Plus y Enterprise a principios de octubre.

Al igual que su predecesor, DALLE-3 es un generador de texto a imagen que crea nuevas imágenes basadas en descripciones escritas llamadas indicaciones. Aunque OpenAI no ha publicado ningún detalle técnico sobre DALL-E 3, el modelo de IA en el corazón de versiones anteriores de DALL-E se entrenó en millones de imágenes creadas por artistas y fotógrafos humanos, incluidas algunas con licencia de sitios web como Shutterstock. . Es probable que DALL-E 3 siga esta misma fórmula, pero con nuevas técnicas de entrenamiento y más tiempo de entrenamiento con la computadora.

A juzgar por los ejemplos proporcionados por OpenAI en su blog promocional, DALL-E 3 parece ser un modelo de síntesis de imágenes radicalmente mejor que cualquier otro modelo disponible en términos de siguientes indicaciones. Aunque los ejemplos de OpenAI fueron seleccionados por su efectividad, parecen seguir fielmente las instrucciones rápidas y representar objetos de manera convincente con distorsiones mínimas. En comparación con DALL-E 2, OpenAI afirma que DALL-E 3 refina pequeños detalles como las manos de manera más efectiva, creando imágenes atractivas de forma predeterminada «sin necesidad de piratería ni ingeniería rápida».

En comparación, Midjourney, un modelo de síntesis de imágenes de IA de otro proveedor, reproduce bien los detalles fotorrealistas, pero aún requiere muchos retoques contrarios a la intuición con indicaciones para obtener control sobre la salida de imágenes.

READ  La racha de Samsung continúa: no hay una 'actualización perfecta' para la serie Galaxy S22

DALL-E 3 también parece manejar texto en imágenes de una manera que su predecesor no podía (algunos modelos de la competencia como Stable Diffusion XL y DeepFloyd nos estamos mejorando a nosotros mismos). Por ejemplo, un mensaje que incluía las palabras «Una ilustración de un abogado sentado en la silla de un terapeuta, diciendo ‘Me siento tan vacío por dentro’ con un agujero del tamaño de un hoyo en el centro » creó perfectamente un abogado de dibujos animados con la cita del personaje. encapsulado en una burbuja.

En particular, OpenAI dice que DALL-E 3 fue «construido de forma nativa» en ChatGPT y llegará como una característica incorporada de ChatGPT Plus, lo que permitirá ajustar el chat de imágenes para utilizar el asistente de IA como socio de lluvia de ideas. Esto también significa que ChatGPT podrá generar imágenes basadas en el contexto de la conversación actual, lo que podría dar lugar a nuevas funciones. El asistente Bing Chat AI de Microsoft, también basado en tecnología OpenAI, puede generar imágenes durante una conversación desde marzo.

La tetera que creó una tormenta

Una imagen generada por la IA DALL-E 3 de
Agrandar / Una imagen generada por IA DALL-E 3 de “Una representación 3D de una taza de café colocada en el alféizar de una ventana durante un día de tormenta. La tormenta fuera de la ventana se refleja en el café, con relámpagos en miniatura y olas turbulentas visibles dentro de la taza. «La habitación está poco iluminada, lo que contribuye a la atmósfera dramática».

Abierto AI

La versión original de DALL-E. surgió en enero de 2021, y OpenAI lanzó su suite considerablemente más capaz en abril de 2022, lanzando una nueva era de imágenes generadas por IA con una explosión sorprendente que cautivó a sus primeros probadores beta cerrados. Los modelos DALL-E utilizan una técnica llamada difusión latente que refina el ruido en imágenes que «reconoce» a partir del conocimiento adquirido mediante el entrenamiento en un conjunto de datos y la guía de un mensaje. La misma tecnología permitió la aparición del modelo de difusión estable de peso abierto en agosto del año pasado.

READ  Google Chat añade mensajes de voz e interoperabilidad con Slack

Debido a la forma en que DALL-E aprendió conceptos sobre imágenes durante el entrenamiento mediante la recuperación de un conjunto masivo de datos de obras de arte producidas por humanos, la tecnología de generación de imágenes de IA ha sido extremadamente controvertida desde su introducción generalizada el año pasado. La tecnología ha generado protestas de artistas que temen que reemplace o reproduzca de manera poco ética sus estilos, demandas por infracción de derechos de autor basadas en imágenes extraídas utilizadas como datos de entrenamiento sin consultar a los titulares de derechos de autor, y nuevas resoluciones de derechos de autor de la Oficina de Derechos de Autor de EE. UU. y una agencia estadounidense. juez del tribunal superior.

En un guiño a estas controversias, OpenAI dice que DALL-E 3 está diseñado para satisfacer solicitudes que requieren una imagen al estilo de un artista vivo. OpenAI también proporciona un formulario donde los creadores pueden optar por no utilizar sus imágenes para entrenar futuros modelos. Parece poco probable que estas medidas satisfagan a los artistas que generalmente creen que el entrenamiento en IA debería ser voluntario en lugar de incluirse por defecto en los conjuntos de datos de imágenes.

una comparación de
Agrandar / Une comparaison de «Une peinture à l’huile expressive d’un joueur de basket-ball en train de plonger, représentée comme une explosion d’une nébuleuse» telle que générée par DALL-E 2 (à gauche) et DALL-E 3 (a la derecha).

AbiertoAI

Actualmente, la política de derechos de autor de EE. UU. establece que las obras de arte puramente generadas por IA no pueden recibir protección de derechos de autor. Por lo tanto, técnicamente cualquier imagen creada con DALL-E 3 será de dominio público. Aunque OpenAI no lo reconoce explícitamente, sí dice que «las imágenes que crea con DALL-E 3 le pertenecen y no necesita nuestro permiso para reimprimirlas, venderlas o comercializarlas». Este es un cambio marcado con respecto al año pasado, cuando OpenAI uso restringido de imágenes DALLE-2 basado en una licencia que dice que OpenAI «es dueño de todas las generaciones».

READ  Eliminar Call of Duty de Steam fue un 'fracaso'

En cuanto a la seguridad, OpenAI dice que, al igual que DALL-E 2, ha implementado filtros de detección de imágenes y palabras clave en DALL-E 3 para limitar su capacidad de producir contenido violento, sexual u odioso. El sistema también está programado para rechazar solicitudes que generen imágenes de figuras públicas por su nombre, lo que causó problemas con el generador de imágenes de IA rival Midjourney cuando generó imágenes falsas del arresto de Donald Trump.

OpenAI dice que ha trabajado con expertos conocidos como “equipos rojos” para identificar y mitigar riesgos potenciales, como sesgos dañinos o la generación de propaganda y desinformación. OpenAI no ha dicho nada sobre el potencial de su herramienta para doblar el récord histórico con fabricaciones convincentes, aunque afirma estar experimentando con una herramienta de «clasificador de procedencia» que puede ayudar a identificar si una imagen fue generada o no por DALL-E 3.

Tal como están las cosas, todavía no tenemos acceso a DALL-E 3 para realizar pruebas, pero OpenAI dice que el generador de imágenes de IA se encuentra actualmente en pruebas cerradas. Planea ponerlo a disposición de los clientes de ChatGPT Plus y Enterprise «en octubre a través de la API y en laboratorios a finales de este otoño».

Soy un profesional de gestión deportiva con conocimientos adecuados sobre la industria del deporte en España. Tengo varias habilidades que me han ayudado a trabajar en diferentes sectores del deporte en España, incluyendo eventos deportivos, desarrollo de base para el deporte e infraestructura deportiva.

Continue Reading
Click to comment

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Ciencia y tecnología

Parece que la PS5 Pro se anunciará en las próximas semanas

Published

on

Parece que la PS5 Pro se anunciará en las próximas semanas

La PS5 Pro se anunciará a mediados de septiembre y se espera que llegue a las tiendas durante la temporada navideña, según . La información fue proporcionada por un quien tiene un bastante buen registro para revelar los próximos juegos y hardware.

Esto es lo que reveló el filtrador. Tómate todo esto con cautela, ya que no es de Sony. En primer lugar, la consola se llamará PS5 Pro. Se suponía que estaba basado en la PS4 Pro, pero no teníamos detalles específicos sobre el nombre. El usuario afirma tener acceso al diseño del empaque, pero no se siente cómodo compartiendo imágenes con derechos de autor. En cambio, esbozó el embalaje, como se muestra a continuación.

Parece que la PS5 Pro se anunciará en las próximas semanas

Dealabs/billbil-kun

Como puedes ver, el diseño es similar al de la PS5 Slim, con un color blanco. No sabemos si estará disponible en otros colores además del blanco. Parece haber tres franjas negras en el medio, lo cual es un nuevo elemento de diseño. Estas tiras también podrían servir como respiraderos de refrigeración, pero, repito, todavía no lo sabemos.

El filtrador tampoco sabe si la consola tendrá una unidad de disco, aunque se ha especulado que podría enviarse sin unidad para reducir costos. Tampoco está claro si habrá dos versiones de la PS5 Pro, una con unidad de disco y otra en versión digital.

El informe también indica que la consola vendrá con el mismo controlador DualSense estándar que vino con la PS5 y la PS5 Slim originales. El filtrador, sin embargo, no proporciona ninguna información sobre las especificaciones internas. En otras palabras, todavía estamos (en gran medida) a oscuras con respecto a la parte “Pro” de la PS5 Pro.

READ  Este artista conceptual corrigió el menú de inicio de Windows 11

Por ello, otras filtraciones han dejado entrever la potencia de la consola. En marzo, un YouTuber filtró documentación oficial de Sony que explica algunas de las especificaciones de la consola. El documento se considera legítimo por IGN y otros sitiospero desde entonces el vídeo ha sido eliminado a petición de Sony.

El vídeo sugiere que la próxima consola tendrá el mismo procesador que la PS5 estándar, pero que habrá un «modo de alta frecuencia de procesador» que llevará el chipset un diez por ciento a 3,85 GHz. También se afirmó que la GPU funcionará con 33,5 teraflops en comparación con los 10,28 teraflops de la PS5 estándar.

Esto no significa que la PS5 Pro será tres veces mejor en términos de renderizado que la PS5 clásica. Ha habido cambios recientes en la arquitectura de AMD que dificultan la comparación directa de teraflops entre la PS5 y la PS5 Pro. La filtración sugiere un aumento del 45% con el render.

De cualquier manera, parece que Sony está a días de realizar un anuncio oficial. Esperemos que la PS5 Pro no sea del todo…

Continue Reading

Ciencia y tecnología

«¿Qué quieres decir?» Voy a vomitar. »

Published

on

«¿Qué quieres decir?» Voy a vomitar. »

Los fanáticos de los juegos de lucha están de enhorabuena con el regreso de casi todos los clásicos.







«¿Qué quieres decir?» Voy a vomitar. »


Parece que Capcom no solo lanzó Marvel vs. Capcom Fighting Collection tan pronto y una vez más sorprendió a sus fans.





Durante el Nintendo Direct: Partner Showcase de ayer, The Capcom Fighting Collection 2 apareció de repente en las pantallas de miles/millones de personas en todo el mundo, lo que por supuesto provocó un frenesí en la comunidad de juegos de lucha, eso es lo menos que podemos decir.









Al igual que con las reacciones anteriores de Marvel Collection, los fanáticos que vieron la transmisión (y los que vinieron después) fueron tomados con la guardia baja, probablemente no esperaban otra compilación tan pronto cuando la primera ni siquiera se lanzó aún.


Por supuesto, hay una alegría desenfrenada al ver no solo regresar los dos juegos de Capcom vs. SNK, pero también juegos como Project Justice, que ya no estaba disponible desde el port de Sega Dreamcast en 2001.


Además, profundizaron aún más en Power Stone y Power Stone 2, cuyos fanáticos han estado pidiendo un nuevo lanzamiento durante años.


Y, por supuesto, hay un hilo de bromas de aquellos que reaccionaron a la revelación de que podrían haber dejado fuera a Capcom Fighting Evolution, especialmente cuando las escuelas rivales originales no están incluidas.




READ  Este artista conceptual corrigió el menú de inicio de Windows 11

Maximiliano Dood Esa es probablemente la reacción que más queríamos ver y no decepcionó.


Al principio, el «¿qué?» » de Max parece más confundido y casi asustado de lo que está sucediendo cuando Ryu y Terry aparecen en la pantalla, seguido de más maldiciones y gritos.


Sabiendo cómo reaccionará su amigo, Max llama a Kenny «Proceso» inmediatamente después y le dice que evite Internet a toda costa hasta que pueda ver el Nintendo Direct.


Kenny obedece, y cuando se sienta para ver su reacción, puedes ver los lindos carteles de Power Stone y Rival Schools iluminados detrás de él, así que puedes adivinar cómo va a ser esto.




Comienza a saltar en CvS, pero no puede evitar saltar cuando Justice aparece en la pantalla.


Y cuando aparece Power Stone, Kenny grita y salta de su silla tan rápido que desconecta su micrófono o auricular, y puedes escuchar cómicamente el sonido de notificación de Windows cuando esto sucede.


Se emociona tanto que empieza a toser y a exclamar que casi vomita.


Coeficiente de manera similar, tuvo que levantarse de su silla para encontrar su antigua copia de CvS2 en el estante.




También es lindo ver la reacción de alguien como el legendario. Justin Wongquien también participó (o en algunos casos aún participa) en algunos de estos títulos.

READ  Nuevo truco de WhatsApp: cambia tu logo a rosa como soporte


Hemos incluido algunas de las reacciones más divertidas que pudimos encontrar ante Capcom Fighting Collection 2 de curiosojoi, Base de datos KrimsonY Juegos sabiosque puedes consultar a continuación, pero no te sorprendas si encuentras lenguaje soez entre la emoción.































Continue Reading

Ciencia y tecnología

Midjourney, empresa de inteligencia artificial, presenta un producto de hardware en un nuevo formato

Published

on

Midjourney, empresa de inteligencia artificial, presenta un producto de hardware en un nuevo formato

En respuesta a esta imagen meme de un mago con un orbe del libro ICE Tierra Media: Valar y MaiarEl fundador de Midjourney bromeó diciendo que el nuevo factor de forma del hardware podría ser un orbe.

HIELO

Midjourney, una empresa mejor conocida por su sólida herramienta de generación de imágenes de IA, anunció públicamente que estaba «entrando en hardware» e invitó a quienes buscaban empleo a postularse para unirse a su nueva división de hardware.

La empresa compartió el anuncio en su cuenta oficial X hoy.

El fundador de Midjourney, David Holz, trabajó anteriormente en una empresa de hardware informático; fue director técnico de Leap Motion. Hace unos meses contrató a Ahmad Abbas, con quien trabajó en Leap Motion. Abbas también trabajó en Apple durante cinco años como gerente de hardware en los auriculares Vision Pro. perfil de LinkedIn ahora enumera su título actual como «Gerente de hardware, mitad del viaje».

Aún no está claro qué tipo de dispositivo desarrollará Midjourney, pero esta cuenta X publicó hoy numerosos tweets que podrían dar a los detectives de Internet una visión clara de sus planes. Por ejemplo, el publicado que el dispositivo «no será un colgante» tras una serie de fallos recientes en el campo de los dispositivos de hardware de IA tipo colgante.

La empresa tuiteó que tuvo «múltiples esfuerzos en vuelo» cuando se le preguntó por más detalles sobre el dispositivo y nota que «definitivamente hay oportunidades para más formatos».

Si realmente quieres estirarte, puedes recordar el hecho de que Holz tuiteó hace unos meses: “haremos el orbe» en respuesta a otro usuario de X que bromeó diciendo que alguien debería crear un dispositivo con un factor de forma esférico inspirado en esferas mágicas de historias de fantasía, como la de Saruman. palantir Del Señor de los Anillos.

READ  App Store presenta la aplicación Apple 'Mind' no anunciada, sugiere próximos consejos y contactos de watchOS 8 en la WWDC

En caso de que no sea obvio, Midjourney y Holz han sido prolíficos en X con burlas y troleos al respecto hasta el punto de que probablemente no deberías leer demasiado en nada de lo que han dicho más allá del compromiso de producir algún tipo de material.

Tampoco hay un calendario, por lo que es posible que tengas que esperar un poco para ver qué sucede. En este punto, Midjourney es sólo una de las muchas empresas que intentan descubrir cómo será el hardware impulsado por IA.

Continue Reading

Trending