Connect with us

Ciencia y tecnología

ChatGPT inesperadamente comenzó a hablar con la voz clonada de un usuario durante la prueba

Published

on

ChatGPT inesperadamente comenzó a hablar con la voz clonada de un usuario durante la prueba

El jueves, OpenAI lanzó el “placa base» para el nuevo modelo GPT-4o AI de ChatGPT que detalla las limitaciones del modelo y los procedimientos de prueba de seguridad. Entre otros ejemplos, el documento revela que en casos raros durante las pruebas, el modo de voz avanzado del modelo ha imitado involuntariamente las voces de los usuarios sin autorización. Actualmente, OpenAI tiene Se han implementado salvaguardias que evitan que esto suceda, pero la instancia refleja la creciente complejidad de la arquitectura segura con un chatbot de IA que potencialmente podría imitar cualquier voz de un pequeño clip.

El modo de voz avanzado es una función de ChatGPT que permite a los usuarios tener conversaciones habladas con el asistente de IA.

En una sección de la placa del sistema GPT-4o titulada «Generación de voz no autorizada», OpenAI detalla un episodio en el que una entrada ruidosa hizo que el modelo imitara repentinamente la voz del usuario. «La generación de voz también puede ocurrir en situaciones que no son de conflicto, como nuestro uso de esta capacidad para generar voces para el modo de voz avanzado de ChatGPT», escribe OpenAI. “Durante las pruebas, también observamos casos raros en los que el modelo generaba involuntariamente resultados que imitaban la voz del usuario. »

En este ejemplo de generación de voz involuntaria proporcionada por OpenAI, el modelo de IA grita “¡No! » y continúa la frase con una voz que se asemeja a la del “equipador rojo” que se escucha al comienzo del clip. (Un red teamer es una persona contratada por una empresa para realizar pruebas adversas).

READ  Galaxy Tab S10 Ultra filtrado en renders [Gallery]

Sin duda, daría miedo hablar con una máquina y que de repente empezara a hablarte con tu propia voz. Normalmente, OpenAI tiene salvaguardias para evitar esto, razón por la cual la compañía dice que este fenómeno era raro incluso antes de que desarrollara formas de prevenirlo por completo. Pero este ejemplo llevó al científico de datos de BuzzFeed, Max Woolf, a piar“OpenAI acaba de revelar la trama de la próxima temporada de Black Mirror. »

Inyecciones de audio rápidas

¿Cómo podría ocurrir la imitación de voz con el nuevo modelo de OpenAI? La pista principal se encuentra en otra parte de la placa del sistema GPT-4o. Para crear voces, GPT-4o aparentemente puede sintetizar casi cualquier tipo de sonido que se encuentre en sus datos de entrenamiento, incluidos efectos de sonido y música (aunque OpenAI desaconseja este comportamiento con instrucciones especiales).

Como se indica en la hoja del sistema, el modelo básicamente puede imitar cualquier voz a partir de un breve clip de audio. OpenAI guía de forma segura esta capacidad proporcionando una muestra de voz autorizada (de un actor de voz contratado) que se le indica que imite. Proporciona la muestra en el mensaje del sistema del modelo de IA (lo que OpenAI llama el «mensaje del sistema») al comienzo de una conversación. «Supervisamos las completaciones ideales utilizando la muestra de voz en el mensaje del sistema como voz base», escribe OpenAI.

En los LLM de solo texto, el mensaje del sistema iun conjunto oculto de instrucciones de texto que guían el comportamiento del chatbot y se agregan silenciosamente al historial de conversación justo antes de que comience la sesión de chat. Las interacciones sucesivas se agregan al mismo historial de chat y el contexto completo (a menudo llamado «ventana de contexto») se devuelve al modelo de IA cada vez que el usuario proporciona una nueva entrada.

READ  iPhone, la mensajería multiplataforma de Android es un desastre. ¿Por qué?

(Probablemente sea hora de actualizar este diagrama creado a principios de 2023 a continuación, pero muestra cómo funciona la ventana emergente en un chat de IA. Imagínese que el primer mensaje es un mensaje del sistema que dice cosas como «Eres un chatbot útil. No No hablemos de actos violentos, etc.)

Un diagrama que muestra cómo funciona el mensaje del modelo de lenguaje conversacional GPT.
Agrandar / Un diagrama que muestra cómo funciona el mensaje del modelo de lenguaje conversacional GPT.

Benj Edwards / Ars Technica

Dado que GPT-4o es multimodal y puede procesar audio tokenizado, OpenAI también puede usar entradas de audio como parte del mensaje del sistema del modelo, y esto es lo que hace cuando OpenAI proporciona una muestra de voz que el modelo puede imitar. La empresa también utiliza otro sistema para detectar si el modelo genera audio no autorizado. “Solo permitimos que el modelo use ciertas voces preseleccionadas”, escribe OpenAI, “y usamos un clasificador de salida para detectar si el modelo se desvía de esto. »

Soy un profesional de gestión deportiva con conocimientos adecuados sobre la industria del deporte en España. Tengo varias habilidades que me han ayudado a trabajar en diferentes sectores del deporte en España, incluyendo eventos deportivos, desarrollo de base para el deporte e infraestructura deportiva.

Continue Reading
Click to comment

Leave a Reply

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Ciencia y tecnología

NotePin de Plaud, impulsado por ChatGPT y que se vende por $169, tiene un lugar permanente en mi bolsa de viaje

Published

on

NotePin de Plaud, impulsado por ChatGPT y que se vende por 9, tiene un lugar permanente en mi bolsa de viaje

Afortunadamente, la insignia Plaud.AI ocupaba poco espacio en mi bolso de mano. También me dio un doble golpe: estaba volando por todo el país y sabía que iba a tomar muchas notas.

Si alguna vez has estado en una reunión conmigo, sabrás que siempre llevo mi computadora portátil. Mi estúpido cerebro necesita tomar notas. Dicho esto, escribir mientras se escucha puede distraer tanto como ser interesante. Como mínimo, te impide mantener una conversación natural, especialmente en esos momentos en los que sigues escribiendo después de que la otra persona ha terminado de hablar.

Por supuesto, puedes intentar escribir más rápido o encontrar un atajo, pero descubrí que ambos métodos tienden a hacer que el texto sea ilegible. El siguiente paso obvio es grabar, con el permiso de la otra persona, por supuesto. Cuando era un periodista novato, las grabadoras de voz digitales independientes todavía eran una preocupación común.

Hoy grabo en mi computadora portátil o pongo mi teléfono en la mesa entre el sujeto y yo. Estos dispositivos presentan sus propios problemas, como la falta de micrófonos adecuados y la tendencia a captar ruidos al escribir cuando cumplen una doble función. Siento una ligera nostalgia por los días en que tenía mi pequeña grabadora Olympus con su llave USB-A incorporada.

El motivo de Plaud.AI se encuentra en algún punto entre los escenarios anteriores. A principios de este año, la startup lanzó Plaud Note, un dispositivo de grabación que se conecta magnéticamente a la parte posterior de un teléfono celular y utiliza ChatGPT para transcribir conversaciones. Aunque no tuve la oportunidad de probar este dispositivo anterior, aproveché la oportunidad cuando la compañía me habló sobre el próximo NotePin.

READ  Los servicios de Apple actualmente están experimentando ralentizaciones e interrupciones
Créditos de imagen: Calefacción Brian

Dudo que este producto tenga una gran audiencia en la era de los teléfonos inteligentes que lo hacen todo, pero estaba seguro de que sería uno de ellos. A veces siento que estoy tomando notas sólo para tener algo que hacer en las reuniones. Digo esto porque muchas de mis notas languidecen, por no poder encontrar información relevante o simplemente por ser indescifrables.

Otter.AI me ayudó mucho en ambos frentes cuando subí grabaciones al servicio de transcripción impulsado por IA. El proceso de Plaud es similar, pero más sencillo. En el caso de NotePin, lo usa en su muñeca o lo sujeta magnéticamente a su solapa, toca una vez para guardar y toca nuevamente para detener. Las grabaciones se guardan en su teléfono en tiempo real y desde allí puede decidir si descargarlas o no para transcribirlas, dependiendo de qué tan sólida sea su suscripción mensual.

El dispositivo de $169 viene con 300 minutos de transcripción mensuales gratuitos. Mientras tanto, el plan Pro cuesta $ 6,60 por mes, lo que cuadriplica los minutos de transcripción y agrega algunas funciones como plantillas personalizadas y «Pregunte a AI», que la compañía describe como «un agente de IA para extraer más información de los registros, información que no fue descubierta». a través de modelos resumidos e información que abarca múltiples registros”.

En última instancia, elegir una cuenta Pro dependerá de la cantidad de tiempo que pases en reuniones por mes. Dado que la mayoría de mis reuniones se realizan por teleconferencia, no creo que actualice. Pero quién sabe: tal vez los millones de sesiones informativas a las que asistiré en el CES en enero me obliguen.

READ  La interrupción de la indexación de Google News da como resultado menos tráfico para los editores de contenido

Una cosa que realmente me gusta de Plaud es el diseño deliberado de la empresa. El concepto de registrar la vida fue un fracaso. Creo que mucho de esto se debe a que la mayoría de la gente no quiere registrar todas sus idas y venidas diarias. Y las personas que conocen generalmente no quieren ser grabadas.

El NotePin es deliberado en el sentido de que lo presionas para activarlo. Esta es una acción intencional que probablemente la persona sentada frente a usted notará. Cuando comience la grabación, sentirás un breve zumbido háptico. Si eso no es suficiente para disipar tus miedos, puedes abrir la aplicación Plaud en tu teléfono para ver si realmente se está grabando. Cuando haya terminado, otra pulsación le dará un zumbido háptico para indicar que la grabación se ha completado.

Créditos de imagen: Calefacción Brian

GPT hace un buen trabajo con transcripciones y resúmenes. También hay una herramienta de mapas mentales, aunque no la encontré particularmente interesante. Los hablantes están separados por voz y el sistema es capaz de manejar varios hablantes en 59 idiomas. El texto es claro, la interfaz es fácil de usar y los resúmenes son útiles. También es muy fácil compartir un enlace al audio con un colega.

Mi mayor problema actualmente, como usuario de Otter desde hace mucho tiempo, es la imposibilidad de tocar palabras en la transcripción para reproducir el audio correspondiente. Creo que esto es algo que Plaud planea agregar, si aún no lo ha hecho.

A diferencia de otros pines de IA, el producto de Plaud parece ser una solución a problemas del mundo real. Estos son problemas a los que me enfrento todo el tiempo como periodista. Mi mayor pregunta en este momento es si hay suficientes personas en el mundo como yo para apoyar el modelo de negocio de Plaud.

READ  Galaxy Tab S10 Ultra filtrado en renders [Gallery]
Continue Reading

Ciencia y tecnología

Aleatorio: alguien imprimió en 3D el supuesto diseño del “Switch 2”

Published

on

Aleatorio: alguien imprimió en 3D el supuesto diseño del “Switch 2”
En la foto: el Switch actual — Imagen: Nintendo

Hasta ahora ha sido una semana llena de acontecimientos en el mundo de Nintendo, con el rumoreado diseño del sucesor del Switch apareciendo en línea.

Ya hemos visto fotos de este diseño más grande y ligeramente más curvo, y ahora una Canal de YouTube (小宁子 XNZ) mostró un “primer vistazo” a una versión impresa en 3D a escala 1:1 de este sistema. La YouTuber detrás de este canal también afirma que tiene el archivo de este modelo «desde hace un tiempo».

Tenga en cuenta que esto es solo una maqueta basada en la supuesta filtración y estamos esperando un anuncio oficial de Nintendo. Como ya hemos mencionado, esto puede ser completamente incorrecto, pero aún así es interesante ver cómo se ve en comparación con el sistema actual:

Nintendo confirmó previamente que anunciaría el «sucesor» de Switch en el año fiscal actual, que finaliza en marzo de 2025. Rumores recientes han sugerido que un anuncio podría llegar muy pronto, pero el lanzamiento aún podría llevar algún tiempo.

Puedes ver el vídeo completo de esta impresión 3D a continuación. También aborda muchos otros rumores sobre el “Switch 2”, incluidos los controladores y el rendimiento del sistema. Una vez más, tómate todo lo que veas y escuches aquí con un gran grano de sal.

Continue Reading

Ciencia y tecnología

Los primeros pedidos anticipados de iPhone 16 llegan mientras se forman colas en las tiendas Apple de todo el mundo

Published

on

Los primeros pedidos anticipados de iPhone 16 llegan mientras se forman colas en las tiendas Apple de todo el mundo

A medida que se acerca el 20 de septiembre, el lanzamiento del iPhone 16 y del iPhone 16 Pro está en pleno apogeo. Los primeros pedidos anticipados han comenzado a llegar a compradores satisfechos, mientras que comienzan a formarse colas en las Apple Store.

Como destacamos anteriormente, la tienda insignia de Apple en la Quinta Avenida también brilla con los colores de Apple Intelligence para celebrar el lanzamiento del iPhone 16.

Crédito de la foto principal: SoyaCincau en X

Los emocionados usuarios de iPhone 16 y iPhone 16 Pro acudieron a varias plataformas de redes sociales para mostrar sus nuevos dispositivos. También es hora de lanzar el Apple Watch Series 10 y el nuevo Apple Watch Ultra 2 en Satin Black.

El iPhone 16 está disponible en cinco nuevos colores: negro, blanco, rosa, verde azulado y azul ultramar. El iPhone 16 Pro está disponible en cuatro colores: titanio natural, titanio blanco, titanio negro y titanio desierto.

También están empezando a formarse colas en las Apple Store de todo el mundo. Aquí hay un vistazo a la cola en Apple Sydney, cortesía de nuestro amigo Sam Kohl:

Además, las personas que reservaron su iPhone 16 para recogerlo en la tienda comenzaron a ver que el estado de su pedido cambiaba a «Listo para recoger» en la aplicación Apple Store. Por supuesto, no podrás recoger tu pedido hasta mañana a la hora asignada. Así que no intentes ir a tu Apple Store esta noche.

¿Ya has desempaquetado tu nuevo iPhone 16 o Apple Watch? Si es así, comparte algunas fotos y cuéntanos lo que piensas en los comentarios.

Los mejores accesorios para iPhone 16

Apple The Exchange TRX (Malasia), Crédito: SoyaCincau en

READ  Microsoft ya está preparando el próximo gran salto en Windows 10

Apple Fukuoka (Japón), crédito: Riu en

Apple Marunouchi (Japón), crédito: @okaymac1 en

Apple Berlín (Alemania), Crédito: Parma en X

Apple The Exchange TRX (Malasia), Crédito: SoyaCincau en

FTC: utilizamos enlaces de afiliados automáticos que generan ingresos. Más.

Continue Reading

Trending