Tecnología

Bidi 1 podría resolver uno de los mayores problemas de ChatGPT

Bidi 1 podría resolver uno de los mayores problemas de ChatGPT
Avatar
  • Publishedjunio 23, 2026



Algunas tecnologías cambian poco a poco, mientras que otras avanzan a pasos agigantados. La IA conversacional parece caer en la primera categoría, al menos por ahora. Cada nueva versión mejora la anterior, pero la sensación de hablar con una máquina permanece. Por eso Bidi 1 generó interés incluso antes de que se anunciara oficialmente. Si la característica filtrada termina siendo conocida por el público, Quizás estemos ante uno de los avances más importantes en la evolución de la voz ChatGPT.

Esta información proviene de TestingCatalog, donde Se detectó una referencia a un nuevo modelo llamado GPT-Bidi-1 en el código ChatGPT. Según las fuentes, OpenAI probará la nueva tecnología internamente y ya ha comenzará a implementarlo en un grupo limitado de usuarios solicitud. La compañía aún no ha hecho ningún anuncio oficial, por lo que se recomienda tratar todos los detalles conocidos como información preliminar basada en filtraciones y pruebas iniciales.

El nombre no parece ser una coincidencia. «Bidi» es la abreviatura de «bidireccional», Capacidad del sistema de referencia para escuchar y hablar simultáneamente.. Aunque pueda parecer una característica menor, supone una diferencia importante respecto a la mayoría de asistentes actuales. En lugar de esperar a que una persona termine de hablar antes de procesar la información y responder, el sistema podrá mantener una conversación más fluida, adaptándose a interrupciones, cambios de tema o nuevas instrucciones en tiempo real.

Las pruebas realizadas por usuarios con acceso a esta versión muestran exactamente esto. Cuando Bidi 1 detecta una pausa en una conversación puede realizar un pequeño reconocimiento verbalutilizando expresiones cortas similares a las que utilizan las personas para demostrar que todavía están escuchando. yo también puedo Modifique las tareas en curso sin empezar desde cero. Un ejemplo citado por la fuente incluyó pedirle que contara hasta diez y luego decirle que invirtiera el orden de contar antes de terminar. El modelo ajustará inmediatamente su comportamiento.

Sin embargo, las mejoras potenciales más relevantes pueden estar relacionadas con el medio ambiente. Una de las limitaciones que históricamente ha afectado a los sistemas de voz ChatGPT es su dificultad para mantener hilos para conversaciones largas. La información filtrada muestra Bidi 1 conserva mejor el contexto acumulado a lo largo de la interacción, reduciendo la pérdida de referencias anteriores. También evita otro comportamiento común de algunos asistentes de voz: interpretar silencios relativamente largos como el final de una conversación e interrumpir prematuramente al usuario.

Todo esto está en línea con la estrategia que está siguiendo OpenAI para el futuro de ChatGPT. Diversas informaciones recientes indican que La compañía apuesta por una profunda transformación de la plataformacombina herramientas de programación, agentes capaces de realizar tareas y nuevas formas de interacción. En esta visión, el sonido jugará un papel cada vez más importante. La idea es simple: para muchos usuarios, hablar resulta más natural que escribir, especialmente cuando la IA puede responder con tanta rapidez y flexibilidad como la conversación humana.

Es demasiado pronto para saber si el Bidi 1 estará a la altura de todas las expectativas generadas por esta filtración. No está claro cuándo se lanzará ampliamente o si algunas de las características observadas durante las pruebas terminarán siendo parte de la versión final. Parece obvio que OpenAI sigue considerando el habla como una de las grandes fronteras de la inteligencia artificial. Y si Bidi 1 finalmente cumple lo que prometió el primer mensaje, tal vez estemos más cerca de dejar de hablar con la herramienta y comenzar a hablar con ella.





Puedes consultar la fuente de este artículo aquí

Compartir esta noticia en: