Skip to content

Open AI mejorará su banco de voz este 2026

OpenAI ha unificado en los últimos dos meses varios equipos de ingeniería, producto e investigación con un único objetivo: revolucionar sus modelos de audio.

La startup está preparando para este primer trimestre de 2026 un modelo de voz más natural, capaz de gestionar interrupciones y de hablar mientras tú hablas, según un reporte de The Information.

Por qué es importante. Este movimiento no busca solo mejorar ChatGPT, sino situar el audio como interfaz principal de interacción, desplazando las pantallas a un segundo plano al menos en ciertos casos de uso. Es lo que intentaron, sin éxito, los altavoces inteligentes de primera generación hace una década.

La apuesta es construir dispositivos personales que funcionen exclusivamente por voz, con un lanzamiento previsto para mediados de 2027.

El contexto. Silicon Valley lleva meses en esta dirección:

Meta añadió cinco micrófonos a sus Ray-Ban Meta 2 para aislar voces en entornos ruidosos.
Google está probando a hacer resúmenes de búsqueda en audio.
Tesla va a integrar a Grok en sus coches para poder controlar ciertos aspectos de forma conversacional.

En detalle. La iniciativa está liderada por Kundan Kumar, antiguo investigador de Character.AI que llegó a OpenAI este verano. El nuevo modelo busca sonar indistinguible de una voz humana y mantener conversaciones fluidas sin los cortes típicos de los asistentes actuales.
Además, la compra en mayo de 2025 de io Products Inc., la startup de Jony Ive, por 6.500 millones de dólares, marca un punto de inflexión. Ive, antiguo jefe de diseño de Apple, es quien lidera ahora las responsabilidades creativas en OpenAI con un equipo de 55 personas. Su filosofía, ya deslizada públicamente, busca reducir la adicción a los dispositivos mediante interfaces que no exijan una atención visual constante.

Qué está ocurriendo. OpenAI contempla varios formatos: altavoces sin pantalla, gafas inteligentes (un segmento en claro auge) y un dispositivo con forma de bolígrafo y operado por voz.

Foxconn fabricará en Vietnam el primer producto, rumoreado como un bolígrafo consciente del contexto. Estos dispositivos se posicionan como complementos de portátiles y móviles, no como sustitutos, al menos por ahora.