OpenAI está revolucionando la transcripción de audio a texto con Whisper mientras todos seguimos centrados en ChatGPT y DALL-E

Si hace un año Whisper V2 ya se convirtió en nuestra herramienta favorita para transcribir entrevistas, Whisper V3 va un paso más allá

Whisper v3

Los protagonistas del reciente evento DevDay de OpenAI fueron el lanzamiento de GPT-4 Turbo y de los GPTs personalizados (y su correspondiente ‘store’). Estas fueron las novedades que acapararon el interés mediático y la atención del usuario… pero había un ‘tapado’, una nueva IA a la que sólo ahora, días después, estamos valorando en su justa medida.

Os hablamos de la IA de trascripción de audio a texto Whisper V3, una IA open source (al contrario que ChatGPT o DALL·E), por lo que ya está disponible para su uso online gratuito a través de plataformas como Hugging Face o Replicate. Y es de esperar que, en breve, cuente con varios clientes de escritorio (como Buzz, que funciona con Whisper V2).

Un antes y un después

Hasta hace cosa de un año, la transcripción de audio a texto siempre resultó un desafío para la mayoría de los usuarios, pues las herramientas gratuitas a las que podían disponer acostumbraban a cometer numerosos errores. Whisper V2 fue la primera herramienta gratuita que convenció a muchos usuarios…

…pero con Whisper V3 ya tenemos la sensación de que es el equivalente en su campo a ChatGPT —excepto por la parte de ser 100% gratuito—, una IA que los desarrolladores de software van a empezar a breve a implementar en sus propias aplicaciones.

Además, su versatilidad lo hace ideal tanto para tareas simples de transcripción como para aplicaciones más complejas en el campo de la asistencia por voz.

Comentarios