Amazon ha presentado su nuevo modelo con reconocimiento de voz, Nova Sonic se ha convertido en un competidor inesperado de ChatGPT y Gemini. La IA es capaz de reconocer voces e interaccionar de una forma más natural.
Amazon presenta Nova Sonic, su nuevo modelo de voz basado en IA que desafía a Google y OpenAI
Computer Hoy
Claudia Pacheco
ChatGPT y Gemini podrían haber encontrado un nuevo competidor en inteligencia artificial que sería incluso más peligroso que DeepSeek o Claude. La alternativa al chatbot de OpenAI y Google llega de la mano de Amazon con Nova Sonic.
La empresa fundada por Jeff Bezos acaba de anunciar su nuevo chatbot Nova Sonic, Amazon ha mostrado todo su potencial en las primeras pruebas. Este modelo de voz ha conseguido algo histórico: la IA es capaz de mantener conversaciones en tiempo real gestionando su tono o decidiendo el momento adecuado para responder.
El gigante de las ventas online asegura que este modelo de audio tiene la relación calidad-precio más baja de la industria, aunque no ha revelado el coste por acción. Amazon tendría que competir con modelos como DeepSeek con un precio de 83.000 euros al día, ChatGPT le supera con 700.000 euros.
Nova Sonic es un modelo todo en uno
Los desarrolladores de Nova Sonic han conseguido algo extremadamente complejo. El chatbot de Amazon combina múltiples modelos: uno de reconocimiento de voz para convertir voz a texto, otro de texto a voz y lenguajes para comprender y generar respuestas.
La inteligencia artificial está avanzando en los últimos años hasta límites insospechados, pero seguía siendo todo un reto conseguir que entienda el contexto o las emociones. Nova Sonic no solo es capaz de comprender indicaciones mediante voz, puede captar matices como el tono o el estilo de habla.
Nova Sonic es uno de los modelos de voz y texto más completos hasta el momento. Amazon ha conseguido combinar las capacidades de comprensión y generación de audio en un solo chatbot.
Amazon consigue que las conversaciones con la IA sean más naturales,

Nova Sonic puede mantener conversaciones con humanos de forma más natural que nunca. Imagen generada con IA.
Los gigantes de la IA como OpenAI y Google han intentado crear un chatbot capaz de mantener conversaciones al estilo de los humanos, pero el proceso no ha sido sencillo. Amazon lo ha conseguido con Nova Sonic en tiempo récord, incluso ha añadido funciones como moderación de contenido.
La IA de Amazon permite comprender el tono de la persona y adaptarse así a la conversación. ¿El resultado? Nova Sonic es capaz de mantener una conversación más natural, incluso puede decidir el momento adecuado para responder al usuario y gestionar las interrupciones.
Nova Sonic es compatible con voces masculinas y femeninas, aunque por el momento solo es capaz de detectar algunos acentos del inglés, incluyendo el estadounidense y el británico. Los desarrolladores trabajan para que llegue muy pronto a otros idiomas, entre ellos el español.
OpenAI ha lanzado modelos de conversión de voz a texto similares con GPT-4o-transcribe y GPT-4o-mini-transcribe. La empresa de Sam Altman ha conseguido mejoras significativas en la tasa de error de palabras, precisión de las respuestas y reconocimiento del idioma, pero Nova Sonic podría superarle.