Salir al mercado con una aplicación de asistente de voz en 8 semanas

Mauro López

28 de marzo de 2025

4 min leer

Gracias a la gran variedad de bloques de construcción disponibles en la actualidad para crear experiencias de voz proporcionadas por OpenAI, Google, AWS y Microsoft, la complejidad de crear aplicaciones de asistentes de voz con capacidades conversacionales se ha reducido drásticamente.

Fondo

Si hace cinco años un cliente nos hubiera pedido una aplicación móvil en la que los usuarios pudieran hacer preguntas con su voz y la aplicación respondiera de forma natural, con una voz amigable y extrayendo información de una base de conocimientos específica relacionada con el ámbito del cliente (por ejemplo, una cadena de supermercados cuyos clientes pudieran hacer a la aplicación preguntas como "¿En qué tienda puedo encontrar huevos ecológicos?"), yo habría presupuestado un proyecto enorme, habría pedido ayuda a muchos de nuestros socios y habría calificado el proyecto de muy arriesgado.

Sin embargo, desde que OpenAI liberó sus modelos para el consumo de terceros a través de API, ha permitido a todo el mundo integrar la IA Generativa en sus negocios. Más tarde, otros actores importantes del mercado lanzaron sus modelos conversacionales y añadieron soporte de voz, como Vertex AI de Google y AWS Lex.

Caso práctico

Hace poco tuvimos la oportunidad de utilizar la API en tiempo real de OpenAI para ofrecer una aplicación a un cliente cuya base de conocimientos era difícil de entender, buscar y aprender para muchas personas.

El objetivo: crear una aplicación móvil que ayude a los usuarios a navegar por la base de conocimientos y les permita utilizar su voz para consultarla.

El presupuesto era limitado, por lo que solo podíamos asignar un pequeño equipo de dos personas -un desarrollador backend y un desarrollador móvil- durante unas semanas. Elegimos React Native para construir la aplicación, ya que necesitábamos salir al mercado rápidamente, y este cliente no requería una experiencia de grado nativo. Además, utilizamos un UI Kit para el desarrollo UX/UI, WebRTC para el transporte de voz y un backend Django para conectar la aplicación a la base de conocimientos.

Diagrama de flujo de la arquitectura de una app móvil que utiliza la API de OpenAI, React Native, Django y WebRTC para la navegación por la base de conocimientos basada en voz.

Inteligencia artificial generativa

Antes de elegir qué proveedor de IA utilizar, hicimos una comparación entre funciones y costes, y la API en tiempo real de OpenAI fue la ganadora (el coste es de unos 0,40 dólares por cada cinco minutos de audio para GPT4o-mini).

Aprovechamos sus funciones de agente para crear un agente que guiara a los usuarios a través de las conversaciones hasta que llegaran al contenido deseado.

Diagrama de flujo que muestra cómo el agente de la API en tiempo real de OpenAI guía a los usuarios hasta el contenido de la base de conocimientos mediante consultas estructuradas y de ingeniería rápida.

El trabajo duro del proyecto incluyó el diseño de la interfaz de usuario de la aplicación, la creación de la capa API para acceder a la base de conocimientos y la ingeniería para crear el agente, que aprovechó la función de "funciones" para extraer datos de fuentes externas.

Al redactar la pregunta, tuvimos que asegurarnos de que el agente no se desviara de las respuestas generadas por la base de conocimientos, pero también de que fuera lo suficientemente flexible como para permitir al usuario buscar utilizando una docena de estilos de preguntas diferentes.

Conectar el agente a la base de conocimientos aws también un reto, ya que teníamos que asegurarnos de que las frases en lenguaje natural que el usuario utilizaba para buscar temas se convirtieran en consultas estructuradas que pudiéramos enviar a una base de datos.

El uso de los módulos de Open AI hizo posible este proyecto, reduciendo la complejidad a "sólo" tener que crear una aplicación móvil normal. Tras unas semanas y demostraciones al cliente, la aplicación estaba lista.

En Nimble Gravity ofrecemos soluciones rentables para validar productos rápidamente. Póngase en contacto con nosotros si cree que podemos ayudarle con retos similares.

‍

Lecturas Recomendadas

Reinventar la fabricación: De los sistemas heredados a las cadenas de suministro digitales

Lectura en 3 minutos

6 de marzo de 2025

SEO y SCO en la Era de las Herramientas de Búsqueda basadas en IA

Lectura en 3 minutos

17 de diciembre de 2024

"Dime qué quieres que haga": guía del director técnico para profundizar en la relación con los empleados

Lectura en 3 minutos

4 de enero de 2024

Escribir código para el futuro (que sin duda le juzgará)

Lectura en 4 minutos

26 de junio de 2025

5 verdades desagradables sobre la Inteligencia Artificial y la Analítica de Datos en las empresas

Lectura en 3 minutos

16 de junio de 2023

¿Qué es la inteligencia empresarial? Cómo transformar los datos en información empresarial

Lectura en 3 minutos

25 de julio de 2022

Seguimiento del Valor de los Proyectos de IA: Impacto Cuantificable

Lectura en 3 minutos

13 de diciembre de 2024

Microsoft Experience Day 2024: La inteligencia artificial como motor de crecimiento empresarial en Centroamérica

Lectura en 3 minutos

17 de octubre de 2024

Ingeniería de agentes de IA: Cuanto más cambian las cosas, más permanecen igual

Lectura en 3 minutos

7 de julio de 2025

La evolución de la inteligencia artificial y cómo ha revolucionado las empresas

Lectura en 4 minutos

23 de junio de 2023

Adopción de la IA Generativa: Cerrando la Brecha entre la Expectativa y la Realidad

Lectura en 2 minutos

7 de noviembre de 2024

Cómo financiar su proyecto informático o tecnológico

Lectura en 3 minutos

22 de agosto de 2024

¿Listo para construir lo que realmente importa?

Hablemos

Transformemos‍tu negocio

Salir al mercado con una aplicación de asistente de voz en 8 semanas

Fondo

Caso práctico

Inteligencia artificial generativa

Lecturas Recomendadas

Reinventar la fabricación: De los sistemas heredados a las cadenas de suministro digitales

SEO y SCO en la Era de las Herramientas de Búsqueda basadas en IA

"Dime qué quieres que haga": guía del director técnico para profundizar en la relación con los empleados

Escribir código para el futuro (que sin duda le juzgará)

5 verdades desagradables sobre la Inteligencia Artificial y la Analítica de Datos en las empresas

¿Qué es la inteligencia empresarial? Cómo transformar los datos en información empresarial

Seguimiento del Valor de los Proyectos de IA: Impacto Cuantificable

Microsoft Experience Day 2024: La inteligencia artificial como motor de crecimiento empresarial en Centroamérica

Ingeniería de agentes de IA: Cuanto más cambian las cosas, más permanecen igual

La evolución de la inteligencia artificial y cómo ha revolucionado las empresas

Adopción de la IA Generativa: Cerrando la Brecha entre la Expectativa y la Realidad

Cómo financiar su proyecto informático o tecnológico

¿Listo para construir lo que realmente importa?

Transformemos
‍tu negocio