Índice:
- Introducción
- ¿Cómo funciona?
- Activación
- Implementación
- Validación del tipo
- Obtener la URL del json del audio
- Transcripción
Introducción
El Blip Speech es nuestro proveedor de voz y permite que añadas la capacidad de comprensión de voz a tu Contacto Inteligente a través de la transcripción de audios.
Por ejemplo: Tienes un contacto inteligente con un flujo listo para interactuar con el cliente de forma autónoma, pero cuando recibe un audio en WhatsApp necesitas informar al cliente que debe interactuar por texto. ¡Blip Speech permite que añadas a tu flujo un bloque para transcribir los audios recibidos por el cliente y así puedas interactuar con él solo por voz!
¿Cómo funciona?
Blip Speech es un comando de Blip, facilitando así la integración de la tecnología propietaria de transcripción de Blip al Contacto Inteligente.
La integración permite:
- La fácil integración de la tecnología al flujo conversacional;
- La transcripción automática de audios en portugués brasileño;
- Posibilidad de transcribir audios en inglés, español y francés.
Activación
Al activar y conectar la integración en la pantalla de Proveedores de IA, esta deberá ser configurada en el flujo del bot.
Nota que al confirmar el uso de Blip Speech, puede recibir un cargo. Consulte la tabla de precios en el enlace del modal y entienda los costos. Estamos desarrollando una pantalla que mostrará información sobre el consumo, que estará disponible pronto.
Implementación
Antes de implementar Blip Speech en el flujo conversacional, es necesario realizar algunas etapas en el flujo conversacional.
Validación del tipo
La primera etapa es la validación del tipo de mensaje recibido por el bot. Es decir, permitir que el mensaje sea transcrito solo si su tipo es un audio.
Obtener la URL del json del audio
En una acción de entrada en el bloque donde se realizará la transcripción, solo coloca la variable de entrada correspondiente a la variable del mensaje de audio enviado por el usuario, como en la imagen a continuación:
Aún en esta acción, haciendo clic en SCRIPT, obtenga la URL usando el código en javascript a continuación:
function run(input){
input = JSON.parse(input)
return input['uri']
}
Y por último, colocar una variable de retorno que tendrá el valor de la URL lista para ser transcrita en el paso siguiente.
Transcripción
Para realizar la transcripción, es necesario procesar un comando como acción de entrada.
El comando debe completarse según la imagen a continuación. La variable de respuesta puede tener el nombre de su elección. En el ejemplo a continuación, la variable que se devolverá con la transcripción es la transcriptionResult.
Haciendo clic en Recursos, pondrá el json que contiene la información necesaria para comunicarse correctamente con Blip Speech. Son ellas:
url: Variable que corresponde a la url del audio enviado;
guid: Variable con identificador alfanumérico único;
contactId: Variable con la identidad de la aplicación del bot (igual a 'identifier@domain');
maxDuration: Duración máxima de un audio a ser transcrito, en segundos. Si no se proporciona un valor de maxDuration, se establecerá por defecto en 600 segundos.
language: El idioma de los audios que serán transcritos. Si no se proporciona, su valor por defecto será “auto”, lo que hace que el sistema de transcripción detecte automáticamente el idioma del audio enviado antes de realizar la transcripción.
Como resultado, tendrá un json de esta forma:
{
"url":"{{urlAudio}}",
"guid":"{{random.guid}}",
"contactId":"{{contact.identity}}",
"maxDuration":240,
"language":"pt"
}
Siguiendo los pasos anteriores, al final de este flujo tendrá una variable que contiene la transcripción del audio enviado, para poder seguir con las tratativas de su flujo conversacional.
O si prefiere, puede descargar este flujo haciendo clic aquí, e importarlo en el builder de su contacto inteligente.
Para más información, acceda a la discusión sobre el tema en nuestra comunidad o los videos en nuestro canal. 😃