Precios de pago por uso sin compromiso. 50 $ en créditos al registrarse, sin necesidad de tarjeta de crédito para empezar hoy mismo. Se aplican límites de tarifa; obtenga límites de tarifa personalizados con compromisos de ingresos. Póngase en contacto con nosotros para obtener más información.
Empezar - Crédito gratuito1. El uso de la plataforma se mide y se factura por segundo, pero nuestro sistema de facturación muestra el uso en horas.
2. 2. Cada solicitud de API está sujeta a una facturación mínima de 6 segundos y un incremento de 1 segundo después de eso. Una petición en tiempo real de 4 segundos se factura por 6 segundos o 0,0012$ (0,00020$*6) y una petición en tiempo real de 7 segundos se factura 0,00020$*7.
3. STT Offline-Basic ofrece STT en un monocanal sin Diarización y sin Redacción PII. El precio básico incluye Voicegain Whisper-small. STT Offline-Enhanced ofrece Diarización y Redacción PII además de la Transcripción. Voicegain Whisper-medium se proporciona a precio Enhanced. También soporta 2 canales para grabaciones de Call Center donde el agente y el llamante están en canales separados. STT-Offline - Multi-Channel es para grabaciones de reuniones en Zoom o cualquier otra plataforma de reuniones donde cada orador está en un archivo de audio separado.
4. STT Realtime-Transcription es para el streaming Speech-to-Text de Voicegain sobre Web-sockets. El precio de la tabla es por canal. Ofrecemos un descuento del 50% a los clientes de centros de llamadas en los que el canal del agente y el canal de la persona que llama se transmiten a través de canales separados.
5. El modelo personalizado de voz a texto se construye entrenando nuestro modelo estándar con datos adicionales del cliente (mediante aprendizaje por transferencia). Póngase en contacto con nosotros para consultar precios.
6. STT en tiempo real con MRT. STT-Realtime with MRCP or Telephony Bot API es el precio por el uso de nuestro Speech-to-Text/ASR como parte de una sesión MRCP o Telephony Bot API. Este precio se aplica a toda la duración de la sesión MRCP o Telephony Bot/SIP. No incluye la grabación del 100% de la llamada de las sesiones.
7. Se aplican límites de tarifa para el pago por uso. Ofrecemos límites de tarifa más altos y precios más bajos con compromisos de volumen y plazo. Póngase en contacto con nosotros en sales@voicegain.ai para obtener más información.
Implemente Voicegain en su infraestructura privada. 30 días de prueba gratuita. Se ofrecen licencias basadas en puertos o en uso. Se aplica una compra mínima de puertos/uso. Pueden aplicarse costes de soporte anuales adicionales.
Póngase en contacto con nosotros1. Voicegain Edge se refiere a nuestra plataforma desplegada en la infraestructura del cliente (bare-metal o VPC). Voicegain se despliega en un clúster Kubernetes. Preferimos GPUs NVIDIA para aplicaciones que requieren alta concurrencia. Las CPU son compatibles con aplicaciones de baja concurrencia. La orquestación del clúster se realiza desde la nube de Voicegain.
2. Costes de infraestructura. El cliente incurrirá en costes de infraestructura y es responsable de la monitorización de Kubernetes. Para VPC, recomendamos Kubernetes gestionado desde el proveedor de la nube y para Datacenter, puede ponerse en contacto con nosotros para las opciones de soporte.
3. "Puerto" - para STT Offline - se define como rendimiento. Así, 25 puertos le permitirían transcribir 25 horas de audio sin conexión por hora. Para STT en tiempo real, Puerto es el número de sesiones web-socket concurrentes. Por ejemplo, 25 puertos significa un máximo de 25 sesiones STT simultáneas en tiempo real durante un mes.
4. Licencia por uso. Para las licencias basadas en el uso, cada solicitud está sujeta a una facturación mínima de 6 segundos y un incremento de 1 segundo después de eso. Por ejemplo, una solicitud en tiempo real de 4 segundos se facturará por 6 segundos o 0,0012 $ (0,00020 $*6) y una solicitud en tiempo real de 7 segundos se facturará por 7 segundos.
5. Voicegain ofrece descuentos por volumen. Voicegain ofrece descuentos por volumen y plazos. Póngase en contacto con nosotros en sales@voicegain.ai para recibir precios personalizados.
Puedes transmitir audio para la API de transcripción de Voicegain desde cualquier ordenador, pero a veces es útil tener un dispositivo barato dedicado sólo para esta tarea. A continuación relatamos la experiencia de uno de nuestros clientes en el uso de una Raspbery Pi para transmitir audio para la transcripción en tiempo real. Sustituyó a un Mac Mini que se utilizó inicialmente para ese fin. El uso de Pi tenía dos ventajas: a) obviamente, el coste, y b) es menos probable que el Mac Mini sea "secuestrado" para otros fines.
Voicegain Audio Streaming Daemon requiere muy poco en cuanto a recursos informáticos, por lo que incluso en una Raspberry Pi Zero es suficiente; sin embargo, recomendamos usar Raspberry Pi 3 B+ principalmente porque tiene a bordo un puerto Ethernet cableado de 1Gbps. Las conexiones WiFi son más propensas a tener problemas con el streaming utilizando el protocolo UDP.
Aquí hay una lista de todo el hardware utilizado en el proyecto (con precios de amazon (a julio de 2019)):
Todos los componentes sumaron un total de 101,97 dólares. La razón por la que se incluyeron un mini monitor y un mini teclado es que hacen más cómodo controlar el dispositivo mientras está en el rack de audio. Por ejemplo, el mezclador de audio alsa se puede ajustar fácilmente de esta manera, mientras que al mismo tiempo se controla el nivel del audio a través de los auriculares.
Raspberry PI ejecutando AudioDaemon
El dispositivo está ejecutando Raspbian estándar que se puede instalar fácilmente desde una imagen utilizando, por ejemplo, balenaEtcher. Después de la instalación base, se necesitaba lo siguiente para poner las cosas en marcha:
Estas son algunas de las lecciones aprendidas con esta configuración en los últimos 6 meses:
Puedes encontrar el código completo (menos la lógica RASA - tendrás que proporcionar la tuya propia) en nuestro repositorio github.
La configuración permite llamar a un número de teléfono y luego interactuar con un Voicebot que utiliza RASA como motor lógico de diálogo.
Actualización de noviembre de 2021: No recomendamos S3 y AWS Lambda para una configuración de producción. Una revisión más actualizada de varias opciones para construir un Voice Bot se describe aquí. Debería considerar sustituir la funcionalidad de S3 y AWS Lambda por un servidor web capaz de mantener el estado, como Node.js o Python Flask.
A continuación se presenta el diagrama secuencial. Básicamente, la secuencia de operaciones es la siguiente:
¿Le interesa personalizar el ASR o implantar Voicegain en su infraestructura?