Presentación de Voicegain Whisper

La mejor API de conversión de voz a texto para Whisper de OpenAI

Acceda al modelo Whisper de OpenAI con las API REST fáciles de usar de Voicegain. Obtenga soporte empresarial de Voicegain, cumplimiento de SOC2 y PCI y funciones añadidas como soporte de dos canales (estéreo), diarización, marcas de tiempo a nivel de palabra y mucho más.

* No se requiere tarjeta de crédito.
Con la confianza de empresas que crean productos increíbles
API de Voicegain Whisper
Conoce OpenAI Whisper
¿Por qué utilizar Whisper ASR de OpenAI para la transcripción por lotes?

Whisper es un modelo de reconocimiento automático del habla (ASR) de código abierto basado en aprendizaje profundo desarrollado por Open AI. Whisper se ha entrenado con 680 000 horas de datos multilingües, lo que le permite trabajar bien con distintos acentos y ruidos de fondo.

Arquitectura de los transformadores

La arquitectura Whisper es un enfoque sencillo de extremo a extremo, implementado como un transformador codificador-decodificador.

Másters en Inteligencia Artificial Conversacional

Los desarrolladores pueden alimentar fácilmente la salida de la transcripción a un LLM como GPT para mejorar la legibilidad de la transcripción, resumirla, extraer el sentimiento y más análisis.

Varios idiomas

OpenAI Whisper ASR can transcribe in multiple languages. The following 57 languages have a Word Error Rate of < 50%. Check out our fine-tuning services to get a better ASR.

Ajuste fino para una mayor precisión

Whisper está entrenado principalmente para el inglés, por lo que las tasas de error de palabras en otros idiomas pueden seguir siendo elevadas. Voicegain ofrece servicios de ajuste de Whisper en sus datos para obtener mayor precisión y menor WER.

¿Por qué Voicegain Whisper?

Precios asequibles

La API de conversión de voz a texto Voicegain Whisper tiene un precio asequible de 0,25 $/hora (para una instancia basada en EE. UU.); es un 40% inferior al precio de Open AI (a fecha de diciembre de 2023).

Arrendatario individual

Implemente Voicegain Whisper en su centro de datos o en su instancia VPC para obtener la máxima privacidad y control de los datos. Ingiera nuestros registros y métricas en su Grafana para supervisar el rendimiento.

Diarización y marcas de tiempo

Voicegain Whisper añade funciones clave como la diarización y las marcas de tiempo a nivel de palabra a Whisper de Open AI.

Asistencia de clase empresarial 24/7

Voicegain ofrece un soporte de clase empresarial de alta calidad las 24 horas del día, los 7 días de la semana, para el modelo Whisper. Esto permite a los desarrolladores centrar sus esfuerzos en la optimización de LLM y utilizar nuestras API para ASR.

Cumplimiento de PCI-DSS y SOC-2

Voicegain es una organización que cumple las normas PCI-DSS y SOC-2. Redactamos todas las entidades relacionadas con PCI y PII, tanto en la transcripción como en el audio. Escaneamos el código subyacente en busca de vulnerabilidades y mantenemos actualizadas todas las bibliotecas.

Servicios de puesta a punto de Whisper

Whisper se ha entrenado principalmente con conjuntos de datos en inglés disponibles públicamente. Voicegain puede ofrecer servicios de ajuste de Whisper con sus datos para reducir la WER en su conjunto de datos.

Lo que dicen nuestros clientes..
Utilice Voicegain Whisper hoy mismo
Empiece a utilizar
Voicegain Whisper

Registrarse en Voicegain

Puede registrarse hoy mismo para obtener una cuenta de desarrollador utilizando su dirección de correo electrónico profesional.

  • Crédito gratuito de 2000 horas de transcripción
  • No es necesario presentar una tarjeta de crédito
Inscríbete ahora

Elija la opción adecuada para usted

Si desea comprobar rápidamente la precisión de Whisper sin escribir código, puede consultar la primera opción mencionada a continuación. Si es un desarrollador y desea probar nuestras API, consulte la opción 2 a continuación.

Utilice la interfaz de usuario de nuestra consola para desarrolladores
Uso de las API de Transcribe (/asr/transcribe/async)
Preguntas frecuentes
Idiomas admitidos
Visite nuestro blog para obtener información, puntos de referencia y mucho más.
Blog de Voicegain