Saltar al contenido principal

Documentation Index

Fetch the complete documentation index at: https://docs.tokenlab.sh/llms.txt

Use this file to discover all available pages before exploring further.

Resumen

Traduce audio en cualquier idioma compatible a texto en inglés. A diferencia de la transcripción, este endpoint siempre devuelve texto en inglés independientemente del idioma de entrada.

Cuerpo de la solicitud

Tiempo de espera de solicitudes síncronas: este endpoint no-chat espera a que el modelo enrutado termine. Entradas grandes, audio largo o lotes grandes pueden superar los valores predeterminados habituales de 30s del cliente, así que configura el timeout de tu cliente HTTP en al menos 120s.
file
file
requerido
El archivo de audio a traducir. Formatos compatibles: flac, mp3, mp4, mpeg, mpga, m4a, ogg, wav, webm. El tamaño máximo del archivo es de 25 MB.
model
string
predeterminado:"whisper-1"
El modelo que se utilizará. Actualmente, solo se admite whisper-1.
prompt
string
Un texto opcional para guiar el estilo del modelo o continuar un segmento anterior. Debe estar en inglés.
response_format
string
predeterminado:"json"
El formato de la salida. Opciones: json, text, srt, verbose_json, vtt.
temperature
number
La temperatura de muestreo, entre 0 y 1. Los valores más altos, como 0.8, producen una salida más aleatoria, mientras que los valores más bajos, como 0.2, hacen que la salida sea más enfocada y determinista.

Respuesta

text
string
El texto traducido en inglés.
Para el formato verbose_json, la respuesta también incluye:
language
string
El idioma detectado del audio de entrada.
duration
number
La duración del audio de entrada en segundos.
segments
array
Segmentos del texto traducido con marcas de tiempo.
curl -X POST "https://api.tokenlab.sh/v1/audio/translations" \
  -H "Authorization: Bearer sk-your-api-key" \
  -F "file=@german_audio.mp3" \
  -F "model=whisper-1"
{
  "text": "Hello, my name is Wolfgang and I come from Germany. Where are you from?"
}

Traducción vs Transcripción

CaracterísticaTraducciónTranscripción
Idioma de salidaSiempre inglésIgual que la entrada
Caso de usoConvertir audio en otro idioma a inglésPreservar el idioma original
Parámetro de idiomaNo aplicablePista opcional
El endpoint de traducción detecta automáticamente el idioma de origen y traduce al inglés. El parámetro language de la transcripción se ignora.