Saltar al contenido principal

Documentation Index

Fetch the complete documentation index at: https://docs.tokenlab.sh/llms.txt

Use this file to discover all available pages before exploring further.

Cuerpo de la solicitud

Tiempo de espera de solicitudes síncronas: este endpoint no-chat espera a que el modelo enrutado termine. Entradas grandes, audio largo o lotes grandes pueden superar los valores predeterminados habituales de 30s del cliente, así que configura el timeout de tu cliente HTTP en al menos 120s.
model
string
predeterminado:"tts-1"
Modelo TTS: tts-1 (estándar) o tts-1-hd (mayor calidad).
input
string
requerido
El texto para el que se generará audio. Máximo 4096 caracteres.
voice
string
requerido
Voz a usar: alloy, ash, ballad, coral, echo, fable, nova, onyx, sage, shimmer, verse.
response_format
string
predeterminado:"mp3"
Formato de audio: mp3, opus, aac, flac, wav, pcm.
speed
number
predeterminado:"1.0"
Velocidad del audio (0.25 a 4.0).

Respuesta

Devuelve el archivo de audio en el formato solicitado.
curl -X POST "https://api.tokenlab.sh/v1/audio/speech" \
  -H "Authorization: Bearer sk-your-api-key" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "tts-1-hd",
    "voice": "nova",
    "input": "Hello, welcome to TokenLab!"
  }' \
  --output speech.mp3

Muestras de voz

VozDescripción
alloyNeutral, equilibrada
ashTranquila, medida
balladMelódica, expresiva
coralCálida, acogedora
echoCálida, conversacional
fableExpresiva, narrativa
novaAmigable, clara
onyxProfunda, autoritaria
sageSabia, reflexiva
shimmerSuave, delicada
verseDinámica, versátil