Documentation Index
Fetch the complete documentation index at: https://docs.tokenlab.sh/llms.txt
Use this file to discover all available pages before exploring further.
Corps de la requête
Timeout des requêtes synchrones : cet endpoint non-chat attend que le modèle routé termine son traitement. Les entrées volumineuses, les longs fichiers audio ou les grands lots peuvent dépasser les valeurs par défaut courantes de 30s côté client ; configurez donc le timeout de votre client HTTP à au moins120s.
Fichier audio à transcrire. Formats pris en charge : flac, mp3, mp4, mpeg, mpga, m4a, ogg, wav, webm.
Modèle à utiliser. Actuellement, seul
whisper-1 est pris en charge.Langue de l’audio au format ISO-639-1 (par ex.,
en, zh, ja).Texte facultatif pour guider le style du modèle ou poursuivre un segment précédent.
Format de sortie :
json, text, srt, verbose_json, vtt.Température d’échantillonnage (de 0 à 1).
Granularité des horodatages :
word et/ou segment. Nécessite verbose_json.Réponse
Le texte transcrit.
verbose_json :
Toujours
transcribe.Langue détectée.
Durée de l’audio en secondes.
Segments de transcription avec horodatages.
Horodatages au niveau des mots (si demandés).