Documentation Index
Fetch the complete documentation index at: https://docs.tokenlab.sh/llms.txt
Use this file to discover all available pages before exploring further.
Body Permintaan
Timeout permintaan sinkron: endpoint non-chat ini menunggu model yang dirutekan selesai. Input besar, audio panjang, atau batch besar dapat melebihi default client umum 30s, jadi atur timeout HTTP client Anda minimal120s.
File audio untuk ditranskripsikan. Format yang didukung: flac, mp3, mp4, mpeg, mpga, m4a, ogg, wav, webm.
Model yang digunakan. Saat ini hanya
whisper-1 yang didukung.Bahasa audio dalam format ISO-639-1 (misalnya,
en, zh, ja).Teks opsional untuk memandu gaya model atau melanjutkan segmen sebelumnya.
Format output:
json, text, srt, verbose_json, vtt.Temperatur sampling (0 hingga 1).
Granularitas timestamp:
word dan/atau segment. Memerlukan verbose_json.Respons
Teks hasil transkripsi.
verbose_json:
Selalu
transcribe.Bahasa yang terdeteksi.
Durasi audio dalam detik.
Segmen transkripsi dengan timestamp.
Timestamp tingkat kata (jika diminta).