Langsung ke konten utama

Documentation Index

Fetch the complete documentation index at: https://docs.tokenlab.sh/llms.txt

Use this file to discover all available pages before exploring further.

Body Permintaan

Timeout permintaan sinkron: endpoint non-chat ini menunggu model yang dirutekan selesai. Input besar, audio panjang, atau batch besar dapat melebihi default client umum 30s, jadi atur timeout HTTP client Anda minimal 120s.
file
file
wajib
File audio untuk ditranskripsikan. Format yang didukung: flac, mp3, mp4, mpeg, mpga, m4a, ogg, wav, webm.
model
string
default:"whisper-1"
Model yang digunakan. Saat ini hanya whisper-1 yang didukung.
language
string
Bahasa audio dalam format ISO-639-1 (misalnya, en, zh, ja).
prompt
string
Teks opsional untuk memandu gaya model atau melanjutkan segmen sebelumnya.
response_format
string
default:"json"
Format output: json, text, srt, verbose_json, vtt.
temperature
number
default:"0"
Temperatur sampling (0 hingga 1).
timestamp_granularities
array
Granularitas timestamp: word dan/atau segment. Memerlukan verbose_json.

Respons

text
string
Teks hasil transkripsi.
Untuk verbose_json:
task
string
Selalu transcribe.
language
string
Bahasa yang terdeteksi.
duration
number
Durasi audio dalam detik.
segments
array
Segmen transkripsi dengan timestamp.
words
array
Timestamp tingkat kata (jika diminta).
curl -X POST "https://api.tokenlab.sh/v1/audio/transcriptions" \
  -H "Authorization: Bearer sk-your-api-key" \
  -F file="@audio.mp3" \
  -F model="whisper-1" \
  -F language="en"
{
  "text": "Hello, this is a test of the transcription API."
}

Terjemahan

Untuk menerjemahkan audio ke bahasa Inggris, gunakan endpoint translations:
response = client.audio.translations.create(
    model="whisper-1",
    file=audio_file
)