Zum Hauptinhalt springen

Documentation Index

Fetch the complete documentation index at: https://docs.tokenlab.sh/llms.txt

Use this file to discover all available pages before exploring further.

Überblick

Übersetzt Audio in jeder unterstützten Sprache in englischen Text. Im Gegensatz zur Transkription gibt dieser Endpoint unabhängig von der Eingabesprache immer englischen Text aus.

Anfragekörper

Timeout für synchrone Anfragen: Dieser Nicht-Chat-Endpunkt wartet, bis das geroutete Modell fertig ist. Große Eingaben, lange Audiodateien oder große Batches können übliche 30s-Client-Defaults überschreiten; setzen Sie das Timeout Ihres HTTP-Clients daher auf mindestens 120s.
file
file
erforderlich
Die Audio-Datei, die übersetzt werden soll. Unterstützte Formate: flac, mp3, mp4, mpeg, mpga, m4a, ogg, wav, webm. Die maximale Dateigröße beträgt 25 MB.
model
string
Standard:"whisper-1"
Das zu verwendende Modell. Derzeit wird nur whisper-1 unterstützt.
prompt
string
Ein optionaler Text, um den Stil des Modells zu steuern oder ein vorheriges Segment fortzusetzen. Sollte auf Englisch sein.
response_format
string
Standard:"json"
Das Format der Ausgabe. Optionen: json, text, srt, verbose_json, vtt.
temperature
number
Die Sampling-Temperatur zwischen 0 und 1. Höhere Werte wie 0.8 erzeugen zufälligere Ausgaben, während niedrigere Werte wie 0.2 die Ausgabe fokussierter und deterministischer machen.

Antwort

text
string
Der übersetzte Text auf Englisch.
Für das Format verbose_json enthält die Antwort außerdem:
language
string
Die erkannte Sprache des Eingabe-Audios.
duration
number
Die Dauer des Eingabe-Audios in Sekunden.
segments
array
Segmente des übersetzten Textes mit Zeitstempeln.
curl -X POST "https://api.tokenlab.sh/v1/audio/translations" \
  -H "Authorization: Bearer sk-your-api-key" \
  -F "file=@german_audio.mp3" \
  -F "model=whisper-1"
{
  "text": "Hello, my name is Wolfgang and I come from Germany. Where are you from?"
}

Übersetzung vs. Transkription

FunktionÜbersetzungTranskription
AusgabespracheImmer EnglischGleich wie die Eingabe
AnwendungsfallFremdsprachiges Audio in Englisch umwandelnOriginalsprache beibehalten
SprachparameterNicht anwendbarOptionaler Hinweis
Der Übersetzungs-Endpoint erkennt die Ausgangssprache automatisch und übersetzt ins Englische. Der language-Parameter aus der Transkription wird ignoriert.