Documentation Index
Fetch the complete documentation index at: https://docs.tokenlab.sh/llms.txt
Use this file to discover all available pages before exploring further.
Überblick
Die Video-Generierung ist asynchron. Nach dem Absenden einer Anfrage erhalten Sie einetask_id und eine poll_url. Anschließend pollen Sie den Task, bis das endgültige Ergebnis vorliegt.
Polling-Verhalten
Für das zuverlässigste Polling-Verhalten verwenden Sie genau diepoll_url, die in der Create-Response zurückgegeben wird.
Wenn eine Create-Response poll_url zurückgibt, verwenden Sie genau diese URL. Wenn sie auf /v1/tasks/{id} zeigt, behandeln Sie sie als kanonischen festen Status-Endpunkt.
Modell- und Medienverhalten
Die Audioausgabe ist modellabhängig. In TokenLab wird die Veo-3-Familie standardmäßig mit aktiviertem Audio behandelt, wennoutput_audio weggelassen wird. Wenn ein Modell Audio-Steuerung unterstützt, schalten Sie sie explizit über output_audio. Das camelCase-Alias outputAudio wird aus Kompatibilitätsgründen ebenfalls akzeptiert.
Für Produktionsintegrationen sollten Sie öffentlich erreichbare https-URLs für Bild-, Video- und Audioeingaben bevorzugen. Kompatible Modelle unterstützen weiterhin Inline-data:-URLs, aber große base64-Payloads erschweren Retry, Beobachtbarkeit und Debugging.
Request-Body
Video-Modell-ID. Der API-Standardwert ist
sora-2. Die aktuelle öffentliche Modellmatrix und unterstützte Fähigkeiten finden Sie im Leitfaden zur Video-Generierung.Textbeschreibung des Videos. Für die meisten öffentlichen Videomodelle ist dieses Feld erforderlich.
Auszuführende Video-Operation. Der öffentliche Vertrag unterstützt
text-to-video, image-to-video, reference-to-video, start-end-to-video, video-to-video, video-extension, audio-to-video und motion-control. TokenLab kann die Operation aus den Eingaben ableiten, aber in Produktion wird eine explizite Angabe empfohlen.Startbild-URL für Bild-zu-Video. Für die breiteste Kompatibilität sollte
image_url bevorzugt werden.Inline-Bild als
data:-URL (zum Beispiel data:image/jpeg;base64,...). Wird von kompatiblen Modellen unterstützt, aber image_url ist in der Praxis robuster.Referenzbilder für Flows mit dedizierter Referenz-Konditionierung. Die zulässige Anzahl ist modellabhängig. Für
seedance-2.0 und seedance-2.0-fast unterstützt TokenLab derzeit bis zu 9 Referenzbilder sowie zusätzlich bis zu 3 Referenzvideos und 3 Referenzaudios. Öffentliche https-URLs werden empfohlen; kompatible Modelle akzeptieren auch data:-URLs.Optionales Rollenfeld für Modelle, die zwischen
asset und style unterscheiden.Kling 3.0-Elementreferenzen. Nur für bildkonditionierte Anfragen mit
kling-3.0-video unterstützt. Definieren Sie 1-3 Elemente; jedes Element enthält name, optional description und element_input_urls mit 2-4 Bild-URLs. Referenzieren Sie ein Element im prompt mit @name. Kombinieren Sie kling_elements nicht mit output_audio=true; lassen Sie output_audio weg oder setzen Sie es für Elementreferenzen auf false.Öffentlich erreichbare Quellvideo-URL. Für die derzeit öffentlichen
video-to-video-Flows und motion-control-Modelle erforderlich.Zusätzliche Referenzvideo-Eingaben für Modelle mit multimodaler Referenz-Konditionierung. Die zulässige Anzahl ist modellabhängig. Für
seedance-2.0 und seedance-2.0-fast unterstützt TokenLab derzeit bis zu 3 Referenzvideos.Öffentlich erreichbare Audio-URL für
audio-to-video-Modelle.Zusätzliche Referenzaudio-Eingaben für Modelle mit multimodaler Referenz-Konditionierung. Die zulässige Anzahl ist modellabhängig. Für
seedance-2.0 und seedance-2.0-fast unterstützt TokenLab derzeit bis zu 3 Referenzaudios.Provider-seitige Task-ID für bestimmte Fortsetzungs-, Erweiterungs- oder Ableitungs-Flows.
Modellspezifischer Startoffset für bestimmte
video-extension-Flows.Modellspezifischer Multiplikator oder Wiederholungszähler für bestimmte
video-extension-Flows.Dauer des generierten Ausgabevideos in Sekunden. Zulässige Werte sind modellabhängig. Dieses Feld steuert nur die Ausgabelänge und nicht die Länge der Referenzvideo-Eingaben.
Seitenverhältnis, zum Beispiel
16:9, 9:16 oder 1:1.Ausgabeauflösung, zum Beispiel
720p, 1080p oder 4k. Die Unterstützung ist modellabhängig.Modellabhängiger Schalter für Audioausgabe. In TokenLab verwenden Anfragen der Veo 3-Familie standardmäßig
true, wenn dieses Feld fehlt. kling-3.0-video akzeptiert diesen Selector für Anfragen ohne Elementreferenzen und mappt ihn auf die kompatible Upstream-Soundsteuerung; ausgelassene Kling-Anfragen sind standardmäßig stumm. Kombinieren Sie output_audio=true nicht mit kling_elements. Andere öffentliche Videomodelle folgen ihrem gesteuerten Standardverhalten. Der camelCase-Alias outputAudio wird aus Kompatibilitätsgründen akzeptiert.Bildrate (1–120). Nur bei Modellen wirksam, die FPS öffentlich unterstützen.
Inhalte, die in der Generierung vermieden werden sollen.
Zufalls-Seed für reproduzierbare Ergebnisse.
Prompt-Treue (0–20), nur bei unterstützenden Modellen wirksam.
Bewegungsstärke (0–1), nur bei unterstützenden Modellen wirksam.
Startframe-Bild-URL oder kompatibler Bildeingang für
start-end-to-video.Endframe-Bild-URL oder kompatibler Bildeingang für
start-end-to-video.Größen-Tier für einige OpenAI-kompatible Videomodelle.
Wasserzeichen-Schalter für Modelle, die ihn öffentlich anbieten.
Modellspezifischer Effekt-Selektor für bestimmte Editier- oder Effekt-Flows.
Eindeutige Kennung des Endnutzers.
Kompatibilitätshinweise
- Die kanonischen öffentlichen Felder sind snake_case:
reference_images,reference_image_typeundoutput_audio. - Aus Kompatibilitätsgründen akzeptiert TokenLab auch die camelCase-Aliasse
referenceImages,referenceImageTypeundoutputAudio. - Wenn
operationfehlt, leitet TokenLab sie aus den Eingaben ab. Für Produktion wird dennoch eine explizite Angabe empfohlen.
Best Practices für Eingaben
- Für
image_url,reference_images,video_urlundaudio_urlsollten öffentlich erreichbarehttps-URLs bevorzugt werden. - Vermeiden Sie möglichst, base64 und Remote-URLs innerhalb derselben Anfrage zu mischen.
- Wenn Sie signierte URLs verwenden, sollte die Gültigkeit den Retry-Zeitraum und die asynchrone Task-Erstellung abdecken.
Antwort
Kanonische asynchrone Aufgaben-ID. Wenn
id und task_id beide vorhanden sind, behandeln Sie sie als dieselbe Aufgabe.Eindeutige Task-ID für das Polling.
Empfohlene Polling-URL für diesen Task. Verwenden Sie diesen Pfad unverändert.
TokenLab-Abrechnungstransaktions-ID, wenn die Abrechnung bereits abgeschlossen ist. Dies ist die Kennung für Dashboard/Abgleich und getrennt von der asynchronen
id / task_id.Initialer Status:
pending.Unix-Zeitstempel der Task-Erstellung.
Verwendetes Modell.
Bild-zu-Video
Kling 3.0 Elements
Verwenden Siekling_elements mit kling-3.0-video, wenn Sie Elementreferenzen benötigen. Senden Sie eine bildkonditionierte Anfrage (image_url, image_urls, start_image oder end_image) und referenzieren Sie jedes Element im Prompt mit @name. Kombinieren Sie kling_elements nicht mit output_audio=true; lassen Sie output_audio weg oder setzen Sie es für Elementreferenzen auf false.
Referenzbild-zu-Video
Verwenden Sieoperation=reference-to-video, wenn das Modell eine dedizierte Referenz-Konditionierung unterstützt. Im öffentlichen Vertrag von TokenLab werden Bildreferenzen über reference_images übergeben, multimodale Referenzvideos und -audios über video_urls und audio_urls. Für seedance-2.0 und seedance-2.0-fast unterstützt TokenLab derzeit bis zu 9 Referenzbilder sowie zusätzlich bis zu 3 Referenzvideos und 3 Referenzaudios. duration steuert nur die Länge des generierten Outputs; es setzt kein separates Limit für die Dauer des Referenzvideo-Eingangs.
Start- und Endframe-Steuerung
Verwenden Siestart_image und end_image, um ersten und letzten Frame zu kontrollieren.
Video-zu-Video
Wenn ein Modell ein bestehendes Video als Haupteingabe akzeptiert, verwenden Sieoperation=video-to-video.
Bewegungssteuerung
Wenn ein Modell sowohl ein Motivbild als auch ein Bewegungsreferenzvideo benötigt, verwenden Sieoperation=motion-control. TokenLab normalisiert die öffentliche Form image_url + video_url in den Upstream-Vertrag.
Aktuelle Verfügbarkeit von Audio-to-Video und Video-Extension
Der öffentliche Vertrag von TokenLab akzeptiertaudio-to-video und video-extension für modellspezifische Flows. In der aktuell allgemein aktivierten öffentlichen Modellliste dieses Docs-Builds gibt es jedoch kein breit aktiviertes Modell, das diese Fähigkeiten öffentlich anbietet. Prüfen Sie die aktuelle Verfügbarkeit vor der Integration über die Models API oder die Modellseite.
Aktueller öffentlicher Modellbestand
Diese Liste ist mit dem aktuell aktivierten öffentlichen Videomodellbestand in diesem Dokumentations-Build abgestimmt. Für den neuesten Stand verwenden Sie die Models API.OpenAI
| Modell | Öffentliche Operationen |
|---|---|
sora-2 | Text-zu-Video, Bild-zu-Video |
sora-2-pro | Text-zu-Video, Bild-zu-Video |
sora-2-pro-storyboard | Bild-zu-Video |
Kuaishou
| Modell | Öffentliche Operationen |
|---|---|
kling-3.0-motion-control | Bewegungssteuerung |
kling-3.0-video | Text-zu-Video, Bild-zu-Video, Start-Endbild-zu-Video, Elementreferenzen |
kling-v2.5-turbo-pro | Text-zu-Video, Bild-zu-Video, Start-Endbild-zu-Video |
kling-v2.5-turbo-std | Text-zu-Video, Bild-zu-Video |
kling-v2.6-pro | Text-zu-Video, Bild-zu-Video, Start-Endbild-zu-Video |
kling-v2.6-std | Text-zu-Video, Bild-zu-Video |
kling-v3.0-pro | Text-zu-Video, Bild-zu-Video, Start-Endbild-zu-Video |
kling-v3.0-std | Text-zu-Video, Bild-zu-Video, Start-Endbild-zu-Video |
kling-video-o1-pro | Text-zu-Video, Bild-zu-Video, Referenzbild-zu-Video, Start-Endbild-zu-Video, Video-zu-Video |
kling-video-o1-std | Text-zu-Video, Bild-zu-Video, Referenzbild-zu-Video, Start-Endbild-zu-Video, Video-zu-Video |
| Modell | Öffentliche Operationen |
|---|---|
veo3 | Text-zu-Video, Bild-zu-Video |
veo3-fast | Text-zu-Video, Bild-zu-Video |
veo3-pro | Text-zu-Video, Bild-zu-Video |
veo3.1 | Text-zu-Video, Bild-zu-Video, Referenzbild-zu-Video, Start-Endbild-zu-Video |
veo3.1-fast | Text-zu-Video, Bild-zu-Video, Referenzbild-zu-Video, Start-Endbild-zu-Video |
veo3.1-pro | Text-zu-Video, Bild-zu-Video, Start-Endbild-zu-Video |
ByteDance
| Modell | Öffentliche Operationen |
|---|---|
seedance-1.5-pro | Text-zu-Video, Bild-zu-Video |
MiniMax
| Modell | Öffentliche Operationen |
|---|---|
hailuo-2.3-fast | Bild-zu-Video |
hailuo-2.3-pro | Text-zu-Video, Bild-zu-Video |
hailuo-2.3-standard | Text-zu-Video, Bild-zu-Video |
Alibaba
| Modell | Öffentliche Operationen |
|---|---|
wan-2.2-plus | Text-zu-Video, Bild-zu-Video |
wan-2.5 | Text-zu-Video, Bild-zu-Video |
wan-2.6 | Text-zu-Video, Bild-zu-Video, Referenzbild-zu-Video |
Shengshu
| Modell | Öffentliche Operationen |
|---|---|
viduq2 | Text-zu-Video, Referenzbild-zu-Video |
viduq2-pro | Bild-zu-Video, Referenzbild-zu-Video, Start-Endbild-zu-Video |
viduq2-pro-fast | Bild-zu-Video, Start-Endbild-zu-Video |
viduq2-turbo | Bild-zu-Video, Start-Endbild-zu-Video |
viduq3-pro | Text-zu-Video, Bild-zu-Video, Start-Endbild-zu-Video |
viduq3-turbo | Text-zu-Video, Bild-zu-Video, Start-Endbild-zu-Video |
xAI
| Modell | Öffentliche Operationen |
|---|---|
grok-imagine-image-to-video | Bild-zu-Video |
grok-imagine-text-to-video | Text-zu-Video |
grok-imagine-upscale | Video-zu-Video |
Sonstiges
| Modell | Öffentliche Operationen |
|---|---|
topaz-video-upscale | Video-zu-Video |