Zum Hauptinhalt springen

Documentation Index

Fetch the complete documentation index at: https://docs.tokenlab.sh/llms.txt

Use this file to discover all available pages before exploring further.

Überblick

Die Video-Generierung ist asynchron. Nach dem Absenden einer Anfrage erhalten Sie eine task_id und eine poll_url. Anschließend pollen Sie den Task, bis das endgültige Ergebnis vorliegt.

Polling-Verhalten

Für das zuverlässigste Polling-Verhalten verwenden Sie genau die poll_url, die in der Create-Response zurückgegeben wird. Wenn eine Create-Response poll_url zurückgibt, verwenden Sie genau diese URL. Wenn sie auf /v1/tasks/{id} zeigt, behandeln Sie sie als kanonischen festen Status-Endpunkt.

Modell- und Medienverhalten

Die Audioausgabe ist modellabhängig. In TokenLab wird die Veo-3-Familie standardmäßig mit aktiviertem Audio behandelt, wenn output_audio weggelassen wird. Wenn ein Modell Audio-Steuerung unterstützt, schalten Sie sie explizit über output_audio. Das camelCase-Alias outputAudio wird aus Kompatibilitätsgründen ebenfalls akzeptiert. Für Produktionsintegrationen sollten Sie öffentlich erreichbare https-URLs für Bild-, Video- und Audioeingaben bevorzugen. Kompatible Modelle unterstützen weiterhin Inline-data:-URLs, aber große base64-Payloads erschweren Retry, Beobachtbarkeit und Debugging.

Request-Body

model
string
Standard:"sora-2"
Video-Modell-ID. Der API-Standardwert ist sora-2. Die aktuelle öffentliche Modellmatrix und unterstützte Fähigkeiten finden Sie im Leitfaden zur Video-Generierung.
prompt
string
erforderlich
Textbeschreibung des Videos. Für die meisten öffentlichen Videomodelle ist dieses Feld erforderlich.
operation
string
Auszuführende Video-Operation. Der öffentliche Vertrag unterstützt text-to-video, image-to-video, reference-to-video, start-end-to-video, video-to-video, video-extension, audio-to-video und motion-control. TokenLab kann die Operation aus den Eingaben ableiten, aber in Produktion wird eine explizite Angabe empfohlen.
image_url
string
Startbild-URL für Bild-zu-Video. Für die breiteste Kompatibilität sollte image_url bevorzugt werden.
image
string
Inline-Bild als data:-URL (zum Beispiel data:image/jpeg;base64,...). Wird von kompatiblen Modellen unterstützt, aber image_url ist in der Praxis robuster.
reference_images
array
Referenzbilder für Flows mit dedizierter Referenz-Konditionierung. Die zulässige Anzahl ist modellabhängig. Für seedance-2.0 und seedance-2.0-fast unterstützt TokenLab derzeit bis zu 9 Referenzbilder sowie zusätzlich bis zu 3 Referenzvideos und 3 Referenzaudios. Öffentliche https-URLs werden empfohlen; kompatible Modelle akzeptieren auch data:-URLs.
reference_image_type
string
Optionales Rollenfeld für Modelle, die zwischen asset und style unterscheiden.
kling_elements
array
Kling 3.0-Elementreferenzen. Nur für bildkonditionierte Anfragen mit kling-3.0-video unterstützt. Definieren Sie 1-3 Elemente; jedes Element enthält name, optional description und element_input_urls mit 2-4 Bild-URLs. Referenzieren Sie ein Element im prompt mit @name. Kombinieren Sie kling_elements nicht mit output_audio=true; lassen Sie output_audio weg oder setzen Sie es für Elementreferenzen auf false.
video_url
string
Öffentlich erreichbare Quellvideo-URL. Für die derzeit öffentlichen video-to-video-Flows und motion-control-Modelle erforderlich.
video_urls
array
Zusätzliche Referenzvideo-Eingaben für Modelle mit multimodaler Referenz-Konditionierung. Die zulässige Anzahl ist modellabhängig. Für seedance-2.0 und seedance-2.0-fast unterstützt TokenLab derzeit bis zu 3 Referenzvideos.
audio_url
string
Öffentlich erreichbare Audio-URL für audio-to-video-Modelle.
audio_urls
array
Zusätzliche Referenzaudio-Eingaben für Modelle mit multimodaler Referenz-Konditionierung. Die zulässige Anzahl ist modellabhängig. Für seedance-2.0 und seedance-2.0-fast unterstützt TokenLab derzeit bis zu 3 Referenzaudios.
task_id
string
Provider-seitige Task-ID für bestimmte Fortsetzungs-, Erweiterungs- oder Ableitungs-Flows.
extend_at
integer
Modellspezifischer Startoffset für bestimmte video-extension-Flows.
extend_times
string
Modellspezifischer Multiplikator oder Wiederholungszähler für bestimmte video-extension-Flows.
duration
integer
Dauer des generierten Ausgabevideos in Sekunden. Zulässige Werte sind modellabhängig. Dieses Feld steuert nur die Ausgabelänge und nicht die Länge der Referenzvideo-Eingaben.
aspect_ratio
string
Seitenverhältnis, zum Beispiel 16:9, 9:16 oder 1:1.
resolution
string
Ausgabeauflösung, zum Beispiel 720p, 1080p oder 4k. Die Unterstützung ist modellabhängig.
output_audio
boolean
Modellabhängiger Schalter für Audioausgabe. In TokenLab verwenden Anfragen der Veo 3-Familie standardmäßig true, wenn dieses Feld fehlt. kling-3.0-video akzeptiert diesen Selector für Anfragen ohne Elementreferenzen und mappt ihn auf die kompatible Upstream-Soundsteuerung; ausgelassene Kling-Anfragen sind standardmäßig stumm. Kombinieren Sie output_audio=true nicht mit kling_elements. Andere öffentliche Videomodelle folgen ihrem gesteuerten Standardverhalten. Der camelCase-Alias outputAudio wird aus Kompatibilitätsgründen akzeptiert.
fps
integer
Bildrate (1–120). Nur bei Modellen wirksam, die FPS öffentlich unterstützen.
negative_prompt
string
Inhalte, die in der Generierung vermieden werden sollen.
seed
integer
Zufalls-Seed für reproduzierbare Ergebnisse.
cfg_scale
number
Prompt-Treue (0–20), nur bei unterstützenden Modellen wirksam.
motion_strength
number
Bewegungsstärke (0–1), nur bei unterstützenden Modellen wirksam.
start_image
string
Startframe-Bild-URL oder kompatibler Bildeingang für start-end-to-video.
end_image
string
Endframe-Bild-URL oder kompatibler Bildeingang für start-end-to-video.
size
string
Größen-Tier für einige OpenAI-kompatible Videomodelle.
watermark
boolean
Wasserzeichen-Schalter für Modelle, die ihn öffentlich anbieten.
effect_type
string
Modellspezifischer Effekt-Selektor für bestimmte Editier- oder Effekt-Flows.
user
string
Eindeutige Kennung des Endnutzers.

Kompatibilitätshinweise

  • Die kanonischen öffentlichen Felder sind snake_case: reference_images, reference_image_type und output_audio.
  • Aus Kompatibilitätsgründen akzeptiert TokenLab auch die camelCase-Aliasse referenceImages, referenceImageType und outputAudio.
  • Wenn operation fehlt, leitet TokenLab sie aus den Eingaben ab. Für Produktion wird dennoch eine explizite Angabe empfohlen.

Best Practices für Eingaben

  • Für image_url, reference_images, video_url und audio_url sollten öffentlich erreichbare https-URLs bevorzugt werden.
  • Vermeiden Sie möglichst, base64 und Remote-URLs innerhalb derselben Anfrage zu mischen.
  • Wenn Sie signierte URLs verwenden, sollte die Gültigkeit den Retry-Zeitraum und die asynchrone Task-Erstellung abdecken.

Antwort

id
string
Kanonische asynchrone Aufgaben-ID. Wenn id und task_id beide vorhanden sind, behandeln Sie sie als dieselbe Aufgabe.
task_id
string
Eindeutige Task-ID für das Polling.
poll_url
string
Empfohlene Polling-URL für diesen Task. Verwenden Sie diesen Pfad unverändert.
billing_transaction_id
string
TokenLab-Abrechnungstransaktions-ID, wenn die Abrechnung bereits abgeschlossen ist. Dies ist die Kennung für Dashboard/Abgleich und getrennt von der asynchronen id / task_id.
status
string
Initialer Status: pending.
created
integer
Unix-Zeitstempel der Task-Erstellung.
model
string
Verwendetes Modell.
curl -X POST "https://api.tokenlab.sh/v1/videos/generations" \
  -H "Authorization: Bearer sk-your-api-key" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "sora-2",
    "prompt": "A cat walking through a garden, cinematic lighting",
    "operation": "text-to-video",
    "duration": 4,
    "aspect_ratio": "16:9"
  }'
{
  "id": "ldtask_aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa",
  "task_id": "ldtask_aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa",
  "poll_url": "/v1/tasks/ldtask_aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa",
  "status": "pending",
  "model": "sora-2",
  "created": 1706000000
}

Bild-zu-Video

response = requests.post(
    "https://api.tokenlab.sh/v1/videos/generations",
    headers={"Authorization": "Bearer sk-your-api-key"},
    json={
        "model": "hailuo-2.3-standard",
        "prompt": "The scene begins from the provided image and adds gentle natural motion.",
        "operation": "image-to-video",
        "image_url": "https://example.com/image.jpg",
        "duration": 6,
        "aspect_ratio": "16:9"
    }
)

Kling 3.0 Elements

Verwenden Sie kling_elements mit kling-3.0-video, wenn Sie Elementreferenzen benötigen. Senden Sie eine bildkonditionierte Anfrage (image_url, image_urls, start_image oder end_image) und referenzieren Sie jedes Element im Prompt mit @name. Kombinieren Sie kling_elements nicht mit output_audio=true; lassen Sie output_audio weg oder setzen Sie es für Elementreferenzen auf false.
response = requests.post("https://api.tokenlab.sh/v1/videos/generations",
    headers=headers,
    json={
        "model": "kling-3.0-video",
        "prompt": "Place @hero_bag on a studio turntable with soft product lighting.",
        "operation": "image-to-video",
        "image_url": "https://example.com/studio-start.png",
        "duration": 5,
        "resolution": "720p",
        "kling_elements": [
            {
                "name": "hero_bag",
                "description": "black leather handbag",
                "element_input_urls": [
                    "https://example.com/bag-front.png",
                    "https://example.com/bag-side.png"
                ]
            }
        ]
    }
)

Referenzbild-zu-Video

Verwenden Sie operation=reference-to-video, wenn das Modell eine dedizierte Referenz-Konditionierung unterstützt. Im öffentlichen Vertrag von TokenLab werden Bildreferenzen über reference_images übergeben, multimodale Referenzvideos und -audios über video_urls und audio_urls. Für seedance-2.0 und seedance-2.0-fast unterstützt TokenLab derzeit bis zu 9 Referenzbilder sowie zusätzlich bis zu 3 Referenzvideos und 3 Referenzaudios. duration steuert nur die Länge des generierten Outputs; es setzt kein separates Limit für die Dauer des Referenzvideo-Eingangs.
response = requests.post(
    "https://api.tokenlab.sh/v1/videos/generations",
    headers={"Authorization": "Bearer sk-your-api-key"},
    json={
        "model": "veo3.1",
        "prompt": "Keep the same subject identity and palette while adding subtle motion.",
        "operation": "reference-to-video",
        "reference_images": [
            "https://example.com/ref-a.jpg",
            "https://example.com/ref-b.jpg"
        ],
        "reference_image_type": "asset",
        "duration": 8,
        "resolution": "720p",
        "aspect_ratio": "9:16"
    }
)

Start- und Endframe-Steuerung

Verwenden Sie start_image und end_image, um ersten und letzten Frame zu kontrollieren.
response = requests.post(
    "https://api.tokenlab.sh/v1/videos/generations",
    headers={"Authorization": "Bearer sk-your-api-key"},
    json={
        "model": "viduq2-pro",
        "prompt": "Smooth transition from day to night",
        "operation": "start-end-to-video",
        "start_image": "https://example.com/day.jpg",
        "end_image": "https://example.com/night.jpg",
        "duration": 5,
        "resolution": "720p",
        "aspect_ratio": "16:9"
    }
)

Video-zu-Video

Wenn ein Modell ein bestehendes Video als Haupteingabe akzeptiert, verwenden Sie operation=video-to-video.
response = requests.post(
    "https://api.tokenlab.sh/v1/videos/generations",
    headers={"Authorization": "Bearer sk-your-api-key"},
    json={
        "model": "topaz-video-upscale",
        "operation": "video-to-video",
        "video_url": "https://example.com/source.mp4",
        "prompt": "Upscale the clip while preserving the original motion.",
        "resolution": "1080p"
    }
)

Bewegungssteuerung

Wenn ein Modell sowohl ein Motivbild als auch ein Bewegungsreferenzvideo benötigt, verwenden Sie operation=motion-control. TokenLab normalisiert die öffentliche Form image_url + video_url in den Upstream-Vertrag.
response = requests.post(
    "https://api.tokenlab.sh/v1/videos/generations",
    headers={"Authorization": "Bearer sk-your-api-key"},
    json={
        "model": "kling-3.0-motion-control",
        "operation": "motion-control",
        "prompt": "Keep the subject stable while following the motion reference.",
        "image_url": "https://example.com/subject.png",
        "video_url": "https://example.com/motion.mp4",
        "resolution": "720p"
    }
)

Aktuelle Verfügbarkeit von Audio-to-Video und Video-Extension

Der öffentliche Vertrag von TokenLab akzeptiert audio-to-video und video-extension für modellspezifische Flows. In der aktuell allgemein aktivierten öffentlichen Modellliste dieses Docs-Builds gibt es jedoch kein breit aktiviertes Modell, das diese Fähigkeiten öffentlich anbietet. Prüfen Sie die aktuelle Verfügbarkeit vor der Integration über die Models API oder die Modellseite.

Aktueller öffentlicher Modellbestand

Diese Liste ist mit dem aktuell aktivierten öffentlichen Videomodellbestand in diesem Dokumentations-Build abgestimmt. Für den neuesten Stand verwenden Sie die Models API.

OpenAI

ModellÖffentliche Operationen
sora-2Text-zu-Video, Bild-zu-Video
sora-2-proText-zu-Video, Bild-zu-Video
sora-2-pro-storyboardBild-zu-Video

Kuaishou

ModellÖffentliche Operationen
kling-3.0-motion-controlBewegungssteuerung
kling-3.0-videoText-zu-Video, Bild-zu-Video, Start-Endbild-zu-Video, Elementreferenzen
kling-v2.5-turbo-proText-zu-Video, Bild-zu-Video, Start-Endbild-zu-Video
kling-v2.5-turbo-stdText-zu-Video, Bild-zu-Video
kling-v2.6-proText-zu-Video, Bild-zu-Video, Start-Endbild-zu-Video
kling-v2.6-stdText-zu-Video, Bild-zu-Video
kling-v3.0-proText-zu-Video, Bild-zu-Video, Start-Endbild-zu-Video
kling-v3.0-stdText-zu-Video, Bild-zu-Video, Start-Endbild-zu-Video
kling-video-o1-proText-zu-Video, Bild-zu-Video, Referenzbild-zu-Video, Start-Endbild-zu-Video, Video-zu-Video
kling-video-o1-stdText-zu-Video, Bild-zu-Video, Referenzbild-zu-Video, Start-Endbild-zu-Video, Video-zu-Video

Google

ModellÖffentliche Operationen
veo3Text-zu-Video, Bild-zu-Video
veo3-fastText-zu-Video, Bild-zu-Video
veo3-proText-zu-Video, Bild-zu-Video
veo3.1Text-zu-Video, Bild-zu-Video, Referenzbild-zu-Video, Start-Endbild-zu-Video
veo3.1-fastText-zu-Video, Bild-zu-Video, Referenzbild-zu-Video, Start-Endbild-zu-Video
veo3.1-proText-zu-Video, Bild-zu-Video, Start-Endbild-zu-Video

ByteDance

ModellÖffentliche Operationen
seedance-1.5-proText-zu-Video, Bild-zu-Video

MiniMax

ModellÖffentliche Operationen
hailuo-2.3-fastBild-zu-Video
hailuo-2.3-proText-zu-Video, Bild-zu-Video
hailuo-2.3-standardText-zu-Video, Bild-zu-Video

Alibaba

ModellÖffentliche Operationen
wan-2.2-plusText-zu-Video, Bild-zu-Video
wan-2.5Text-zu-Video, Bild-zu-Video
wan-2.6Text-zu-Video, Bild-zu-Video, Referenzbild-zu-Video

Shengshu

ModellÖffentliche Operationen
viduq2Text-zu-Video, Referenzbild-zu-Video
viduq2-proBild-zu-Video, Referenzbild-zu-Video, Start-Endbild-zu-Video
viduq2-pro-fastBild-zu-Video, Start-Endbild-zu-Video
viduq2-turboBild-zu-Video, Start-Endbild-zu-Video
viduq3-proText-zu-Video, Bild-zu-Video, Start-Endbild-zu-Video
viduq3-turboText-zu-Video, Bild-zu-Video, Start-Endbild-zu-Video

xAI

ModellÖffentliche Operationen
grok-imagine-image-to-videoBild-zu-Video
grok-imagine-text-to-videoText-zu-Video
grok-imagine-upscaleVideo-zu-Video

Sonstiges

ModellÖffentliche Operationen
topaz-video-upscaleVideo-zu-Video