Documentation Index
Fetch the complete documentation index at: https://docs.tokenlab.sh/llms.txt
Use this file to discover all available pages before exploring further.
Vue d’ensemble
La génération vidéo est asynchrone. Une fois la requête envoyée, vous recevez untask_id et un poll_url, puis vous interrogez ce task jusqu’au résultat final.
Comportement de polling
Pour un polling fiable, utilisez exactement lepoll_url renvoyé par la requête de création.
Si une réponse de création renvoie poll_url, appelez exactement cette URL. Lorsqu’elle pointe vers /v1/tasks/{id}, traitez-la comme l’endpoint fixe canonique de statut.
Comportement des modèles et des médias
La sortie audio dépend du modèle. Dans TokenLab, la famille Veo 3 active l’audio par défaut lorsqueoutput_audio est omis. Si un modèle prend en charge ce contrôle, utilisez output_audio pour le piloter explicitement. L’alias camelCase outputAudio est également accepté pour compatibilité.
En production, privilégiez des URLs https publiques pour les images, vidéos et fichiers audio. Les modèles compatibles acceptent toujours les data: URLs, mais les gros payloads base64 compliquent les retries, l’observabilité et le débogage.
Corps de la requête
ID du modèle vidéo. La valeur par défaut de l’API est
sora-2. Pour voir la matrice actuelle des modèles publics et leurs capacités, consultez le guide de génération vidéo.Description textuelle de la vidéo à générer. Ce champ est requis pour la plupart des modèles publics.
Opération vidéo à exécuter. Le contrat public accepte
text-to-video, image-to-video, reference-to-video, start-end-to-video, video-to-video, video-extension, audio-to-video et motion-control. TokenLab peut déduire l’opération à partir des entrées, mais une valeur explicite est recommandée en production.URL de l’image de départ pour les flux image-vers-vidéo. Pour la compatibilité la plus large, privilégiez
image_url.Image inline au format
data: (par exemple data:image/jpeg;base64,...). Les modèles compatibles la prennent en charge, mais image_url reste l’option la plus robuste.Images de référence pour les flux avec conditionnement dédié. Le nombre autorisé dépend du modèle. Pour
seedance-2.0 et seedance-2.0-fast, TokenLab prend actuellement en charge jusqu’à 9 images de référence, ainsi que jusqu’à 3 vidéos de référence et 3 audios de référence. Les URL publiques https sont recommandées ; les modèles compatibles acceptent aussi les URL data:.Champ facultatif pour les modèles qui distinguent les références
asset et style.Définitions de références d’éléments Kling 3.0. Pris en charge uniquement avec
kling-3.0-video pour les requêtes conditionnées par image. Définissez 1 à 3 éléments ; chaque élément contient name, un description optionnel et element_input_urls avec 2 à 4 URL d’images. Référencez un élément dans prompt avec @name. Ne combinez pas kling_elements avec output_audio=true ; omettez output_audio ou définissez-le sur false pour les requêtes avec références d’éléments.URL publique de la vidéo source. Requise pour les flux publics
video-to-video et pour les modèles motion-control.Entrées vidéo de référence supplémentaires pour les modèles qui prennent en charge un conditionnement multimodal. Le nombre autorisé dépend du modèle. Pour
seedance-2.0 et seedance-2.0-fast, TokenLab prend actuellement en charge jusqu’à 3 vidéos de référence.URL publique du fichier audio pour les modèles
audio-to-video.Entrées audio de référence supplémentaires pour les modèles qui prennent en charge un conditionnement multimodal. Le nombre autorisé dépend du modèle. Pour
seedance-2.0 et seedance-2.0-fast, TokenLab prend actuellement en charge jusqu’à 3 audios de référence.ID de tâche côté provider utilisé dans certains flux de continuation, d’extension ou de dérivation.
Offset de départ spécifique au modèle pour certains flux
video-extension.Multiplicateur ou nombre de répétitions spécifique au modèle pour certains flux
video-extension.Durée de la vidéo de sortie générée en secondes. Les valeurs disponibles dépendent du modèle. Ce champ contrôle uniquement la durée de sortie et ne correspond pas à une limite de durée pour la vidéo de référence en entrée.
Ratio d’image, par exemple
16:9, 9:16 ou 1:1.Résolution de sortie, par exemple
720p, 1080p ou 4k. La prise en charge dépend du modèle.Bascule de sortie audio dépendante du modèle. Dans TokenLab, les requêtes de la famille Veo 3 utilisent
true par défaut lorsque ce champ est omis. kling-3.0-video accepte ce sélecteur pour les requêtes sans références d’éléments et le mappe vers le contrôle sonore upstream compatible ; les requêtes Kling omises sont silencieuses par défaut. Ne combinez pas output_audio=true avec kling_elements. Les autres modèles vidéo publics suivent leur comportement par défaut gouverné. L’alias camelCase outputAudio est accepté pour compatibilité.Fréquence d’images (1–120). N’a d’effet que sur les modèles qui l’exposent publiquement.
Éléments à éviter dans la génération.
Seed aléatoire pour obtenir des résultats reproductibles.
Intensité de suivi du prompt (0–20), effective uniquement sur les modèles qui la prennent en charge.
Intensité du mouvement (0–1), effective uniquement sur les modèles compatibles.
URL de l’image de premier frame, ou entrée image compatible, pour
start-end-to-video.URL de l’image de dernier frame, ou entrée image compatible, pour
start-end-to-video.Tier de taille utilisé par certains modèles vidéo compatibles OpenAI.
Bascule de watermark exposée par certains modèles.
Sélecteur d’effet spécifique au modèle pour certains flux d’édition ou d’effets.
Identifiant unique de l’utilisateur final.
Notes de compatibilité
- Les champs publics canoniques utilisent le snake_case :
reference_images,reference_image_typeetoutput_audio. - Pour compatibilité, TokenLab accepte aussi les alias camelCase
referenceImages,referenceImageTypeetoutputAudio. - Si
operationest omis, TokenLab la déduit à partir des entrées, mais une valeur explicite reste préférable en production.
Bonnes pratiques d’entrée
- Pour
image_url,reference_images,video_urletaudio_url, privilégiez des URLshttpspubliques. - Évitez, si possible, de mélanger base64 inline et URLs distantes dans une même requête.
- Si vous utilisez des URLs signées, assurez-vous qu’elles restent valides pendant la fenêtre de retry et de création asynchrone.
Réponse
Identifiant canonique de tâche asynchrone. Lorsque
id et task_id sont tous les deux présents, considérez-les comme la même tâche.Identifiant unique du task pour le polling.
URL de polling recommandée pour ce task. Utilisez ce chemin tel quel lors des vérifications d’état.
ID de transaction de facturation TokenLab lorsque le règlement est déjà terminé. Il s’agit de l’identifiant utilisé pour le dashboard / le rapprochement, distinct de l’
id / task_id asynchrone.Statut initial :
pending.Timestamp Unix de création de la tâche.
Modèle utilisé.
Image vers vidéo
Kling 3.0 Elements
Utilisezkling_elements avec kling-3.0-video lorsque vous avez besoin de références d’éléments. Fournissez une requête conditionnée par image (image_url, image_urls, start_image ou end_image) et référencez chaque élément dans le prompt avec @name. Ne combinez pas kling_elements avec output_audio=true ; omettez output_audio ou définissez-le sur false pour les requêtes avec références d’éléments.
Référence vers vidéo
Utilisezoperation=reference-to-video lorsque le modèle prend en charge un conditionnement de référence dédié. Dans le contrat public de TokenLab, les références d’image utilisent reference_images, tandis que les vidéos et audios de référence multimodaux utilisent video_urls et audio_urls. Pour seedance-2.0 et seedance-2.0-fast, TokenLab prend actuellement en charge jusqu’à 9 images de référence, ainsi que jusqu’à 3 vidéos de référence et 3 audios de référence. duration contrôle uniquement la durée de sortie générée ; il ne fixe pas de limite distincte pour la durée de la vidéo de référence en entrée.
Contrôle début / fin
Utilisezstart_image et end_image pour contrôler la première et la dernière image.
Vidéo vers vidéo
Si un modèle accepte une vidéo existante comme entrée principale, utilisezoperation=video-to-video.
Contrôle de mouvement
Quand un modèle exige à la fois une image de sujet et une vidéo de mouvement de référence, utilisezoperation=motion-control. TokenLab normalise la forme publique image_url + video_url vers le contrat amont.
Disponibilité actuelle de Audio-to-Video et Video Extension
Le contrat public TokenLab accepteaudio-to-video et video-extension pour des flux spécifiques à certains modèles. Cependant, dans la liste actuelle des modèles publics généralement activés pour cette documentation, aucun modèle public largement activé n’expose clairement ces capacités. Vérifiez donc l’état réel via la Models API ou la page des modèles.
Inventaire public actuel des modèles
Cette liste est alignée sur l’inventaire actuel des modèles vidéo publics activés dans cette build de documentation. Pour l’état le plus récent, interrogez la Models API.OpenAI
| Modèle | Opérations publiques |
|---|---|
sora-2 | Texte vers vidéo, Image vers vidéo |
sora-2-pro | Texte vers vidéo, Image vers vidéo |
sora-2-pro-storyboard | Image vers vidéo |
Kuaishou
| Modèle | Opérations publiques |
|---|---|
kling-3.0-motion-control | Contrôle du mouvement |
kling-3.0-video | Texte vers vidéo, Image vers vidéo, Début-fin vers vidéo, références d’éléments |
kling-v2.5-turbo-pro | Texte vers vidéo, Image vers vidéo, Début-fin vers vidéo |
kling-v2.5-turbo-std | Texte vers vidéo, Image vers vidéo |
kling-v2.6-pro | Texte vers vidéo, Image vers vidéo, Début-fin vers vidéo |
kling-v2.6-std | Texte vers vidéo, Image vers vidéo |
kling-v3.0-pro | Texte vers vidéo, Image vers vidéo, Début-fin vers vidéo |
kling-v3.0-std | Texte vers vidéo, Image vers vidéo, Début-fin vers vidéo |
kling-video-o1-pro | Texte vers vidéo, Image vers vidéo, Référence vers vidéo, Début-fin vers vidéo, Vidéo vers vidéo |
kling-video-o1-std | Texte vers vidéo, Image vers vidéo, Référence vers vidéo, Début-fin vers vidéo, Vidéo vers vidéo |
| Modèle | Opérations publiques |
|---|---|
veo3 | Texte vers vidéo, Image vers vidéo |
veo3-fast | Texte vers vidéo, Image vers vidéo |
veo3-pro | Texte vers vidéo, Image vers vidéo |
veo3.1 | Texte vers vidéo, Image vers vidéo, Référence vers vidéo, Début-fin vers vidéo |
veo3.1-fast | Texte vers vidéo, Image vers vidéo, Référence vers vidéo, Début-fin vers vidéo |
veo3.1-pro | Texte vers vidéo, Image vers vidéo, Début-fin vers vidéo |
ByteDance
| Modèle | Opérations publiques |
|---|---|
seedance-1.5-pro | Texte vers vidéo, Image vers vidéo |
MiniMax
| Modèle | Opérations publiques |
|---|---|
hailuo-2.3-fast | Image vers vidéo |
hailuo-2.3-pro | Texte vers vidéo, Image vers vidéo |
hailuo-2.3-standard | Texte vers vidéo, Image vers vidéo |
Alibaba
| Modèle | Opérations publiques |
|---|---|
wan-2.2-plus | Texte vers vidéo, Image vers vidéo |
wan-2.5 | Texte vers vidéo, Image vers vidéo |
wan-2.6 | Texte vers vidéo, Image vers vidéo, Référence vers vidéo |
Shengshu
| Modèle | Opérations publiques |
|---|---|
viduq2 | Texte vers vidéo, Référence vers vidéo |
viduq2-pro | Image vers vidéo, Référence vers vidéo, Début-fin vers vidéo |
viduq2-pro-fast | Image vers vidéo, Début-fin vers vidéo |
viduq2-turbo | Image vers vidéo, Début-fin vers vidéo |
viduq3-pro | Texte vers vidéo, Image vers vidéo, Début-fin vers vidéo |
viduq3-turbo | Texte vers vidéo, Image vers vidéo, Début-fin vers vidéo |
xAI
| Modèle | Opérations publiques |
|---|---|
grok-imagine-image-to-video | Image vers vidéo |
grok-imagine-text-to-video | Texte vers vidéo |
grok-imagine-upscale | Vidéo vers vidéo |
Autres
| Modèle | Opérations publiques |
|---|---|
topaz-video-upscale | Vidéo vers vidéo |