Accédez via un contrat public unifié aux flux texte-vers-vidéo, image-vers-vidéo, référence-vers-vidéo, contrôle début/fin, motion-control et vidéo-vers-vidéo.
TokenLab propose la génération vidéo via une API unifiée. La génération est asynchrone : vous envoyez une requête, recevez task_id et poll_url, puis interrogez le task jusqu’au résultat final.
Pour connaître l’inventaire public le plus récent des modèles vidéo, utilisez la Models API ou la page des modèles.Si une réponse de création renvoie poll_url, appelez exactement cette URL. Lorsqu’elle pointe vers /v1/tasks/{id}, traitez-la comme l’endpoint fixe canonique de statut.
Le comportement audio dépend du modèle. Dans TokenLab, la famille Veo 3 est traitée par défaut comme audio-on lorsque output_audio est omis. D’autres modèles publics sont silencieux par défaut ou n’exposent pas de commutateur audio stable.En production, privilégiez des URLs https publiques pour les images, vidéos et fichiers audio. Les modèles compatibles acceptent toujours les data: URLs, mais les URLs sont généralement plus robustes pour les retries, l’observabilité et le débogage.
Le contrat vidéo public de TokenLab se concentre actuellement sur les opérations suivantes :
text-to-video
image-to-video
reference-to-video
start-end-to-video
video-to-video
motion-control
Le contrat accepte aussi audio-to-video et video-extension pour des flux spécifiques, mais aucun modèle public largement activé ne publie actuellement ces capacités dans cette build de documentation.
Légende : ✅ Au moins un modèle public actuellement actif dans cette famille expose la capacité | ❌ La capacité n’est pas publiquement exposée par les modèles actuellement actifs
Utilisez kling_elements avec kling-3.0-video lorsque vous avez besoin de références d’éléments. Fournissez une requête conditionnée par image (image_url, image_urls, start_image ou end_image) et référencez chaque élément dans le prompt avec @name. Ne combinez pas kling_elements avec output_audio=true ; omettez output_audio ou définissez-le sur false pour les requêtes avec références d’éléments.
Pour seedance-2.0 et seedance-2.0-fast, TokenLab prend actuellement en charge jusqu’à 9 images de référence, ainsi que jusqu’à 3 vidéos de référence et 3 audios de référence. duration contrôle uniquement la durée de sortie générée ; il ne définit pas de limite distincte pour la durée de la vidéo de référence en entrée.
response = requests.post(f"{BASE}/videos/generations", headers=headers, json={ "model": "veo3.1", "prompt": "Keep the same subject identity and palette while adding subtle motion.", "operation": "reference-to-video", "reference_images": [ "https://example.com/ref-a.jpg", "https://example.com/ref-b.jpg" ], "duration": 8, "resolution": "720p", "aspect_ratio": "9:16" })
Mieux vaut le renseigner explicitement en production
image_url
string
Forme d’entrée image la plus robuste
image
string
data: URL pour tests locaux et petites intégrations
reference_images
string[]
Champ public canonique pour le conditionnement par images de référence
reference_image_type
string
Sélecteur optionnel asset / style
video_url
string
Requis pour les modèles publics video-to-video et motion-control actuels
audio_url
string
Pour les flux audio-vers-vidéo spécifiques à certains modèles
output_audio
boolean
La famille Veo 3 traite l’omission comme true. kling-3.0-video accepte ce sélecteur pour le contrôle upstream sound et reste silencieux par défaut si le champ est omis.
La facturation dépend du modèle. Certains modèles publics se comportent plutôt comme des modèles facturés à la requête, d’autres plutôt à la seconde. Pour le prix public le plus récent, référez-vous à la page des modèles ou à la Pricing API.