Documentation Index
Fetch the complete documentation index at: https://docs.tokenlab.sh/llms.txt
Use this file to discover all available pages before exploring further.
Visão geral
A geração de vídeo é assíncrona. Você envia uma solicitação, recebe umatask_id e um poll_url, e então faz polling até obter o resultado final.
Comportamento de polling
Para o comportamento de polling mais confiável, use exatamente opoll_url retornado pela resposta de criação.
Se uma resposta de criação retornar poll_url, chame exatamente essa URL. Quando ela apontar para /v1/tasks/{id}, trate-a como o endpoint fixo canônico de status.
Comportamento de modelos e mídia
A saída de áudio depende do modelo. Na TokenLab, a família Veo 3 ativa áudio por padrão quandooutput_audio é omitido. Se um modelo oferecer controle de áudio, use output_audio para ativá-lo ou desativá-lo explicitamente. O alias camelCase outputAudio também é aceito por compatibilidade.
Em integrações de produção, prefira URLs https públicas para imagens, vídeos e áudio. Modelos compatíveis continuam aceitando URLs data:, mas payloads base64 grandes dificultam retry, observabilidade e depuração.
Corpo da requisição
ID do modelo de vídeo. O padrão da API é
sora-2. Consulte o guia de geração de vídeo para ver a matriz pública atual e os recursos compatíveis.Descrição em texto do vídeo a ser gerado. Este campo é obrigatório para a maioria dos modelos públicos de vídeo.
Operação de vídeo a ser executada. O contrato público suporta
text-to-video, image-to-video, reference-to-video, start-end-to-video, video-to-video, video-extension, audio-to-video e motion-control. A TokenLab pode inferir a operação a partir das entradas, mas em produção o ideal é informá-la explicitamente.URL pública da imagem inicial para fluxos image-to-video. Para a compatibilidade mais ampla entre modelos, prefira
image_url.Imagem inline como URL
data: (por exemplo, data:image/jpeg;base64,...). Modelos compatíveis aceitam esse formato, mas image_url costuma ser mais robusto em produção.Imagens de referência para fluxos com condicionamento dedicado. A quantidade suportada depende do modelo. Para
seedance-2.0 e seedance-2.0-fast, a TokenLab suporta atualmente até 9 imagens de referência, além de até 3 vídeos de referência e 3 áudios de referência. Recomendam-se URLs públicas https; modelos compatíveis também aceitam URLs data:.Campo opcional para modelos que distinguem entre referências
asset e style.Definições de referências de elementos do Kling 3.0. Suportadas apenas por
kling-3.0-video em solicitações condicionadas por imagem. Defina 1-3 elementos; cada elemento tem name, description opcional e element_input_urls com 2-4 URLs de imagem. Referencie o elemento no prompt como @name. Não combine kling_elements com output_audio=true; omita output_audio ou defina como false em solicitações com referências de elementos.URL pública do vídeo de origem. É obrigatória para os fluxos públicos atuais de
video-to-video e para os modelos de motion-control.Entradas adicionais de vídeo de referência para modelos com condicionamento multimodal. A quantidade suportada depende do modelo. Para
seedance-2.0 e seedance-2.0-fast, a TokenLab suporta atualmente até 3 vídeos de referência.URL pública de áudio para modelos que suportam
audio-to-video.Entradas adicionais de áudio de referência para modelos com condicionamento multimodal. A quantidade suportada depende do modelo. Para
seedance-2.0 e seedance-2.0-fast, a TokenLab suporta atualmente até 3 áudios de referência.Identificador de tarefa do provedor para alguns fluxos de continuação, extensão ou derivação.
Deslocamento inicial específico do modelo para alguns fluxos
video-extension.Multiplicador ou quantidade de repetições específica do modelo para alguns fluxos
video-extension.Duração do vídeo de saída gerado em segundos. Os valores permitidos dependem do modelo. Este campo controla apenas a duração da saída e não a duração do vídeo de referência de entrada.
Proporção de aspecto, por exemplo
16:9, 9:16 ou 1:1.Resolução de saída, por exemplo
720p, 1080p ou 4k. A compatibilidade depende do modelo.Alternância de saída de áudio dependente do modelo. No TokenLab, solicitações da família Veo 3 usam
true por padrão quando este campo é omitido. kling-3.0-video aceita este seletor para solicitações sem referências de elementos e o mapeia para o controle de som upstream compatível; solicitações Kling omitidas são silenciosas por padrão. Não combine output_audio=true com kling_elements. Outros modelos públicos de vídeo seguem seu comportamento padrão governado. O alias camelCase outputAudio é aceito por compatibilidade.Quadros por segundo (1-120). Só tem efeito em modelos que expõem controle de FPS.
Elementos que devem ser evitados no vídeo gerado.
Seed aleatória para resultados reproduzíveis.
Intensidade de aderência ao prompt (0-20) nos modelos que expõem esse controle.
Intensidade de movimento (0-1) nos modelos que expõem esse controle.
URL da imagem do primeiro quadro, ou entrada compatível, para
start-end-to-video.URL da imagem do último quadro, ou entrada compatível, para
start-end-to-video.Faixa de tamanho específica do modelo para alguns modelos de vídeo compatíveis com OpenAI.
Alternador de marca-d’água para modelos que o expõem publicamente.
Seletor de efeito específico do modelo para alguns fluxos especializados de edição ou efeitos.
Identificador único do usuário final.
Notas de compatibilidade
- Os campos públicos canônicos usam snake_case:
reference_images,reference_image_typeeoutput_audio. - Por compatibilidade, a TokenLab também aceita os aliases camelCase
referenceImages,referenceImageTypeeoutputAudio. - Se
operationfor omitido, a TokenLab a infere a partir das entradas. Mesmo assim, em produção recomenda-se enviá-la explicitamente.
Boas práticas para entradas de mídia
- Para
image_url,reference_images,video_urleaudio_url, prefira URLshttpspúblicas. - Sempre que possível, evite misturar base64 inline e URLs remotas na mesma requisição.
- Se você usar URLs assinadas, garanta que elas permaneçam válidas durante o período necessário para retries e criação assíncrona da tarefa.
Resposta
Identificador canônico da tarefa assíncrona. Quando
id e task_id estiverem presentes juntos, trate-os como a mesma tarefa.Identificador único da tarefa para polling.
URL de polling recomendada para esta tarefa. Use exatamente esse caminho ao consultar o status.
ID de transação de faturamento da TokenLab quando a liquidação já foi concluída. Este é o identificador usado no dashboard / conciliação e é separado do
id / task_id assíncrono.Status inicial:
pending.Timestamp Unix de criação da tarefa.
Modelo utilizado.
Imagem para vídeo
Kling 3.0 Elements
Usekling_elements com kling-3.0-video quando precisar de referências de elementos. Forneça uma solicitação condicionada por imagem (image_url, image_urls, start_image ou end_image) e referencie cada elemento no prompt com @name. Não combine kling_elements com output_audio=true; omita output_audio ou defina como false em solicitações com referências de elementos.
Referência para vídeo
Useoperation=reference-to-video quando o modelo suportar condicionamento dedicado por referência. No contrato público da TokenLab, referências de imagem usam reference_images, enquanto vídeos e áudios de referência multimodais usam video_urls e audio_urls. Para seedance-2.0 e seedance-2.0-fast, a TokenLab suporta atualmente até 9 imagens de referência, além de até 3 vídeos de referência e 3 áudios de referência. duration controla apenas a duração do resultado gerado; ele não define um limite separado para a duração do vídeo de referência de entrada.
Controle de quadro inicial e final
Usestart_image e end_image para controlar o primeiro e o último quadro.
Vídeo para vídeo
Quando um modelo aceita um vídeo existente como entrada principal, useoperation=video-to-video.
Controle de movimento
Quando um modelo precisa tanto de uma imagem do sujeito quanto de um vídeo de referência de movimento, useoperation=motion-control. A TokenLab normaliza a forma pública image_url + video_url para o contrato upstream correspondente.
Disponibilidade atual de audio-to-video e video-extension
O contrato público da TokenLab aceitaaudio-to-video e video-extension para fluxos específicos de determinados modelos. No entanto, na lista pública de modelos geralmente habilitados desta compilação de documentação não há nenhum modelo amplamente habilitado que anuncie publicamente essas capacidades. Antes de integrar esses fluxos, confirme a disponibilidade atual pela Models API ou pela página de modelos.
Inventário público atual de modelos
Esta lista está alinhada ao inventário público de modelos de vídeo habilitados nesta compilação da documentação. Para o estado mais recente, consulte a Models API.OpenAI
| Modelo | Operações públicas |
|---|---|
sora-2 | Texto para vídeo, imagem para vídeo |
sora-2-pro | Texto para vídeo, imagem para vídeo |
sora-2-pro-storyboard | Imagem para vídeo |
Kuaishou
| Modelo | Operações públicas |
|---|---|
kling-3.0-motion-control | Controle de movimento |
kling-3.0-video | Texto para vídeo, imagem para vídeo, início-fim para vídeo, referências de elementos |
kling-v2.5-turbo-pro | Texto para vídeo, imagem para vídeo, início-fim para vídeo |
kling-v2.5-turbo-std | Texto para vídeo, imagem para vídeo |
kling-v2.6-pro | Texto para vídeo, imagem para vídeo, início-fim para vídeo |
kling-v2.6-std | Texto para vídeo, imagem para vídeo |
kling-v3.0-pro | Texto para vídeo, imagem para vídeo, início-fim para vídeo |
kling-v3.0-std | Texto para vídeo, imagem para vídeo, início-fim para vídeo |
kling-video-o1-pro | Texto para vídeo, imagem para vídeo, referência para vídeo, início-fim para vídeo, vídeo para vídeo |
kling-video-o1-std | Texto para vídeo, imagem para vídeo, referência para vídeo, início-fim para vídeo, vídeo para vídeo |
| Modelo | Operações públicas |
|---|---|
veo3 | Texto para vídeo, imagem para vídeo |
veo3-fast | Texto para vídeo, imagem para vídeo |
veo3-pro | Texto para vídeo, imagem para vídeo |
veo3.1 | Texto para vídeo, imagem para vídeo, referência para vídeo, início-fim para vídeo |
veo3.1-fast | Texto para vídeo, imagem para vídeo, referência para vídeo, início-fim para vídeo |
veo3.1-pro | Texto para vídeo, imagem para vídeo, início-fim para vídeo |
ByteDance
| Modelo | Operações públicas |
|---|---|
seedance-1.5-pro | Texto para vídeo, imagem para vídeo |
MiniMax
| Modelo | Operações públicas |
|---|---|
hailuo-2.3-fast | Imagem para vídeo |
hailuo-2.3-pro | Texto para vídeo, imagem para vídeo |
hailuo-2.3-standard | Texto para vídeo, imagem para vídeo |
Alibaba
| Modelo | Operações públicas |
|---|---|
wan-2.2-plus | Texto para vídeo, imagem para vídeo |
wan-2.5 | Texto para vídeo, imagem para vídeo |
wan-2.6 | Texto para vídeo, imagem para vídeo, referência para vídeo |
Shengshu
| Modelo | Operações públicas |
|---|---|
viduq2 | Texto para vídeo, referência para vídeo |
viduq2-pro | Imagem para vídeo, referência para vídeo, início-fim para vídeo |
viduq2-pro-fast | Imagem para vídeo, início-fim para vídeo |
viduq2-turbo | Imagem para vídeo, início-fim para vídeo |
viduq3-pro | Texto para vídeo, imagem para vídeo, início-fim para vídeo |
viduq3-turbo | Texto para vídeo, imagem para vídeo, início-fim para vídeo |
xAI
| Modelo | Operações públicas |
|---|---|
grok-imagine-image-to-video | Imagem para vídeo |
grok-imagine-text-to-video | Texto para vídeo |
grok-imagine-upscale | Vídeo para vídeo |
Outros
| Modelo | Operações públicas |
|---|---|
topaz-video-upscale | Vídeo para vídeo |