Documentation Index
Fetch the complete documentation index at: https://docs.tokenlab.sh/llms.txt
Use this file to discover all available pages before exploring further.
Tổng quan
Việc sinh video là bất đồng bộ. Bạn gửi một yêu cầu, nhậntask_id và poll_url, rồi kiểm tra trạng thái định kỳ cho tới khi có kết quả cuối cùng.
Hành vi polling
Để việc kiểm tra trạng thái đáng tin cậy nhất, hãy dùng chính xácpoll_url được trả về từ phản hồi tạo tác vụ.
Nếu phản hồi tạo trả về poll_url, hãy gọi đúng URL đó. Khi nó trỏ tới /v1/tasks/{id}, hãy xem đó là endpoint trạng thái cố định chuẩn.
Hành vi mô hình và phương tiện
Đầu ra âm thanh phụ thuộc vào từng model. Trong TokenLab, họ Veo 3 sẽ mặc định bật âm thanh nếu bỏ quaoutput_audio. Khi model hỗ trợ điều khiển âm thanh, hãy dùng output_audio để bật hoặc tắt một cách tường minh. Alias camelCase outputAudio cũng được chấp nhận để tương thích.
Trong môi trường vận hành, nên ưu tiên URL https công khai cho ảnh, video và âm thanh. Các model tương thích vẫn chấp nhận URL data:, nhưng payload base64 lớn sẽ khó retry, kiểm tra và debug hơn.
Phần thân yêu cầu
ID model video. Mặc định của API là
sora-2. Xem hướng dẫn tạo video để biết ma trận model công khai hiện tại và các khả năng được hỗ trợ.Mô tả văn bản của video cần tạo. Trường này là bắt buộc với hầu hết model video công khai.
Tác vụ video cần chạy. Hợp đồng công khai hiện hỗ trợ
text-to-video, image-to-video, reference-to-video, start-end-to-video, video-to-video, video-extension, audio-to-video và motion-control. TokenLab có thể suy luận tác vụ từ dữ liệu đầu vào, nhưng với traffic vận hành bạn vẫn nên truyền operation một cách tường minh.URL công khai của ảnh đầu vào cho luồng image-to-video. Để có độ tương thích rộng nhất giữa các model, nên ưu tiên
image_url.Ảnh inline dưới dạng URL
data: (ví dụ: data:image/jpeg;base64,...). Các model tương thích có hỗ trợ, nhưng trong môi trường vận hành thì image_url thường ổn định hơn.Ảnh tham chiếu cho các luồng có conditioning chuyên biệt. Số lượng hỗ trợ phụ thuộc vào model. Với
seedance-2.0 và seedance-2.0-fast, TokenLab hiện hỗ trợ tối đa 9 ảnh tham chiếu, cùng thêm tối đa 3 video tham chiếu và 3 audio tham chiếu. Nên ưu tiên URL công khai https; các model tương thích cũng chấp nhận URL data:.Trường tùy chọn cho những model phân biệt ảnh tham chiếu kiểu
asset và style.Định nghĩa tham chiếu phần tử Kling 3.0. Chỉ hỗ trợ với
kling-3.0-video cho request có điều kiện ảnh. Khai báo 1-3 phần tử; mỗi phần tử có name, description tùy chọn và element_input_urls gồm 2-4 URL ảnh. Tham chiếu phần tử trong prompt bằng @name. Không kết hợp kling_elements với output_audio=true; hãy bỏ output_audio hoặc đặt thành false khi dùng tham chiếu phần tử.URL công khai của video nguồn. Trường này cần thiết cho các luồng
video-to-video công khai hiện tại và cho các model motion-control.Đầu vào video tham chiếu bổ sung cho các model hỗ trợ conditioning tham chiếu đa phương thức. Số lượng hỗ trợ phụ thuộc vào model. Với
seedance-2.0 và seedance-2.0-fast, TokenLab hiện hỗ trợ tối đa 3 video tham chiếu.URL công khai của âm thanh cho các model hỗ trợ
audio-to-video.Đầu vào audio tham chiếu bổ sung cho các model hỗ trợ conditioning tham chiếu đa phương thức. Số lượng hỗ trợ phụ thuộc vào model. Với
seedance-2.0 và seedance-2.0-fast, TokenLab hiện hỗ trợ tối đa 3 audio tham chiếu.Mã task từ phía provider, dùng trong một số luồng tiếp nối, mở rộng hoặc dẫn xuất.
Vị trí bắt đầu mở rộng theo đặc thù từng model trong một số luồng
video-extension.Hệ số hoặc số lần lặp theo đặc thù từng model trong một số luồng
video-extension.Thời lượng video đầu ra được tạo tính bằng giây. Giá trị hợp lệ phụ thuộc vào model. Trường này chỉ điều khiển độ dài đầu ra, không phải giới hạn thời lượng của video tham chiếu đầu vào.
Tỷ lệ khung hình, ví dụ
16:9, 9:16 hoặc 1:1.Độ phân giải đầu ra, ví dụ
720p, 1080p hoặc 4k. Mức hỗ trợ phụ thuộc vào model.Công tắc xuất âm thanh phụ thuộc vào model. Trong TokenLab, request thuộc họ Veo 3 mặc định là
true khi bỏ qua trường này. kling-3.0-video chấp nhận selector này cho request không dùng tham chiếu phần tử và ánh xạ sang điều khiển sound upstream tương thích; request Kling khi bỏ qua trường này mặc định là im lặng. Không kết hợp output_audio=true với kling_elements. Các model video công khai khác tuân theo hành vi mặc định đã được quản trị. Alias camelCase outputAudio cũng được chấp nhận để tương thích.Số khung hình trên giây (1-120). Chỉ có tác dụng ở những model công khai hỗ trợ điều khiển FPS.
Những gì bạn muốn tránh trong video được tạo ra.
Seed ngẫu nhiên để có kết quả tái lập.
Mức bám theo prompt (0-20) ở những model hỗ trợ kiểu điều khiển này.
Cường độ chuyển động (0-1) ở những model hỗ trợ trường này.
URL ảnh khung hình đầu tiên, hoặc đầu vào ảnh tương thích, cho
start-end-to-video.URL ảnh khung hình cuối cùng, hoặc đầu vào ảnh tương thích, cho
start-end-to-video.Bậc kích thước theo đặc thù model trong một số model video tương thích OpenAI.
Công tắc watermark ở các model có hỗ trợ công khai trường này.
Bộ chọn hiệu ứng theo đặc thù model trong một số luồng chỉnh sửa hoặc hiệu ứng chuyên biệt.
Một định danh duy nhất cho người dùng cuối.
Ghi chú tương thích
- Các trường công khai chuẩn dùng snake_case:
reference_images,reference_image_type, vàoutput_audio. - Để tương thích, TokenLab cũng chấp nhận các alias camelCase là
referenceImages,referenceImageType, vàoutputAudio. - Nếu bỏ qua
operation, TokenLab sẽ suy luận từ dữ liệu đầu vào. Dù vậy, với traffic vận hành vẫn nên truyềnoperationmột cách tường minh.
Thực hành tốt cho đầu vào media
- Với
image_url,reference_images,video_url, vàaudio_url, hãy ưu tiên URLhttpscông khai. - Nếu có thể, tránh trộn base64 inline và URL từ xa trong cùng một yêu cầu.
- Nếu dùng signed URL, hãy giữ thời gian sống đủ dài để bao phủ quá trình retry và tạo task bất đồng bộ.
Phản hồi
Mã định danh chuẩn của tác vụ bất đồng bộ. Khi cả
id và task_id cùng xuất hiện, hãy xem chúng là cùng một tác vụ.Định danh tác vụ duy nhất để kiểm tra trạng thái.
URL kiểm tra trạng thái được khuyến nghị cho tác vụ này. Hãy dùng đúng đường dẫn này khi kiểm tra trạng thái.
ID giao dịch billing của TokenLab khi việc settlement đã hoàn tất. Đây là mã giao dịch dùng cho dashboard/đối soát và tách biệt với
id / task_id bất đồng bộ.Trạng thái ban đầu:
pending.Dấu thời gian Unix khi tác vụ được tạo.
Model được sử dụng.
Image sang video
Kling 3.0 Elements
Dùngkling_elements với kling-3.0-video khi cần tham chiếu phần tử. Cung cấp request có điều kiện ảnh (image_url, image_urls, start_image hoặc end_image) và tham chiếu từng phần tử trong prompt bằng @name. Không kết hợp kling_elements với output_audio=true; hãy bỏ output_audio hoặc đặt thành false khi dùng tham chiếu phần tử.
Ảnh tham chiếu sang video
Hãy dùngoperation=reference-to-video khi model hỗ trợ conditioning tham chiếu chuyên biệt. Trong hợp đồng công khai của TokenLab, ảnh tham chiếu dùng reference_images, còn video và audio tham chiếu đa phương thức dùng video_urls và audio_urls. Với seedance-2.0 và seedance-2.0-fast, TokenLab hiện hỗ trợ tối đa 9 ảnh tham chiếu, cùng thêm tối đa 3 video tham chiếu và 3 audio tham chiếu. duration chỉ điều khiển độ dài đầu ra được tạo; nó không đặt ra giới hạn riêng cho thời lượng video tham chiếu đầu vào.
Điều khiển khung đầu và cuối
Hãy dùngstart_image và end_image để kiểm soát khung hình đầu tiên và cuối cùng.
Video sang video
Nếu model nhận một video có sẵn làm đầu vào chính, hãy dùngoperation=video-to-video.
Điều khiển chuyển động
Nếu model cần cả ảnh chủ thể lẫn video tham chiếu chuyển động, hãy dùngoperation=motion-control. TokenLab sẽ chuẩn hóa dạng công khai image_url + video_url về hợp đồng upstream tương ứng.
Tình trạng hỗ trợ audio-to-video và video-extension hiện tại
Hợp đồng công khai của TokenLab có chấp nhậnaudio-to-video và video-extension cho một số luồng đặc thù theo model. Tuy nhiên, trong tập model công khai đang được bật rộng rãi của bản tài liệu này, hiện chưa có model công khai phổ biến nào quảng bá rõ ràng hai khả năng đó. Trước khi tích hợp các luồng này, hãy kiểm tra lại trạng thái mới nhất qua Models API hoặc trang Models.
Danh sách model video công khai đang được bật
Danh sách này bám theo inventory model video công khai đang được bật trong bản tài liệu hiện tại. Để có trạng thái mới nhất, hãy dùng Models API.OpenAI
| Mô hình | Thao tác công khai |
|---|---|
sora-2 | Văn bản sang video, image-to-video |
sora-2-pro | Văn bản sang video, image-to-video |
sora-2-pro-storyboard | Từ ảnh sang video |
Kuaishou
| Mô hình | Thao tác công khai |
|---|---|
kling-3.0-motion-control | Điều khiển chuyển động |
kling-3.0-video | Văn bản sang video, image-to-video, start-end-to-video, tham chiếu phần tử |
kling-v2.5-turbo-pro | Văn bản sang video, image-to-video, start-end-to-video |
kling-v2.5-turbo-std | Văn bản sang video, image-to-video |
kling-v2.6-pro | Văn bản sang video, image-to-video, start-end-to-video |
kling-v2.6-std | Văn bản sang video, image-to-video |
kling-v3.0-pro | Văn bản sang video, image-to-video, start-end-to-video |
kling-v3.0-std | Văn bản sang video, image-to-video, start-end-to-video |
kling-video-o1-pro | Văn bản sang video, image-to-video, reference-to-video, start-end-to-video, video-to-video |
kling-video-o1-std | Văn bản sang video, image-to-video, reference-to-video, start-end-to-video, video-to-video |
| Mô hình | Thao tác công khai |
|---|---|
veo3 | Văn bản sang video, image-to-video |
veo3-fast | Văn bản sang video, image-to-video |
veo3-pro | Văn bản sang video, image-to-video |
veo3.1 | Văn bản sang video, image-to-video, reference-to-video, start-end-to-video |
veo3.1-fast | Văn bản sang video, image-to-video, reference-to-video, start-end-to-video |
veo3.1-pro | Văn bản sang video, image-to-video, start-end-to-video |
ByteDance
| Mô hình | Thao tác công khai |
|---|---|
seedance-1.5-pro | Văn bản sang video, image-to-video |
MiniMax
| Mô hình | Thao tác công khai |
|---|---|
hailuo-2.3-fast | Từ ảnh sang video |
hailuo-2.3-pro | Văn bản sang video, image-to-video |
hailuo-2.3-standard | Văn bản sang video, image-to-video |
Alibaba
| Mô hình | Thao tác công khai |
|---|---|
wan-2.2-plus | Văn bản sang video, image-to-video |
wan-2.5 | Văn bản sang video, image-to-video |
wan-2.6 | Văn bản sang video, image-to-video, reference-to-video |
Shengshu
| Mô hình | Thao tác công khai |
|---|---|
viduq2 | Văn bản sang video, reference-to-video |
viduq2-pro | Ảnh thành video, tham chiếu thành video, đầu-cuối thành video |
viduq2-pro-fast | Ảnh thành video, đầu-cuối thành video |
viduq2-turbo | Chuyển ảnh thành video, từ đầu đến cuối thành video |
viduq3-pro | Văn bản sang video, image-to-video, start-end-to-video |
viduq3-turbo | Văn bản sang video, image-to-video, start-end-to-video |
xAI
| Mô hình | Thao tác công khai |
|---|---|
grok-imagine-image-to-video | Từ ảnh sang video |
grok-imagine-text-to-video | Văn bản sang video |
grok-imagine-upscale | Từ video sang video |
Khác
| Mô hình | Thao tác công khai |
|---|---|
topaz-video-upscale | Từ video sang video |