Dùng hợp đồng công khai thống nhất cho các luồng text-to-video, image-to-video, reference-to-video, điều khiển khung đầu/cuối, điều khiển chuyển động và video-to-video.
TokenLab cung cấp khả năng tạo video thông qua một API hợp nhất. Quá trình này bất đồng bộ: bạn gửi yêu cầu, nhận task_id và poll_url, rồi kiểm tra trạng thái định kỳ cho tới khi có kết quả cuối cùng.
Danh sách model video công khai có thể thay đổi theo thời gian. Để xem tình trạng mới nhất, hãy dùng Models API hoặc truy cập trang Models.Nếu phản hồi tạo trả về poll_url, hãy gọi đúng URL đó. Khi nó trỏ tới /v1/tasks/{id}, hãy xem đó là endpoint trạng thái cố định chuẩn.
Hành vi âm thanh phụ thuộc vào từng model. Trong TokenLab, họ Veo 3 mặc định bật âm thanh khi bỏ qua output_audio. Một số model công khai chỉ hỗ trợ im lặng hoặc không cung cấp công tắc âm thanh ổn định.Trong môi trường vận hành, nên ưu tiên URL https công khai thay vì base64 inline cho ảnh, video và âm thanh. Các model tương thích vẫn hỗ trợ URL data:, nhưng URL công khai sẽ dễ retry, kiểm tra và debug hơn.
Hợp đồng video công khai hiện tại của TokenLab tập trung vào các thao tác sau:
text-to-video
image-to-video
reference-to-video
start-end-to-video
video-to-video
motion-control
Hợp đồng yêu cầu cũng chấp nhận audio-to-video và video-extension cho một số luồng đặc thù theo model, nhưng trong bản tài liệu hiện tại chưa có model công khai phổ biến nào quảng bá rõ ràng hai khả năng này.
Chú thích: ✅ Có ít nhất một model công khai đang bật trong nhóm nhà cung cấp đó hỗ trợ khả năng này | ❌ Hiện chưa có model công khai đang bật nào đại diện cho khả năng đó
Dùng kling_elements với kling-3.0-video khi cần tham chiếu phần tử. Cung cấp request có điều kiện ảnh (image_url, image_urls, start_image hoặc end_image) và tham chiếu từng phần tử trong prompt bằng @name. Không kết hợp kling_elements với output_audio=true; hãy bỏ output_audio hoặc đặt thành false khi dùng tham chiếu phần tử.
Với seedance-2.0 và seedance-2.0-fast, TokenLab hiện hỗ trợ tối đa 9 ảnh tham chiếu, cùng thêm tối đa 3 video tham chiếu và 3 audio tham chiếu. duration chỉ điều khiển độ dài đầu ra được tạo; nó không định nghĩa giới hạn riêng cho thời lượng video tham chiếu đầu vào.
response = requests.post(f"{BASE}/videos/generations", headers=headers, json={ "model": "veo3.1", "prompt": "Keep the same subject identity and palette while adding subtle motion.", "operation": "reference-to-video", "reference_images": [ "https://example.com/ref-a.jpg", "https://example.com/ref-b.jpg" ], "duration": 8, "resolution": "720p", "aspect_ratio": "9:16" })
Billing phụ thuộc vào model. Một số model video công khai thực tế gần với cách tính phí theo request, trong khi một số model khác gần với cách tính theo thời lượng giây. Để xem mặt bằng giá công khai hiện tại, hãy tham khảo trang Models hoặc Pricing API.