استخدم عقدًا عامًا موحدًا للوصول إلى تدفقات النص إلى فيديو و image-to-video و reference-to-video والتحكم في الإطارين الأول والأخير والتحكم في الحركة و video-to-video.
توفّر TokenLab توليد الفيديو عبر API موحّد. تعمل العملية بشكل غير متزامن: ترسل طلبًا، وتتلقى task_id و poll_url، ثم تتحقق من الحالة بشكل دوري حتى تصبح النتيجة النهائية جاهزة.
يمكنك الاطلاع على أحدث مخزون لنماذج الفيديو العامة عبر واجهة Models API أو عبر صفحة النماذج.إذا أعادت استجابة الإنشاء poll_url، فاستدعِ هذا الرابط نفسه تمامًا. وعندما يشير إلى /v1/tasks/{id}، فاعتبره نقطة الحالة الثابتة المعيارية.
يعتمد سلوك الصوت على النموذج. في TokenLab، تُعامل عائلة Veo 3 على أن الصوت مفعّل افتراضيًا عندما يُحذف output_audio. أما النماذج العامة الأخرى فقد تكون صامتة افتراضيًا أو لا تكشف مفتاحًا ثابتًا للتحكم في الصوت.في تكاملات الإنتاج، يُفضّل استخدام روابط https عامة للصور والفيديو والصوت. ما تزال النماذج المتوافقة تقبل روابط data:، لكن الروابط العامة أكثر متانة عند إعادة المحاولة والرصد وتشخيص المشاكل.
يرتكز عقد الفيديو العام الحالي في TokenLab على العمليات التالية:
text-to-video
image-to-video
reference-to-video
start-end-to-video
video-to-video
motion-control
كما يقبل العقد العام أيضًا audio-to-video و video-extension لبعض التدفقات الخاصة بالنماذج، لكن قائمة النماذج العامة المفعلة على نطاق واسع في هذا البناء من الوثائق لا تتضمن حاليًا نموذجًا عامًا يعلن هاتين القدرتين بشكل واسع.
استخدم kling_elements مع kling-3.0-video عندما تحتاج إلى مراجع عناصر. يجب أن يحتوي الطلب على شرط صورة (image_url أو image_urls أو start_image أو end_image) وأن تشير إلى كل عنصر في prompt باستخدام @name. لا تجمع kling_elements مع output_audio=true؛ احذف output_audio أو اجعله false عند استخدام مراجع العناصر.
بالنسبة إلى seedance-2.0 و seedance-2.0-fast، تدعم TokenLab حاليًا ما يصل إلى 9 صور مرجعية، بالإضافة إلى ما يصل إلى 3 مقاطع فيديو مرجعية و3 ملفات صوت مرجعية. يتحكم duration فقط في طول الإخراج الناتج، ولا يعرّف حدًا منفصلًا لمدة فيديو المرجع المُدخل.
response = requests.post(f"{BASE}/videos/generations", headers=headers, json={ "model": "veo3.1", "prompt": "Keep the same subject identity and palette while adding subtle motion.", "operation": "reference-to-video", "reference_images": [ "https://example.com/ref-a.jpg", "https://example.com/ref-b.jpg" ], "duration": 8, "resolution": "720p", "aspect_ratio": "9:16" })
تعتمد الفوترة على النموذج. بعض نماذج الفيديو العامة تتصرف فعليًا كنماذج تُسعَّر لكل طلب، بينما يقترب بعضها الآخر من التسعير لكل ثانية. وللاطلاع على سطح الأسعار العام الحالي، راجع صفحة النماذج أو واجهة Pricing API.