الانتقال إلى المحتوى الرئيسي

Documentation Index

Fetch the complete documentation index at: https://docs.tokenlab.sh/llms.txt

Use this file to discover all available pages before exploring further.

نظرة عامة

توفّر TokenLab توليد الفيديو عبر API موحّد. تعمل العملية بشكل غير متزامن: ترسل طلبًا، وتتلقى task_id و poll_url، ثم تتحقق من الحالة بشكل دوري حتى تصبح النتيجة النهائية جاهزة.

التوفر والاستعلام

يمكنك الاطلاع على أحدث مخزون لنماذج الفيديو العامة عبر واجهة Models API أو عبر صفحة النماذج. إذا أعادت استجابة الإنشاء poll_url، فاستدعِ هذا الرابط نفسه تمامًا. وعندما يشير إلى /v1/tasks/{id}، فاعتبره نقطة الحالة الثابتة المعيارية.

سلوك النموذج والوسائط

يعتمد سلوك الصوت على النموذج. في TokenLab، تُعامل عائلة Veo 3 على أن الصوت مفعّل افتراضيًا عندما يُحذف output_audio. أما النماذج العامة الأخرى فقد تكون صامتة افتراضيًا أو لا تكشف مفتاحًا ثابتًا للتحكم في الصوت. في تكاملات الإنتاج، يُفضّل استخدام روابط https عامة للصور والفيديو والصوت. ما تزال النماذج المتوافقة تقبل روابط data:، لكن الروابط العامة أكثر متانة عند إعادة المحاولة والرصد وتشخيص المشاكل.

التدفق غير المتزامن

العمليات العامة الحالية

يرتكز عقد الفيديو العام الحالي في TokenLab على العمليات التالية:
  • text-to-video
  • image-to-video
  • reference-to-video
  • start-end-to-video
  • video-to-video
  • motion-control
كما يقبل العقد العام أيضًا audio-to-video و video-extension لبعض التدفقات الخاصة بالنماذج، لكن قائمة النماذج العامة المفعلة على نطاق واسع في هذا البناء من الوثائق لا تتضمن حاليًا نموذجًا عامًا يعلن هاتين القدرتين بشكل واسع.

مصفوفة القدرات

الترميز: ✅ توجد قدرة ممثلة في نموذج عام واحد على الأقل ومفعّل حاليًا ضمن عائلة المزود | ❌ غير ممثلة حاليًا في النماذج العامة المفعلة
السلسلةT2VI2Vمرجعيبداية-نهايةV2Vحركة
OpenAI
Kuaishou
Google
ByteDance
MiniMax
Alibaba
Shengshu
xAI
أخرى

تعريفات القدرات

  • T2V (Text-to-Video): توليد فيديو من prompt نصي
  • I2V (Image-to-Video): توليد فيديو انطلاقًا من صورة أولية؛ ولأوسع توافق يُنصح باستخدام image_url
  • مرجعي: تكييف التوليد بواسطة صورة مرجعية واحدة أو أكثر عبر reference_images
  • بداية-نهاية: التحكم في الإطار الأول والأخير باستخدام start_image و end_image
  • V2V (Video-to-Video): استخدام فيديو موجود كمدخل رئيسي
  • حركة: الجمع بين صورة العنصر وفيديو مرجعي للحركة

قائمة النماذج العامة الحالية

OpenAI

النموذجالعمليات العامة
sora-2نص إلى فيديو، image-to-video
sora-2-proنص إلى فيديو، image-to-video
sora-2-pro-storyboardمن صورة إلى فيديو

Kuaishou

النموذجالعمليات العامة
kling-3.0-motion-controlتحكم في الحركة
kling-3.0-videoنص إلى فيديو، image-to-video، start-end-to-video، مراجع العناصر
kling-v2.1-masterنص إلى فيديو، image-to-video
kling-v2.1-proimage-to-video، start-end-to-video
kling-v2.1-standardimage-to-video
kling-v2.5-turbo-proنص إلى فيديو، image-to-video، start-end-to-video
kling-v2.5-turbo-stdنص إلى فيديو، image-to-video
kling-v2.6-proنص إلى فيديو، image-to-video، start-end-to-video
kling-v2.6-stdنص إلى فيديو، image-to-video
kling-v3.0-proنص إلى فيديو، image-to-video، start-end-to-video
kling-v3.0-stdنص إلى فيديو، image-to-video، start-end-to-video
kling-video-o1-proنص إلى فيديو، image-to-video، reference-to-video، start-end-to-video، video-to-video
kling-video-o1-stdنص إلى فيديو، image-to-video، reference-to-video، start-end-to-video، video-to-video

Google

النموذجالعمليات العامة
veo3نص إلى فيديو، image-to-video
veo3-fastنص إلى فيديو، image-to-video
veo3-proنص إلى فيديو، image-to-video
veo3.1نص إلى فيديو، image-to-video، reference-to-video، start-end-to-video
veo3.1-fastنص إلى فيديو، image-to-video، reference-to-video، start-end-to-video
veo3.1-proنص إلى فيديو، image-to-video، start-end-to-video

ByteDance

النموذجالعمليات العامة
seedance-1.5-proنص إلى فيديو، image-to-video

MiniMax

النموذجالعمليات العامة
hailuo-2.3-fastمن صورة إلى فيديو
hailuo-2.3-proنص إلى فيديو، image-to-video
hailuo-2.3-standardنص إلى فيديو، image-to-video

Alibaba

النموذجالعمليات العامة
wan-2.2-plusنص إلى فيديو، image-to-video
wan-2.5نص إلى فيديو، image-to-video
wan-2.6نص إلى فيديو، image-to-video، reference-to-video

Shengshu

النموذجالعمليات العامة
viduq2نص إلى فيديو، reference-to-video
viduq2-proصورة إلى فيديو، مرجع إلى فيديو، إطار بداية/نهاية إلى فيديو
viduq2-pro-fastصورة إلى فيديو، إطار بداية/نهاية إلى فيديو
viduq2-turboصورة إلى فيديو، إطار بداية/نهاية إلى فيديو
viduq3-proنص إلى فيديو، image-to-video، start-end-to-video
viduq3-turboنص إلى فيديو، image-to-video، start-end-to-video

xAI

النموذجالعمليات العامة
grok-imagine-videoنص إلى فيديو، صورة إلى فيديو
grok-imagine-image-to-videoمن صورة إلى فيديو
grok-imagine-text-to-videoنص إلى فيديو
grok-imagine-upscaleمن فيديو إلى فيديو

أخرى

النموذجالعمليات العامة
topaz-video-upscaleمن فيديو إلى فيديو

أمثلة الاستخدام

text-to-video

response = requests.post(f"{BASE}/videos/generations",
    headers=headers,
    json={
        "model": "sora-2",
        "prompt": "A calm cinematic shot of a cat walking through a sunlit garden.",
        "operation": "text-to-video",
        "duration": 4,
        "aspect_ratio": "16:9"
    }
)

صورة إلى فيديو

response = requests.post(f"{BASE}/videos/generations",
    headers=headers,
    json={
        "model": "hailuo-2.3-standard",
        "prompt": "The scene begins from the provided image and adds gentle natural motion.",
        "operation": "image-to-video",
        "image_url": "https://example.com/portrait.jpg",
        "duration": 6,
        "aspect_ratio": "16:9"
    }
)

Kling 3.0 Elements

استخدم kling_elements مع kling-3.0-video عندما تحتاج إلى مراجع عناصر. يجب أن يحتوي الطلب على شرط صورة (image_url أو image_urls أو start_image أو end_image) وأن تشير إلى كل عنصر في prompt باستخدام @name. لا تجمع kling_elements مع output_audio=true؛ احذف output_audio أو اجعله false عند استخدام مراجع العناصر.
response = requests.post(f"{BASE}/videos/generations",
    headers=headers,
    json={
        "model": "kling-3.0-video",
        "prompt": "Place @hero_bag on a studio turntable with soft product lighting.",
        "operation": "image-to-video",
        "image_url": "https://example.com/studio-start.png",
        "duration": 5,
        "resolution": "720p",
        "kling_elements": [
            {
                "name": "hero_bag",
                "description": "black leather handbag",
                "element_input_urls": [
                    "https://example.com/bag-front.png",
                    "https://example.com/bag-side.png"
                ]
            }
        ]
    }
)

مرجع إلى فيديو

بالنسبة إلى seedance-2.0 و seedance-2.0-fast، تدعم TokenLab حاليًا ما يصل إلى 9 صور مرجعية، بالإضافة إلى ما يصل إلى 3 مقاطع فيديو مرجعية و3 ملفات صوت مرجعية. يتحكم duration فقط في طول الإخراج الناتج، ولا يعرّف حدًا منفصلًا لمدة فيديو المرجع المُدخل.
response = requests.post(f"{BASE}/videos/generations",
    headers=headers,
    json={
        "model": "veo3.1",
        "prompt": "Keep the same subject identity and palette while adding subtle motion.",
        "operation": "reference-to-video",
        "reference_images": [
            "https://example.com/ref-a.jpg",
            "https://example.com/ref-b.jpg"
        ],
        "duration": 8,
        "resolution": "720p",
        "aspect_ratio": "9:16"
    }
)

إطار بداية/نهاية إلى فيديو

response = requests.post(f"{BASE}/videos/generations",
    headers=headers,
    json={
        "model": "viduq2-pro",
        "prompt": "Smooth transition from day to night.",
        "operation": "start-end-to-video",
        "start_image": "https://example.com/city-day.jpg",
        "end_image": "https://example.com/city-night.jpg",
        "duration": 5,
        "resolution": "720p",
        "aspect_ratio": "16:9"
    }
)

فيديو إلى فيديو

response = requests.post(f"{BASE}/videos/generations",
    headers=headers,
    json={
        "model": "topaz-video-upscale",
        "operation": "video-to-video",
        "video_url": "https://example.com/source.mp4",
        "prompt": "Upscale this clip while preserving the original motion."
    }
)

motion-control

response = requests.post(f"{BASE}/videos/generations",
    headers=headers,
    json={
        "model": "kling-3.0-motion-control",
        "operation": "motion-control",
        "prompt": "Keep the subject stable while following the motion reference.",
        "image_url": "https://example.com/subject.png",
        "video_url": "https://example.com/motion.mp4",
        "resolution": "720p"
    }
)

مرجع المعلمات

المعاملالنوعملاحظة
operationstringيُفضَّل إرساله بشكل صريح في الإنتاج
image_urlstringأكثر أشكال إدخال الصور استقرارًا
imagestringرابط data: مفيد للاختبارات المحلية والتكاملات الصغيرة
reference_imagesstring[]الحقل العام القياسي للتكييف بالصور المرجعية
reference_image_typestringمحدد اختياري بين asset و style
video_urlstringمطلوب لنماذج video-to-video و motion-control العامة الحالية
audio_urlstringيُستخدم في تدفقات الصوت إلى فيديو الخاصة ببعض النماذج عند توفرها
output_audiobooleanتعامل عائلة Veo 3 الحقل المحذوف كأنه true. يقبل kling-3.0-video هذا المحدد للتحكم upstream sound، ويكون صامتًا افتراضيًا عند حذفه.

دليل سريع لاختيار النموذج

أعلى جودة

إذا كانت الجودة أهم من السرعة، فالنماذج veo3.1-pro و kling-video-o1-pro و viduq3-pro خيارات قوية.

تكرار سريع

للتجارب السريعة، ابدأ مع veo3.1-fast أو hailuo-2.3-fast أو viduq3-turbo.

تدفقات تعتمد على المرجع

إذا كنت تحتاج إلى تحكم مخصص بالصور المرجعية، فابدأ مع veo3.1 أو veo3.1-fast أو wan-2.6 أو kling-video-o1-pro / std.

video-to-video

المسارات العامة الأكثر شيوعًا حاليًا لعمليات video-to-video تعتمد خصوصًا على topaz-video-upscale و grok-imagine-upscale و kling-video-o1-pro / std.

الفوترة

تعتمد الفوترة على النموذج. بعض نماذج الفيديو العامة تتصرف فعليًا كنماذج تُسعَّر لكل طلب، بينما يقترب بعضها الآخر من التسعير لكل ثانية. وللاطلاع على سطح الأسعار العام الحالي، راجع صفحة النماذج أو واجهة Pricing API.