Documentation Index
Fetch the complete documentation index at: https://docs.tokenlab.sh/llms.txt
Use this file to discover all available pages before exploring further.
نظرة عامة
للوكلاء البرمجيين، اكتشف أولًا القائمة القصيرة الموصى بها للصور باستخدامGET /v1/models?recommended_for=image، ثم أرسل model المختار صراحةً إلى هذه النقطة النهائية.
gpt-image-2 هو نموذج GPT Image تُحسب تكلفته حسب الـ tokens. تتبع TokenLab تفاصيل usage الرسمية من OpenAI لتسوية tokens إدخال النص، وإدخال الصور، والإدخال المخزن مؤقتًا عند الإبلاغ عنه، وtokens إخراج الصور؛ ولا يتم التعامل معه كنموذج بسعر ثابت لكل صورة.
بالنسبة إلى إنشاء الصور باستخدام gpt-image-2، تدعم الواجهة العامة المعلمات prompt وn وsize وquality وresponse_format وasync وbackground وoutput_format وoutput_compression أو compression وmoderation وpartial_images وuser. إذا لم ترسل size أو quality تستخدم TokenLab القيمة auto؛ ويجب أن تستخدم قيم size المخصصة عقد WIDTHxHEIGHT المرن الموضح أدناه.
ملاحظة توافق: إذا أرسل طلب gpt-image-2 الحقل input_fidelity، تزيله TokenLab قبل التمرير لأن GPT Image 2 يعالج مدخلات الصور تلقائيا بدقة عالية.
ملاحظات سلوك النموذج
Google Gemini في عقد اختيار واحد:gemini-3.1-flash-image-previewوgemini-3-pro-image-previewوnano-banana-2وnano-banana-proتدعمaspect_ratioمعresolution(1kو2kو4k) لتوليد الصور من النص.gemini-2.5-flash-imageوnano-bananaوnano-banana-editتدعمaspect_ratioلكنها لا تعرض اختيارًا عامًا لـresolution.gemini-2.0-flash-preview-image-generationموثّق هنا على أنه تحويل نص إلى صورة يعتمد على prompt فقط.- لطلبات الصور المرجعية مع
nano-bananaوnano-banana-2وnano-banana-pro، استخدم هذه الواجهة (/v1/images/generations) معoperation: "image-to-image"وimage_urls. لا ترسل طلبات Nano Banana المرجعية إلى/v1/images/edits. - في طلبات image-to-image الخاصة بـ Nano Banana، احذف
resolution. يتيحnano-banana-2وnano-banana-proهذا الحقل فقط لتوليد الصور من النص، ولا يتيحهnano-banana. - يمكن إرسال الصور المرجعية في هذه الواجهة عبر JSON
image_url/image_urlsأو كملف multipart باسمimage. لا تقبل/v1/images/generationsالحقولimages[]أوfile_id؛ تُستخدم مراجع/v1/filesفقط مع نماذج/v1/images/editsالتي توثقimages[].file_idصراحةً.
aspect_ratio وأرسل resolution فقط عندما يذكرها النموذج صراحةً.
نماذج صور xAI Grok Imagine (grok-imagine-image وgrok-imagine-image-quality وgrok-imagine-image-pro القديم) تدعم aspect_ratio مع resolution (1k و2k). يبقى grok-imagine-image-pro كمعرّف توافق ويتم توجيهه upstream إلى grok-imagine-image-quality.
جسم الطلب
مهلة الطلبات المتزامنة: قد يعيد بعض مزودي الصور الذين يتم التوجيه إليهم الصورة النهائية inline وينتظرون اكتمال التوليد. قد تستغرق طلبات الدقة العالية أو الجودة العالية ما يقارب دقيقة أو أكثر، لذا اضبط مهلة عميل HTTP على120s على الأقل. إذا احتوت استجابة الإنشاء على status: "pending" أو task_id أو poll_url، فاتبع poll_url المُعاد بدلًا من الانتظار.
النموذج المطلوب استخدامه (مثل
gpt-image-2 أو dall-e-3 أو flux-pro أو midjourney).وصف نصي للصورة المطلوبة.
رابط HTTPS عام لصورة مرجعية في توليد image-to-image. لعائلة Nano Banana، اجعل
operation تساوي image-to-image واحذف resolution ما لم يكن النموذج يدعمها صراحةً لهذه العملية.روابط HTTPS عامة لصور مرجعية. استخدمها لصورة مرجعية واحدة أو أكثر في طلبات JSON. لا تدعم هذه الواجهة
file_id أو images[].روابط صور مرجعية إضافية خاصة بالنموذج للمزوّدين الذين يميزون بين صورة الإدخال الأساسية والصور المرجعية.
ملف صورة مرجعية multipart لتوليد image-to-image. استخدمه عندما تكون الصورة المصدر خاصة أو تتطلب ترويسات. هذا يختلف عن
file_id من /v1/files؛ هذه الواجهة لا تقبل file_id.عدد الصور المطلوب إنشاؤها (1-10، بحسب النموذج).
حجم الصورة. استخدمه لعائلات الصور بأسلوب OpenAI والنماذج الأخرى التي تقبل أحجام بكسل دقيقة.بالنسبة إلى
gpt-image-2، تقبل size القيمة auto أو WIDTHxHEIGHT. يجب أن يكون كل من البعدين من مضاعفات 16، وألا يتجاوز أطول ضلع 3840px، وألا تتجاوز نسبة الضلع الطويل إلى القصير 3:1، وأن يكون إجمالي عدد البكسلات بين 655,360 و8,294,400. لا تُعد aspect_ratio وresolution جزءًا من العقد العام الحالي في TokenLab لـ gpt-image-2.بالنسبة إلى عائلات صور Google Gemini، يتم التعامل مع size كاسم بديل للتوافق يطابق عقد aspect_ratio العام للنموذج، وresolution عند دعمه. لهذه النماذج، يُفضّل إرسال aspect_ratio مباشرةً.محدد نسبة الأبعاد بحسب النموذج.القيم الشائعة في عائلات صور Google تشمل
1:1 و 16:9 و 9:16 و 3:2 و 2:3.محدد دقة الإخراج بحسب النموذج.مدعوم في
gemini-3.1-flash-image-preview وgemini-3-pro-image-preview وnano-banana-2 وnano-banana-pro وعائلات الدقة العالية المشابهة. القيم النموذجية هي 1k و2k و4k. لا ترسل هذه المعلمة إلى عائلات صور Gemini التي تدعم النسبة فقط إلا إذا وثّقها النموذج صراحةً. لنماذج صور xAI Grok Imagine استخدم 1k أو 2k.جودة الصورة. تستخدم نماذج DALL-E القيمتين
standard أو hd؛ أما نماذج GPT Image مثل gpt-image-2 فتستخدم auto أو low أو medium أو high.تنسيق الاستجابة:
url أو b64_json. القيمة الافتراضية هي url.بالنسبة إلى مسارات gpt-image-2 على Azure Official أو القنوات المتوافقة مع Azure، لا تمرّر TokenLab الحقل response_format إلى upstream. يحصل gateway دائمًا على بيانات الصور من upstream بصيغة b64_json؛ عند طلب url يرفع كل صورة إلى CDN ويعيد data[].url. إذا لم يكن تخزين CDN متاحًا أو فشل الرفع، يفشل الطلب بدلاً من الرجوع إلى Base64. عند طلب b64_json يُعاد Base64 الخام.اضبطه على
true مع gpt-image-2 أو نماذج الصور الرسمية FLUX/BFL لإنشاء مهمة أولاً. تعيد مهام الصور غير المتزامنة المكتملة روابط URL بغض النظر عن response_format المطلوب؛ استخدم الطلبات المتزامنة إذا كنت تحتاج إلى b64_json.النمط لـ DALL-E 3:
vivid أو natural.معرّف فريد للمستخدم النهائي.
الاستجابة
الاستجابة المتزامنة (DALL-E, Flux Schnell, إلخ.)
الطابع الزمني Unix لوقت الإنشاء.
مصفوفة من الصور المُنشأة.يحتوي كل كائن على:
url(string): عنوان URL للصورة المُنشأةb64_json(string): صورة مرمّزة بـ Base64 (إذا تم طلبها)revised_prompt(string): الـ prompt المستخدم (DALL-E 3)
استجابة المهمة غير المتزامنة
اضبطasync: true مع gpt-image-2 أو نماذج الصور الرسمية FLUX/BFL لإنشاء مهمة بدلاً من انتظار الصورة النهائية داخل طلب الإنشاء. تتضمن الاستجابة status: "pending" وtask_id وpoll_url. استعلم عن /v1/tasks/{task_id} حتى تصل المهمة إلى completed أو failed.
تعيد مهام الصور غير المتزامنة روابط URL للصور النهائية فقط. إذا كنت تحتاج إلى بيانات b64_json الخام، فاستخدم طلبًا متزامنًا.
قد يتم حجز التكلفة المقدّرة عند إنشاء المهمة. تُحاسب المهام المكتملة حسب الاستخدام الفعلي، وتُحرر أو تُسترد تكلفة المهام الفاشلة أو المنتهية بالمهلة.
طابع Unix الزمني لوقت الإنشاء.
معرّف المهمة الفريد للاستطلاع.
الحالة الأولية:
pending.عنوان URL نسبي للاستطلاع للحصول على النتائج، على سبيل المثال
/v1/tasks/{id}.يبقى فارغًا أثناء كون المهمة قيد الانتظار. وتُرجِع مهام الصور المكتملة عناوين URL للصور المُولَّدة في
data[].url.status: "pending"، استخدم poll_url أو GET /v1/tasks/{task_id} لاسترداد النتيجة.
النماذج المتاحة
| النموذج | النوع | الميزات |
|---|---|---|
dall-e-3 | متزامن | أفضل جودة، تحسين الـ prompt |
dall-e-2 | متزامن | أسرع وأكثر توفيرًا |
flux-pro | غير متزامن | واقعي تصويريًا، جودة عالية |
flux-schnell | متزامن | سريع جدًا |
midjourney | غير متزامن | نمط فني |
ideogram-v3 | غير متزامن | أفضل عرض للنصوص |
stable-diffusion-3 | متزامن | مفتوح المصدر، قابل للتخصيص |
status: "pending" وتتطلب polling. راجع حالة الصورة لمعرفة كيفية استرجاع النتائج.
التعامل مع الاستجابات غير المتزامنة
بالنسبة للنماذج غير المتزامنة، تحقّق مما إذا كانت الاستجابة تحتوي علىstatus: "pending":