حدود المعدل

نظرة عامة

تُطبّق TokenLab حدود المعدل لضمان الاستخدام العادل واستقرار المنصة. تختلف الحدود حسب فئة الحساب.

فئات حدود المعدل

الفئة	الطلبات/دقيقة	الوصف
User	1,000	الفئة الافتراضية لجميع الحسابات
Partner	10,000	لشركاء التكامل
VIP	10,000	للمستخدمين ذوي الحجم المرتفع

حدود المعدل عرضة للتغيير. تواصل مع support@tokenlab.sh للحصول على حدود مخصصة.

استجابة حدود المعدل

عند تجاوز حد المعدل، يعيد الـ API رمز الحالة 429 مع ترويسة Retry-After التي تشير إلى المدة التي يجب انتظارها قبل إعادة المحاولة.

تم تجاوز حد المعدل

عند تجاوز الحد، ستتلقى استجابة 429:

{
  "error": {
    "message": "Rate limit exceeded. Please retry later.",
    "type": "rate_limit_exceeded",
    "code": "rate_limit_exceeded"
  }
}

تتضمن الاستجابة ترويسة Retry-After:

Retry-After: 60  # Seconds to wait before retrying

التعامل مع حدود المعدل

التراجع الأُسّي

نفّذ التراجع الأُسّي لإعادة المحاولة التلقائية:

import time
from openai import OpenAI, RateLimitError

client = OpenAI(
    api_key="sk-your-api-key",
    base_url="https://api.tokenlab.sh/v1"
)

def make_request_with_backoff(messages, max_retries=5):
    for attempt in range(max_retries):
        try:
            return client.chat.completions.create(
                model="gpt-4o",
                messages=messages
            )
        except RateLimitError as e:
            if attempt == max_retries - 1:
                raise

            wait_time = 2 ** attempt  # 1, 2, 4, 8, 16 seconds
            print(f"Rate limited. Waiting {wait_time}s...")
            time.sleep(wait_time)

وضع الطلبات في قائمة انتظار

بالنسبة للتطبيقات ذات الحجم المرتفع، نفّذ قائمة انتظار للطلبات:

import asyncio
from collections import deque

class RateLimitedClient:
    def __init__(self, requests_per_minute=1000):
        self.rpm = requests_per_minute
        self.interval = 60 / requests_per_minute
        self.last_request = 0

    async def request(self, messages):
        # Wait if needed to respect rate limit
        now = asyncio.get_event_loop().time()
        wait_time = max(0, self.last_request + self.interval - now)
        if wait_time > 0:
            await asyncio.sleep(wait_time)

        self.last_request = asyncio.get_event_loop().time()
        return await self.client.chat.completions.create(
            model="gpt-4o",
            messages=messages
        )

المعالجة على دفعات

بالنسبة للعمليات المجمعة، قم بالمعالجة على دفعات مع فواصل زمنية:

def process_batch(items, batch_size=50, delay=1):
    results = []
    for i in range(0, len(items), batch_size):
        batch = items[i:i + batch_size]
        for item in batch:
            result = client.chat.completions.create(
                model="gpt-4o",
                messages=[{"role": "user", "content": item}]
            )
            results.append(result)
        time.sleep(delay)  # Pause between batches
    return results

أفضل الممارسات

راقب استخدامك

تتبّع ترويسات حدود المعدل للبقاء ضمن الحدود بشكل استباقي.

نفّذ التخزين المؤقت

خزّن الاستجابات مؤقتًا للطلبات المتطابقة لتقليل استدعاءات API.

استخدم النماذج المناسبة

النماذج الأسرع (مثل gpt-5-mini) تتيح معدل تمرير أعلى.

تواصل معنا للحصول على حدود أعلى

إذا كنت بحاجة إلى حدود أعلى، تواصل مع support@tokenlab.sh.

ترقية فئتك

لطلب ترقية الفئة:

سجّل الدخول إلى Dashboard
انتقل إلى Settings → Account
تواصل مع الدعم موضحًا حالة الاستخدام الخاصة بك

أو أرسل بريدًا إلكترونيًا إلى support@tokenlab.sh يتضمن:

البريد الإلكتروني لحسابك
الحجم المتوقع للطلبات
وصف حالة الاستخدام

​نظرة عامة

​فئات حدود المعدل

​استجابة حدود المعدل

​تم تجاوز حد المعدل

​التعامل مع حدود المعدل

​التراجع الأُسّي

​وضع الطلبات في قائمة انتظار

​المعالجة على دفعات

​أفضل الممارسات

​ترقية فئتك

نظرة عامة

فئات حدود المعدل

استجابة حدود المعدل

تم تجاوز حد المعدل

التعامل مع حدود المعدل

التراجع الأُسّي

وضع الطلبات في قائمة انتظار

المعالجة على دفعات

أفضل الممارسات

ترقية فئتك