Rate Limits - TokenLab

Überblick

TokenLab implementiert Rate Limits, um eine faire Nutzung und die Stabilität der Plattform sicherzustellen. Die Limits variieren je nach Account-Tier.

Rate-Limit-Tiers

Tier	Anfragen/Min	Beschreibung
User	1.000	Standard-Tier für alle Accounts
Partner	10.000	Für Integrationspartner
VIP	10.000	Nutzer mit hohem Volumen

Rate Limits können sich ändern. Kontaktieren Sie support@tokenlab.sh für benutzerdefinierte Limits.

Rate-Limit-Antwort

Wenn Sie das Rate Limit überschreiten, gibt die API einen 429-Statuscode mit einem Retry-After-Header zurück, der angibt, wie lange vor einem erneuten Versuch gewartet werden muss.

Rate Limit überschritten

Wenn Sie das Limit überschreiten, erhalten Sie eine 429-Antwort:

{
  "error": {
    "message": "Rate limit exceeded. Please retry later.",
    "type": "rate_limit_exceeded",
    "code": "rate_limit_exceeded"
  }
}

Die Antwort enthält einen Retry-After-Header:

Retry-After: 60  # Seconds to wait before retrying

Umgang mit Rate Limits

Exponentielles Backoff

Implementieren Sie exponentielles Backoff für automatische Wiederholungen:

import time
from openai import OpenAI, RateLimitError

client = OpenAI(
    api_key="sk-your-api-key",
    base_url="https://api.tokenlab.sh/v1"
)

def make_request_with_backoff(messages, max_retries=5):
    for attempt in range(max_retries):
        try:
            return client.chat.completions.create(
                model="gpt-4o",
                messages=messages
            )
        except RateLimitError as e:
            if attempt == max_retries - 1:
                raise

            wait_time = 2 ** attempt  # 1, 2, 4, 8, 16 seconds
            print(f"Rate limited. Waiting {wait_time}s...")
            time.sleep(wait_time)

Request-Queueing

Für Anwendungen mit hohem Volumen implementieren Sie eine Request-Queue:

import asyncio
from collections import deque

class RateLimitedClient:
    def __init__(self, requests_per_minute=1000):
        self.rpm = requests_per_minute
        self.interval = 60 / requests_per_minute
        self.last_request = 0

    async def request(self, messages):
        # Wait if needed to respect rate limit
        now = asyncio.get_event_loop().time()
        wait_time = max(0, self.last_request + self.interval - now)
        if wait_time > 0:
            await asyncio.sleep(wait_time)

        self.last_request = asyncio.get_event_loop().time()
        return await self.client.chat.completions.create(
            model="gpt-4o",
            messages=messages
        )

Batch-Verarbeitung

Für Bulk-Operationen verarbeiten Sie Daten in Batches mit Verzögerungen:

def process_batch(items, batch_size=50, delay=1):
    results = []
    for i in range(0, len(items), batch_size):
        batch = items[i:i + batch_size]
        for item in batch:
            result = client.chat.completions.create(
                model="gpt-4o",
                messages=[{"role": "user", "content": item}]
            )
            results.append(result)
        time.sleep(delay)  # Pause between batches
    return results

Bewährte Praktiken

Überwachen Sie Ihre Nutzung

Verfolgen Sie Rate-Limit-Header, um proaktiv unter den Limits zu bleiben.

Caching implementieren

Cachen Sie Antworten für identische Requests, um API-Aufrufe zu reduzieren.

Geeignete Modelle verwenden

Schnellere Modelle (wie gpt-5-mini) ermöglichen mehr Durchsatz.

Kontaktieren Sie uns für höhere Limits

Wenn Sie höhere Limits benötigen, kontaktieren Sie support@tokenlab.sh.

Ihr Tier upgraden

So beantragen Sie ein Tier-Upgrade:

Melden Sie sich in Ihrem Dashboard an
Gehen Sie zu Settings → Account
Kontaktieren Sie den Support mit Ihrem Anwendungsfall

Oder senden Sie eine E-Mail an support@tokenlab.sh mit:

Der E-Mail-Adresse Ihres Accounts
Dem erwarteten Anfragevolumen
Einer Beschreibung des Anwendungsfalls

​Überblick

​Rate-Limit-Tiers

​Rate-Limit-Antwort

​Rate Limit überschritten

​Umgang mit Rate Limits

​Exponentielles Backoff

​Request-Queueing

​Batch-Verarbeitung

​Bewährte Praktiken

​Ihr Tier upgraden

Überblick

Rate-Limit-Tiers

Rate-Limit-Antwort

Rate Limit überschritten

Umgang mit Rate Limits

Exponentielles Backoff

Request-Queueing

Batch-Verarbeitung

Bewährte Praktiken

Ihr Tier upgraden