Abrechnung & Preise

Übersicht

TokenLab nutzt ein Pay-as-you-go-Preismodell. Sie zahlen nur für das, was Sie tatsächlich nutzen, ohne Abonnements oder Mindestverpflichtungen.

So funktioniert die Abrechnung

Guthaben hinzufügen zu Ihrem Konto
Die API nutzen – Kosten werden pro Anfrage abgezogen
Nutzung überwachen in Ihrem Dashboard
Aufladen, wenn Ihr Guthaben niedrig ist

Preismodelle

Live-Preise können sich mit Providern, Routen und Modellverträgen ändern. Maßgeblich sind Dashboard, Modellseite, GET /v1/models/:model/pricing und die Pricing API.

Tokenbasierte Preise

Die meisten Chat-, Reasoning-, Embedding-, Rerank- und einige Bildmodelle werden nach Input-, Output-, Cache- oder Bild-Output-Tokens abgerechnet.

Preisfamilie	Beispiele	Aktuellen Preis prüfen
Chat / Responses	`gpt-5.4`, `claude-sonnet-4-6`, `gemini-3.5-flash`	模型页或 Pricing API
嵌入 / rerank	`text-embedding-3-small`, `qwen3-vl-rerank`	模型价格详情
按 token 计费的图像	`gpt-image-2`	`GET /v1/models/gpt-image-2/pricing`

Kopieren Sie keine statischen Preistabellen in Produktionslogik. Speichern Sie im Code nur Modell-IDs und prüfen Sie Preise vor dem Launch.

Request- und Task-Preise

Bild-, Video-, Musik-, 3D-, Audio- und World-Generierungsmodelle können pro Anfrage, Bild, Sekunde/Minute, Task oder providerspezifischer Nutzung abgerechnet werden.

Familie	Beispiele
图像	`flux-pro`, `qwen-image-plus`
视频	`veo3.1`, `seedance-2.0`
音乐	`suno-music`
3D	`tripo-h3.1`
音频	`tts-1`, `whisper-1`

Abrechnung für asynchrone Aufgaben (Video/Musik/3D und einige Bildmodelle)

Bei aufgabenbasierter Generierung kann beim Erstellen der Aufgabe ein geschätzter Betrag reserviert oder vorab abgezogen werden. Die endgültige Abrechnung erfolgt erst, nachdem die asynchrone Aufgabe beim Polling oder bei der Finalisierung einen erfolgreichen Endstatus erreicht hat.

Für aufgabenbasierte Generierungsabläufe (Video, Musik, 3D und einige Bildmodelle):

Übermitteln Sie die Aufgabe. TokenLab kann einen geschätzten Betrag vorab abziehen oder reservieren, um Guthaben und API-Key-Ausgabenlimits zu prüfen.
Fragen Sie die zurückgegebene poll_url ab oder rufen Sie GET /v1/tasks/{id} auf, bis die Aufgabe einen Endstatus erreicht.
Wenn die Aufgabe erfolgreich abgeschlossen ist, zeichnet die endgültige Abrechnung die Nutzung auf und die Task-Antwort enthält billing_transaction_id.
Wenn die Erstellung fehlschlägt oder der Endstatus failed ist, wird der ausstehende Betrag erstattet oder freigegeben und die Anfrage als nicht abrechenbar markiert.

Wenn im dashboard nach sichtbarem Endstatus keine Abrechnung oder Erstattung erscheint, wenden Sie sich bitte an support@tokenlab.sh.

# Beispiel: Abrechnung der Videogenerierung
response = client.post("/v1/videos/generations", json={
    "model": "veo3.1",
    "prompt": "A sunset over the ocean"
})
# Der geschätzte Betrag kann jetzt reserviert werden; die endgültige Abrechnung erscheint nach Erfolg.

poll_url = response.json()["poll_url"]
task_id = response.json()["task_id"]
# poll_url für Status abfragen; billing_transaction_id erscheint nach der Abrechnung.

Billing-Transaktions-IDs

Erfolgreiche abrechenbare, nicht-streamende OpenAI-kompatible JSON-Antworten enthalten billing_transaction_id, wenn die Abrechnung vor dem Abschluss der Antwort beendet wurde. Derselbe Wert wird auch als X-Billing-Transaction-ID-Antwortheader ausgegeben, damit Browser- und Serverintegrationen ihn lesen können. Native Kompatibilitätsrouten wie Gemini /v1beta können den Wert nur per Header ausgeben, um die provider-native Antwortform beizubehalten. Für asynchrone Medienaufgaben sollten Sie die zurückgegebene poll_url oder GET /v1/tasks/{id} abfragen; die Task-Antwort enthält billing_transaction_id, sobald die Abrechnung abgeschlossen ist. Streaming-Antworten können erst nach dem Versand des Streams abgerechnet werden. Wenn der Header fehlt, verwenden Sie die Dashboard-Nutzungslogs für den Abgleich.

Token-Zählung

Token sind die Grundeinheiten der Textverarbeitung:

~4 Zeichen = 1 Token (Englisch)
~1-2 Zeichen = 1 Token (Chinesisch)
1 Bild = variiert je nach Größe und Detailgrad

Token-Schätzung

# Grobe Schätzung
def estimate_tokens(text):
    return len(text) / 4  # Ungefähr für Englisch

# Tatsächliche Anzahl (für OpenAI-Modelle)
import tiktoken
encoder = tiktoken.encoding_for_model("gpt-4o")
tokens = encoder.encode("Your text here")
print(f"Token-Anzahl: {len(tokens)}")

Nutzungsverfolgung

Dashboard

Überwachen Sie Ihre Nutzung im Dashboard:

Echtzeit-Guthaben
Nutzungshistorie nach Modell
Kostenaufschlüsselung
API-Key-Nutzung

API-Antwort

Jede Antwort enthält Informationen zur Nutzung:

{
  "usage": {
    "prompt_tokens": 50,
    "completion_tokens": 100,
    "total_tokens": 150
  }
}

Kostenoptimierung

Geeignete Modelle verwenden

Verwenden Sie kleinere Modelle (GPT-4o-mini, Gemini Flash) für einfache Aufgaben.

Caching implementieren

Speichern Sie Antworten für wiederholte identische Anfragen im Cache.

Prompts optimieren

Halten Sie Prompts prägnant und wahren Sie gleichzeitig die Klarheit.

max_tokens festlegen

Begrenzen Sie die Antwortlänge, wenn keine vollständigen Antworten benötigt werden.

Streaming für lange Antworten nutzen

Streaming verursacht keine zusätzlichen Kosten, verbessert aber die wahrgenommene Leistung.

Benachrichtigungen bei niedrigem Guthaben

Konfigurieren Sie Warnmeldungen, wenn Ihr Guthaben sinkt:

Gehen Sie zu Dashboard → Einstellungen → Benachrichtigungen
Legen Sie Ihren Schwellenwert fest
Erhalten Sie E-Mail-Benachrichtigungen

Guthaben hinzufügen

Zahlungsmethoden

Stripe (Visa, Mastercard)

Schritte

Melden Sie sich im Dashboard an
Klicken Sie auf Guthaben hinzufügen
Wählen Sie Betrag und Zahlungsmethode aus
Schließen Sie die Zahlung ab

Das Guthaben wird sofort nach der Zahlungsbestätigung gutgeschrieben.

API-Key-Limits

Sie können Ausgabenlimits für einzelne API-Keys festlegen:

Gehen Sie zu Dashboard → API-Keys
Klicken Sie auf einen Key zum Bearbeiten
Legen Sie ein Nutzunglimit fest

Wenn das Limit erreicht ist, geben Anfragen mit diesem Key den Fehler 402 Payment Required zurück.

Rechnungen

Für Geschäftskonten sind Rechnungen verfügbar:

Gehen Sie zu Dashboard → Abrechnung
Transaktionsverlauf anzeigen
Rechnungen als PDF herunterladen

Fragen?

Kontaktieren Sie support@tokenlab.sh bei Fragen zur Abrechnung.

​Übersicht

​So funktioniert die Abrechnung

​Preismodelle

​Tokenbasierte Preise

​Request- und Task-Preise

​Abrechnung für asynchrone Aufgaben (Video/Musik/3D und einige Bildmodelle)

​Billing-Transaktions-IDs

​Token-Zählung

​Token-Schätzung

​Nutzungsverfolgung

​Dashboard

​API-Antwort

​Kostenoptimierung

​Benachrichtigungen bei niedrigem Guthaben

​Guthaben hinzufügen

​Zahlungsmethoden

​Schritte

​API-Key-Limits

​Rechnungen

​Fragen?

Übersicht

So funktioniert die Abrechnung

Preismodelle

Tokenbasierte Preise

Request- und Task-Preise

Abrechnung für asynchrone Aufgaben (Video/Musik/3D und einige Bildmodelle)

Billing-Transaktions-IDs

Token-Zählung

Token-Schätzung

Nutzungsverfolgung

Dashboard

API-Antwort

Kostenoptimierung

Benachrichtigungen bei niedrigem Guthaben

Guthaben hinzufügen

Zahlungsmethoden

Schritte

API-Key-Limits

Rechnungen

Fragen?