Documentation Index
Fetch the complete documentation index at: https://docs.tokenlab.sh/llms.txt
Use this file to discover all available pages before exploring further.
Übersicht
TokenLab nutzt ein Pay-as-you-go-Preismodell. Sie zahlen nur für das, was Sie tatsächlich nutzen, ohne Abonnements oder Mindestverpflichtungen.So funktioniert die Abrechnung
- Guthaben hinzufügen zu Ihrem Konto
- Die API nutzen – Kosten werden pro Anfrage abgezogen
- Nutzung überwachen in Ihrem Dashboard
- Aufladen, wenn Ihr Guthaben niedrig ist
Preismodelle
Preise pro Token
Die meisten Textgenerierungsmodelle werden pro Million Token abgerechnet:| Modell | Input (pro 1 Mio. Token) | Output (pro 1 Mio. Token) |
|---|---|---|
| GPT-4o | $1.75 | $7.00 |
| GPT-4o-mini | $0.105 | $0.42 |
| Claude Opus 4.5 | $3.50 | $17.50 |
| Claude Sonnet 4.5 | $2.10 | $10.50 |
| Claude Haiku 4.5 | $0.70 | $3.50 |
| Gemini 2.5 Pro | $0.875 | $7.00 |
| Gemini 2.5 Flash | $0.1225 | $0.525 |
| DeepSeek R1 | $0.385 | $1.533 |
| DeepSeek V3.2 | $0.196 | $0.294 |
Die angezeigten Preise sind ermäßigte Plattformpreise. Die tatsächlichen Preise können variieren. Aktuelle Tarife finden Sie auf der Preisseite.
Preise pro Anfrage
Bild-, Video- und Audiomodelle werden pro Anfrage abgerechnet:| Modell | Preis pro Anfrage |
|---|---|
| DALL-E 3 (1024x1024) | $0.04 |
| Midjourney | $0.05 |
| Sora Video (5s) | $0.20 |
| Whisper (pro Minute) | $0.006 |
| TTS-1 | $0.015 |
Abrechnung für asynchrone Aufgaben (Video/Musik/3D und einige Bildmodelle)
Bei aufgabenbasierter Generierung kann beim Erstellen der Aufgabe ein geschätzter Betrag reserviert oder vorab abgezogen werden. Die endgültige Abrechnung erfolgt erst, nachdem die asynchrone Aufgabe beim Polling oder bei der Finalisierung einen erfolgreichen Endstatus erreicht hat.
- Übermitteln Sie die Aufgabe. TokenLab kann einen geschätzten Betrag vorab abziehen oder reservieren, um Guthaben und API-Key-Ausgabenlimits zu prüfen.
- Fragen Sie die zurückgegebene
poll_urlab oder rufen SieGET /v1/tasks/{id}auf, bis die Aufgabe einen Endstatus erreicht. - Wenn die Aufgabe erfolgreich abgeschlossen ist, zeichnet die endgültige Abrechnung die Nutzung auf und die Task-Antwort enthält
billing_transaction_id. - Wenn die Erstellung fehlschlägt oder der Endstatus failed ist, wird der ausstehende Betrag erstattet oder freigegeben und die Anfrage als nicht abrechenbar markiert.
Billing-Transaktions-IDs
Erfolgreiche abrechenbare, nicht-streamende OpenAI-kompatible JSON-Antworten enthaltenbilling_transaction_id, wenn die Abrechnung vor dem Abschluss der Antwort beendet wurde. Derselbe Wert wird auch als X-Billing-Transaction-ID-Antwortheader ausgegeben, damit Browser- und Serverintegrationen ihn lesen können. Native Kompatibilitätsrouten wie Gemini /v1beta können den Wert nur per Header ausgeben, um die provider-native Antwortform beizubehalten. Für asynchrone Medienaufgaben sollten Sie die zurückgegebene poll_url oder GET /v1/tasks/{id} abfragen; die Task-Antwort enthält billing_transaction_id, sobald die Abrechnung abgeschlossen ist. Streaming-Antworten können erst nach dem Versand des Streams abgerechnet werden. Wenn der Header fehlt, verwenden Sie die Dashboard-Nutzungslogs für den Abgleich.
Token-Zählung
Token sind die Grundeinheiten der Textverarbeitung:- ~4 Zeichen = 1 Token (Englisch)
- ~1-2 Zeichen = 1 Token (Chinesisch)
- 1 Bild = variiert je nach Größe und Detailgrad
Token-Schätzung
Nutzungsverfolgung
Dashboard
Überwachen Sie Ihre Nutzung im Dashboard:- Echtzeit-Guthaben
- Nutzungshistorie nach Modell
- Kostenaufschlüsselung
- API-Key-Nutzung
API-Antwort
Jede Antwort enthält Informationen zur Nutzung:Kostenoptimierung
Geeignete Modelle verwenden
Geeignete Modelle verwenden
Verwenden Sie kleinere Modelle (GPT-4o-mini, Gemini Flash) für einfache Aufgaben.
Caching implementieren
Caching implementieren
Speichern Sie Antworten für wiederholte identische Anfragen im Cache.
Prompts optimieren
Prompts optimieren
Halten Sie Prompts prägnant und wahren Sie gleichzeitig die Klarheit.
max_tokens festlegen
max_tokens festlegen
Begrenzen Sie die Antwortlänge, wenn keine vollständigen Antworten benötigt werden.
Streaming für lange Antworten nutzen
Streaming für lange Antworten nutzen
Streaming verursacht keine zusätzlichen Kosten, verbessert aber die wahrgenommene Leistung.
Benachrichtigungen bei niedrigem Guthaben
Konfigurieren Sie Warnmeldungen, wenn Ihr Guthaben sinkt:- Gehen Sie zu Dashboard → Einstellungen → Benachrichtigungen
- Legen Sie Ihren Schwellenwert fest
- Erhalten Sie E-Mail-Benachrichtigungen
Guthaben hinzufügen
Zahlungsmethoden
- Stripe (Visa, Mastercard)
Schritte
- Melden Sie sich im Dashboard an
- Klicken Sie auf Guthaben hinzufügen
- Wählen Sie Betrag und Zahlungsmethode aus
- Schließen Sie die Zahlung ab
API-Key-Limits
Sie können Ausgabenlimits für einzelne API-Keys festlegen:- Gehen Sie zu Dashboard → API-Keys
- Klicken Sie auf einen Key zum Bearbeiten
- Legen Sie ein Nutzunglimit fest
402 Payment Required zurück.
Rechnungen
Für Geschäftskonten sind Rechnungen verfügbar:- Gehen Sie zu Dashboard → Abrechnung
- Transaktionsverlauf anzeigen
- Rechnungen als PDF herunterladen