Documentation Index
Fetch the complete documentation index at: https://docs.tokenlab.sh/llms.txt
Use this file to discover all available pages before exploring further.
Übersicht
TokenLab stellt mehrere API-Formate bereit, sodass gängige Coding-Tools, SDKs und Frameworks sich mit minimalem Glue-Code integrieren können. Diese Seite ist bewusst enger gefasst als eine Marketing-Matrix:- Unterstützt bedeutet, dass wir einen konkreten Einrichtungsweg dokumentieren und TokenLab die von diesem Weg erwartete Protokollform bereitstellt.
- Starker nativer Pfad bedeutet, dass das Repository zusätzlich direkte Adapter- oder Anfrageformat-Nachweise für diese Protokollfamilie enthält.
- Best-Effort bedeutet, dass die Integration funktionieren kann, der Upstream-Client diesen benutzerdefinierten Gateway-Workflow jedoch nicht als stabilen Vertrag behandelt.
Nicht unterstützte Felder werden nicht einheitlich gehandhabt. Bei Kompatibilitätsrouten werden einige Felder ignoriert oder normalisiert. Bei
/v1/responses können nicht unterstützte Felder explizit 400- oder 503-Fehler zurückgeben, wenn diese Route das angeforderte Verhalten nicht garantieren kann.Unterstützte API-Formate
| Endpunkt | Format | Anwendungsfall |
|---|---|---|
/v1/chat/completions | OpenAI Chat | Universelle Kompatibilität |
/v1/responses | OpenAI Responses | Zustandsbehaftete Konversationen |
/v1/messages | Anthropic Messages | Claude-native Funktionen |
/v1beta/models/:model:generateContent | Google Gemini | Gemini-native Funktionen |
IDE- & CLI-Kompatibilität
Dokumentierte Tool-Pfade
| Tool | Unterstützungsstufe | Format | Anmerkungen |
|---|---|---|---|
| Cursor | Unterstützt mit Einschränkungen | OpenAI-kompatibel | Funktioniert für BYOK-Standard-Chat-/Editor-Flows, nicht als Ersatz für von Cursor verwaltete Funktionen wie Tab Completion |
| Claude Code CLI | Starker nativer Pfad | Anthropic | Native /v1/messages-Route mit Adapter-Unterstützung für thinking und tool_choice |
| Codex CLI | Unterstützt mit Modell-/Pfad-Einschränkungen | OpenAI Responses | Behandle /v1/responses als erweiterten Pfad für Codex-spezifische Workflows; einige Responses-exklusive Felder werden nicht für jedes Modell und jeden gerouteten Pfad garantiert |
| Gemini CLI | Best-Effort / experimentell | Gemini | Der benutzerdefinierte TokenLab-Base-URL-Flow ist kein stabiler Upstream-Vertrag |
| OpenCode | Unterstützt | OpenAI-kompatibel | Verwenden Sie standardmäßig einen OpenAI-kompatiblen Provider; wechseln Sie zu einem Responses-basierten Provider nur, wenn Sie ihn explizit benötigen |
Andere OpenAI-kompatible Editoren und Agent-Tools funktionieren oft mit demselben Base-URL-Muster, dieses Repo pflegt jedoch derzeit keine toolspezifische Regressionsabdeckung für Windsurf, Aider, Continue.dev, Cline/Roo Code, GitHub Copilot und ähnliche Clients.
Konfigurationsbeispiele
- Cursor
- Claude Code
- OpenCode
- Aider
- OpenAI-Format:
{ type: "function", function: { name, parameters } } - Anthropic format:
{ name, input_schema }(kein type-Feld)
SDK-Kompatibilität
Dokumentierte SDK- & Framework-Pfade
| SDK / Framework | Sprache | Unterstützungsstufe | Anmerkungen |
|---|---|---|---|
| OpenAI SDK | Python/JS/Go | Unterstützte Kernpfade | Chat Completions und Embeddings sind der standardmäßig dokumentierte Pfad; einige Responses-exklusive Felder werden nicht für jedes Modell und jeden gerouteten Pfad garantiert |
| Anthropic SDK | Python/JS | Starker nativer Pfad | Native Messages-Route mit direktem Nachweis für Tools, thinking und Prompt-Caching |
| Vercel AI SDK | TypeScript | Empfohlenes Integrationsmuster | Bevorzugen Sie @ai-sdk/openai-compatible; verwenden Sie @ai-sdk/openai nur, wenn Sie explizit Responses-natives Verhalten wünschen |
| LangChain | Python/JS | Unterstützte Standard-Oberflächen | ChatOpenAI und OpenAIEmbeddings sind der beabsichtigte Umfang; anbieter-native Extras sind nicht abgedeckt |
| LlamaIndex | Python | Unterstützt über OpenAILike | Verwenden Sie OpenAILike, nicht die eingebauten OpenAI-Klassen, für Drittanbieter-Gateways wie TokenLab |
| Dify | - | Unterstützt mit Scope-Einschränkungen | OpenAI-Provider- und chat-completions-orientierte Flows sind der beabsichtigte Pfad; nicht geeignet für Codex-spezifische Responses- oder WebSocket-Verhalten |
Chat Completions-Parameter
Kernparameter
| Parameter | Typ | Beschreibung |
|---|---|---|
model | string | Modellbezeichner (erforderlich) |
messages | array | Konversationsnachrichten (erforderlich) |
max_tokens | integer | Maximale Ausgabetoken |
temperature | number | Sampling-Temperatur (0-2) |
top_p | number | Nucleus-Sampling (0-1) |
stream | boolean | Streaming aktivieren |
Tool-Aufruf
Optionen für die Tool-Auswahl
| Format | Beispiel | Beschreibung |
|---|---|---|
| String | "auto", "none", "required" | Einfache Auswahl |
| OpenAI Object | { "type": "function", "function": { "name": "fn" } } | Erzwinge eine bestimmte Funktion |
| Anthropic Object | { "type": "tool", "name": "fn", "disable_parallel_tool_use": true } | Anthropic-natives Format |
Erweiterte Parameter
| Parameter | Typ | Beschreibung |
|---|---|---|
stream_options | object | { include_usage: true } für Token-Zählungen |
reasoning_effort | string | "low", "medium", "high" für reasoning-aktivierte GPT-5-Modelle |
service_tier | string | "auto" oder "default" |
seed | integer | Deterministische Ausgaben |
logprobs | boolean | Log-Wahrscheinlichkeiten zurückgeben |
top_logprobs | integer | Anzahl der Top-Logprobs (0-20) |
logit_bias | object | Token-Bias-Mapping (-100 bis 100) |
frequency_penalty | number | Wiederholungsstrafe (-2 bis 2) |
presence_penalty | number | Themenstrafe (-2 bis 2) |
stop | string/array | Stop-Sequenzen |
n | integer | Anzahl der Vervollständigungen (1-128) |
user | string | Benutzerkennung für Tracking |
OpenAI-Erweiterte Funktionen
| Parameter | Typ | Beschreibung |
|---|---|---|
modalities | array | ["text", "audio"] für multimodale Ausgaben |
audio | object | Audioausgabe-Konfiguration (voice, format) |
prediction | object | Vorgeschätzte Ausgabe für schnellere Vervollständigung |
metadata | object | Schlüssel-Wert-Paare zur Nachverfolgung |
store | boolean | Speichern zur späteren Abfrage |
Provider-spezifische Optionen
Anthropic Messages-Parameter
Kernparameter
| Parameter | Typ | Beschreibung |
|---|---|---|
model | string | Modellbezeichner |
messages | array | Konversationsnachrichten |
max_tokens | integer | Maximale Ausgabe (bis zu 128000) |
system | string/array | System-Prompt |
stream | boolean | Streaming aktivieren |
Tool-Aufruf
Erweitertes Denken
Responses-API-Parameter
Kernparameter
| Parameter | Typ | Beschreibung |
|---|---|---|
model | string | Modellbezeichner |
input | string/array | Eingabebereich |
instructions | string | Systemanweisungen |
max_output_tokens | integer | Maximale Ausgabetoken |
previous_response_id | string | Konversation fortsetzen |
Erweiterte Parameter
| Parameter | Typ | Beschreibung |
|---|---|---|
truncation_strategy | string | "auto" oder "disabled" |
include | array | ["reasoning.encrypted_content"] |
reasoning_effort | string | Für Reasoning-Modelle |
service_tier | string | Prioritätsstufe |
Tool-Format
Unterstützt sowohl OpenAI- als auch Anthropic-Tool-Formate:Gemini-API-Parameter
Kernparameter
| Parameter | Typ | Beschreibung |
|---|---|---|
contents | array | Konversationsinhalte |
systemInstruction | object | System-Prompt |
generationConfig | object | Generierungseinstellungen |
Tools
Safety-Einstellungen
Zusätzliche Parameter
| Parameter | Typ | Beschreibung |
|---|---|---|
cachedContent | string | Referenz zu gecachten Inhalten |
responseMimeType | string | "text/plain" oder "application/json" |
responseSchema | object | JSON-Schema für strukturierte Ausgaben |
Streaming
Alle Endpunkte unterstützen Server-Sent Events (SSE)-Streaming:Fehlerbehandlung
TokenLab gibt OpenAI-kompatible Fehlerantworten zurück:Empfohlene Vorgehensweisen
Passthrough für unbekannte Parameter verwenden
Passthrough für unbekannte Parameter verwenden
Alle Schemata verwenden
.passthrough() – unbekannte Parameter werden an Upstream-Provider weitergereicht.Bevorzugen Sie stream_options für genaue Abrechnung
Bevorzugen Sie stream_options für genaue Abrechnung
Aktivieren Sie
stream_options.include_usage für genaue Token-Anzahlen in Streaming-Antworten.Verwenden Sie das passende tool_choice-Format
Verwenden Sie das passende tool_choice-Format
Passen Sie das Format an das von Ihrem SDK erwartete Format an. TokenLab akzeptiert sowohl OpenAI- als auch Anthropic-Formate.