Routenabbildung
| Vorhandene Arbeitslast | TokenLab Basis-URL | Primärer Endpunkt | Migrationshinweis |
|---|---|---|---|
| OpenAI Chat-Vervollständigungen | https://api.tokenlab.sh/v1 | /chat/completions | Kleinste Änderung für OpenAI-kompatible Chats und Funktionsaufrufe |
| OpenAI Antworten | https://api.tokenlab.sh/v1 | /responses | Verwenden Sie, wenn Ihre App von antwortenspezifischen Eingaben, Werkzeugen oder Ausgabeverarbeitung abhängt |
| Anthropic SDK | https://api.tokenlab.sh | /v1/messages | Fügen Sie /v1 nicht zur SDK-Basis-URL hinzu |
| Gemini REST | https://api.tokenlab.sh | /v1beta/models/:model:generateContent | Behalten Sie Gemini-native Felder auf der Gemini-Route |
| Medienproduktion | https://api.tokenlab.sh/v1 | /images, /videos, /music, /3d | Entdecken Sie Modelle mit recommended_for und erwarten Sie asynchrone Abfragen, wo dokumentiert |
| Verwaltung und Abrechnung | https://api.tokenlab.sh/v1 | /management/... | Verwenden Sie Verwaltungstoken für serverseitige Nutzung und Abrechnungsabgleich |
OpenAI-kompatible Migration
GET /v1/models vor dem Produktionsverkehr. Für die Bildgenerierung senden Sie model explizit und lesen Sie den Bildleitfaden, da sich Bildmodelle stärker von Chatmodellen unterscheiden.
Anthropic Migration
/v1/messages für Claude-native Werkzeugnutzung, Denkflüsse und Anthropic-Nachrichtensemantik. Übersetzen Sie keine Anthropic-eigenen Felder über Chat-Vervollständigungen, es sei denn, Sie möchten absichtlich eine OpenAI-kompatible Verhaltensänderung.
Gemini Migration
/v1beta bei, wenn Ihre App von Gemini-native Verhalten abhängt.
Medienmigration
- Abfrage
GET /v1/models?recommended_for=image|video|music|3d. - Lesen Sie
tokenlab.public_contract_summaryin Listenantworten und den vollständigentokenlab.public_contract, wo verfügbar. - Senden Sie ein explizites
model, insbesondere für Bildendpunkte. - Speichern Sie
task_id,poll_url, Endpunkt, Modell und Ihre eigene Job-ID für asynchrone Jobs. - Versöhnen Sie Kosten durch Nutzungsaufzeichnungen und
billing_transaction_id, nicht durch Anbieter-Task-IDs.
Produktions-Rollout-Plan
| Phase | Ziel | Überprüfungen |
|---|---|---|
| 1. Inventar | Listen Sie Endpunkte, Modelle, Anfragefelder, Streaming-/asynchrone Verhalten und Abrechnungsinhaber auf | Es werden keine versteckten Anbieterfelder als öffentlich angenommen |
| 2. Pilot mit einer Route | Bewegen Sie einen Endpunkt und eine Modellfamilie | Antwortform, Kosten und Protokolle entsprechen den Erwartungen |
| 3. Schatten oder Probe | Vergleichen Sie ausgewählte Ausgaben mit dem vorherigen Anbieter | Sichtbare Qualität und Latenz sind akzeptabel |
| 4. Allmählicher Rollout | Erhöhen Sie den Verkehr nach Schlüssel, Organisation oder Funktionsflag | Überwachen Sie 4xx, 5xx, Latenz, Balance und doppelte asynchrone Jobs |
| 5. Bereinigung | Entfernen Sie den alten Anbieterpfad erst nach stabiler Nutzung | Rollback-Pfad und Unterstützungsleitfaden sind dokumentiert |
Migrationsfallen
- Stellen Sie nicht jedes Modell hinter einen OpenAI Chat-Vervollständigungen-Pfad, wenn Ihre App natives Anthropic-, Gemini- oder Responses-Verhalten benötigt.
- Gehen Sie nicht davon aus, dass alte Bildstandards gelten. Senden Sie
modelexplizit. - Wiederholen Sie keine asynchronen Erstellungsanfragen, ohne zu überprüfen, ob bereits eine Aufgabe erstellt wurde.
- Geben Sie keine Anbieter-Routing-Metadaten in Ihren Protokollen oder Ihrer Benutzeroberfläche preis.
- Vergleichen Sie die Abrechnung nicht mit Anbieter-Task-IDs. Verwenden Sie TokenLab-Nutzungsaufzeichnungen.
API-Referenz
| Thema | Referenz |
|---|---|
| Multi-Format API | Multi-Format API |
| OpenAI SDK | OpenAI SDK |
| Anthropic SDK | Anthropic SDK |
| Gemini Native | Gemini Native API |
| Bildgenerierung | Bildgenerierung |
| Asynchrone Jobs & Abfragen | Asynchrone Jobs & Abfragen |