Cartographie des Routes
| Charge de travail existante | URL de base TokenLab | Point de terminaison principal | Remarque sur la migration |
|---|---|---|---|
| OpenAI Chat Completions | https://api.tokenlab.sh/v1 | /chat/completions | Changement le plus petit pour le chat compatible avec OpenAI et l’appel de fonction |
| OpenAI Responses | https://api.tokenlab.sh/v1 | /responses | Utilisez lorsque votre application dépend d’entrées, d’outils ou de gestion de sortie spécifiques aux Responses |
| Anthropic SDK | https://api.tokenlab.sh | /v1/messages | Ne pas ajouter /v1 à l’URL de base du SDK |
| Gemini REST | https://api.tokenlab.sh | /v1beta/models/:model:generateContent | Conservez les champs natifs de Gemini sur la route Gemini |
| Génération multimédia | https://api.tokenlab.sh/v1 | /images, /videos, /music, /3d | Découvrez les modèles avec recommended_for et attendez-vous à un polling asynchrone là où cela est documenté |
| Gestion et facturation | https://api.tokenlab.sh/v1 | /management/... | Utilisez des tokens de gestion pour un usage côté serveur et la réconciliation de facturation |
Migration Compatible avec OpenAI
GET /v1/models avant le trafic de production. Pour la génération d’images, envoyez model explicitement et lisez le guide d’image car les modèles d’image diffèrent plus que les modèles de chat.
Migration Anthropic
/v1/messages pour l’utilisation d’outils natifs à Claude, les flux de réflexion et la sémantique des messages Anthropic. Ne traduisez pas les champs uniquement Anthropic via les Chat Completions à moins que vous ne souhaitiez intentionnellement un changement de comportement compatible avec OpenAI.
Migration Gemini
/v1beta lorsque votre application dépend du comportement natif de Gemini.
Migration Multimédia
- Interrogez
GET /v1/models?recommended_for=image|video|music|3d. - Lisez
tokenlab.public_contract_summarydans les réponses de liste et letokenlab.public_contractcomplet lorsque disponible. - Envoyez un
modelexplicite, en particulier pour les points de terminaison d’image. - Stockez
task_id,poll_url, point de terminaison, modèle et votre propre ID de travail pour les travaux asynchrones. - Réconciliez les coûts via les enregistrements d’utilisation et
billing_transaction_id, pas les ID de tâche du fournisseur.
Plan de Déploiement en Production
| Phase | Objectif | Vérifications |
|---|---|---|
| 1. Inventaire | Lister les points de terminaison, modèles, champs de requête, comportement de streaming/asynchrone et propriétaire de facturation | Aucun champ caché uniquement fournisseur n’est supposé public |
| 2. Pilote à route unique | Déplacer un point de terminaison et une famille de modèles | La forme de réponse, le coût et les journaux correspondent aux attentes |
| 3. Ombre ou échantillon | Comparer les sorties sélectionnées avec le fournisseur précédent | La qualité et la latence visibles par l’utilisateur sont acceptables |
| 4. Déploiement progressif | Augmenter le trafic par clé, org ou drapeau de fonctionnalité | Surveillez 4xx, 5xx, latence, équilibre et travaux asynchrones en double |
| 5. Nettoyage | Supprimer l’ancienne route fournisseur uniquement après une utilisation stable | Le chemin de retour et le manuel de support sont documentés |
Pièges de Migration
- Ne mettez pas chaque modèle derrière un seul chemin OpenAI Chat Completions si votre application a besoin d’un comportement natif à Anthropic, Gemini ou Responses.
- Ne supposez pas les anciens défauts d’image. Envoyez
modelexplicitement. - Ne réessayez pas les requêtes de création asynchrone sans vérifier si une tâche a déjà été créée.
- Ne divulguez pas les métadonnées de routage du fournisseur dans vos journaux ou votre interface utilisateur.
- Ne comparez pas la facturation avec les ID de tâche du fournisseur. Utilisez les enregistrements d’utilisation de TokenLab.
Référence API
| Sujet | Référence |
|---|---|
| API Multi-Format | API Multi-Format |
| SDK OpenAI | SDK OpenAI |
| SDK Anthropic | SDK Anthropic |
| Gemini Native | API Gemini Native |
| Génération d’Images | Génération d’Images |
| Travaux Asynchrones & Polling | Travaux Asynchrones & Polling |