Mapeamento de Rotas
| Carga de trabalho existente | URL base do TokenLab | Endpoint principal | Nota de migração |
|---|---|---|---|
| OpenAI Chat Completions | https://api.tokenlab.sh/v1 | /chat/completions | Menor mudança para chat compatível com OpenAI e chamadas de função |
| OpenAI Responses | https://api.tokenlab.sh/v1 | /responses | Use quando seu aplicativo depende de entrada, ferramentas ou manipulação de saída específicas de Responses |
| Anthropic SDK | https://api.tokenlab.sh | /v1/messages | Não acrescente /v1 à URL base do SDK |
| Gemini REST | https://api.tokenlab.sh | /v1beta/models/:model:generateContent | Mantenha campos nativos da Gemini na rota da Gemini |
| Geração de mídia | https://api.tokenlab.sh/v1 | /images, /videos, /music, /3d | Descubra modelos com recommended_for e espere polling assíncrono onde documentado |
| Gestão e faturamento | https://api.tokenlab.sh/v1 | /management/... | Use tokens de gestão para uso do lado do servidor e reconciliação de faturamento |
Migração Compatível com OpenAI
GET /v1/models antes do tráfego de produção. Para geração de imagens, envie model explicitamente e leia o guia de imagens porque os modelos de imagem diferem mais do que os modelos de chat.
Migração da Anthropic
/v1/messages para uso de ferramentas nativas do Claude, fluxos de pensamento e semântica de mensagens da Anthropic. Não traduza campos exclusivos da Anthropic através de Chat Completions a menos que você queira intencionalmente uma mudança de comportamento compatível com OpenAI.
Migração da Gemini
/v1beta quando seu aplicativo depender do comportamento nativo da Gemini.
Migração de Mídia
- Consulte
GET /v1/models?recommended_for=image|video|music|3d. - Leia
tokenlab.public_contract_summarynas respostas da lista e otokenlab.public_contractcompleto onde disponível. - Envie um
modelexplícito, especialmente para endpoints de imagem. - Armazene
task_id,poll_url, endpoint, modelo e seu próprio ID de trabalho para trabalhos assíncronos. - Reconcile custos através de registros de uso e
billing_transaction_id, não IDs de tarefa do provedor.
Plano de Lançamento em Produção
| Fase | Objetivo | Verificações |
|---|---|---|
| 1. Inventário | Listar endpoints, modelos, campos de solicitação, comportamento de streaming/assíncrono e proprietário de faturamento | Nenhum campo oculto exclusivo do provedor é assumido como público |
| 2. Piloto de rota única | Mover um endpoint e uma família de modelos | Forma da resposta, custo e logs correspondem às expectativas |
| 3. Sombra ou amostra | Comparar saídas selecionadas com o provedor anterior | Qualidade e latência visíveis para o usuário são aceitáveis |
| 4. Lançamento gradual | Aumentar o tráfego por chave, organização ou flag de recurso | Monitorar 4xx, 5xx, latência, equilíbrio e trabalhos assíncronos duplicados |
| 5. Limpeza | Remover o caminho do provedor antigo somente após uso estável | O caminho de reversão e o playbook de suporte estão documentados |
Armadilhas de Migração
- Não coloque cada modelo atrás de um único caminho de OpenAI Chat Completions se seu aplicativo precisar de comportamento nativo da Anthropic, Gemini ou Responses.
- Não assuma os padrões antigos de imagem. Envie
modelexplicitamente. - Não tente novamente solicitações de criação assíncronas sem verificar se uma tarefa já foi criada.
- Não exponha metadados de roteamento do provedor em seus logs ou UI.
- Não compare faturamento com IDs de tarefa do provedor. Use registros de uso do TokenLab.
Referência da API
| Tópico | Referência |
|---|---|
| API Multi-Formato | API Multi-Formato |
| SDK OpenAI | SDK OpenAI |
| SDK Anthropic | SDK Anthropic |
| Nativo da Gemini | API Nativa da Gemini |
| Geração de Imagem | Geração de Imagem |
| Trabalhos Assíncronos & Polling | Trabalhos Assíncronos & Polling |