Documentation Index
Fetch the complete documentation index at: https://docs.tokenlab.sh/llms.txt
Use this file to discover all available pages before exploring further.
Visão Geral
TokenLab expõe múltiplos formatos de API para que ferramentas comuns de codificação, SDKs e frameworks possam se integrar com código auxiliar mínimo. Esta página é intencionalmente mais restrita do que uma matriz de marketing:- Suportado significa que documentamos um caminho de configuração concreto e que a TokenLab expõe o formato de protocolo que esse caminho espera.
- Caminho nativo forte significa que o repositório também possui adaptador direto ou evidência de formato de requisição para essa família de protocolos.
- Melhor esforço significa que a integração pode funcionar, mas o cliente upstream não trata esse fluxo de gateway customizado como um contrato estável.
Campos não suportados não são tratados de forma uniforme. Nas rotas de compatibilidade, alguns campos são ignorados ou normalizados. Em
/v1/responses, campos não suportados podem retornar erros explícitos 400 ou 503 quando essa rota não pode garantir o comportamento solicitado.Formatos de API Suportados
| Rota | Formato | Caso de Uso |
|---|---|---|
/v1/chat/completions | OpenAI Chat | Compatibilidade universal |
/v1/responses | OpenAI Responses | Conversas com estado |
/v1/messages | Anthropic Messages | Recursos nativos do Claude |
/v1beta/models/:model:generateContent | Google Gemini | Recursos nativos do Gemini |
Compatibilidade de IDE & CLI
Caminhos de Ferramentas Documentados
| Ferramenta | Nível de Suporte | Formato | Observações |
|---|---|---|---|
| Cursor | Suportado com limites | Compatível com OpenAI | Funciona para fluxos padrão BYOK de chat/editores, não substitui recursos gerenciados pelo Cursor como Tab Completion |
| Claude Code CLI | Caminho nativo forte | Anthropic | Rota nativa /v1/messages com cobertura de adaptador para thinking e tool_choice |
| Codex CLI | Suportado com limites de modelo/rota | OpenAI Responses | Considere /v1/responses como um caminho avançado para fluxos específicos do Codex; alguns campos exclusivos de Responses não são garantidos em todos os modelos e rotas |
| Gemini CLI | Melhor esforço / experimental | Gemini | O fluxo com URL base personalizada da TokenLab não é um contrato estável a montante |
| OpenCode | Suportado | Compatível com OpenAI | Use um provedor compatível com OpenAI por padrão; mude para um provedor baseado em Responses somente quando precisar explicitamente |
Outros editores compatíveis com OpenAI e ferramentas de agentes frequentemente funcionam com o mesmo padrão de URL base, mas este repositório não mantém atualmente cobertura de regressão específica por ferramenta para Windsurf, Aider, Continue.dev, Cline/Roo Code, GitHub Copilot e clientes similares.
Exemplos de Configuração
- Cursor
- Claude Code
- OpenCode
- Aider
- Formato OpenAI:
{ type: "function", function: { name, parameters } } - Formato Anthropic:
{ name, input_schema }(sem o campo type)
Compatibilidade de SDK
Caminhos de SDK & Framework Documentados
| SDK / Framework | Linguagem | Nível de Suporte | Observações |
|---|---|---|---|
| OpenAI SDK | Python/JS/Go | Caminho central suportado | Chat Completions e Embeddings são o caminho padrão documentado; alguns campos exclusivos de Responses não são garantidos em todos os modelos e rotas |
| Anthropic SDK | Python/JS | Caminho nativo forte | Rota Messages nativa com evidência direta para tools, thinking e cache de prompts |
| Vercel AI SDK | TypeScript | Padrão de integração recomendado | Prefira @ai-sdk/openai-compatible; use @ai-sdk/openai somente quando desejar explicitamente comportamento nativo de Responses |
| LangChain | Python/JS | Superfícies padrão suportadas | ChatOpenAI e OpenAIEmbeddings são o escopo pretendido; extras nativos do fornecedor estão fora do escopo |
| LlamaIndex | Python | Suportado via OpenAILike | Use OpenAILike, não as classes OpenAI embutidas, para gateways de terceiros como TokenLab |
| Dify | - | Suportado com limites de escopo | O provedor OpenAI e fluxos orientados a chat-completions são o caminho pretendido; não é adequado para Responses específicos do Codex ou comportamento via WebSocket |
Parâmetros de Chat Completions
Parâmetros Básicos
| Parâmetro | Tipo | Descrição |
|---|---|---|
model | string | Identificador do modelo (obrigatório) |
messages | array | Mensagens da conversa (obrigatório) |
max_tokens | integer | Máximo de tokens de saída |
temperature | number | Temperatura de amostragem (0-2) |
top_p | number | Amostragem nucleus (0-1) |
stream | boolean | Habilitar streaming |
Chamada de Ferramenta
Opções de Escolha de Ferramenta
| Formato | Exemplo | Descrição |
|---|---|---|
| String | "auto", "none", "required" | Seleção simples |
| OpenAI Object | { "type": "function", "function": { "name": "fn" } } | Forçar função específica |
| Anthropic Object | { "type": "tool", "name": "fn", "disable_parallel_tool_use": true } | Formato nativo Anthropic |
Parâmetros Avançados
| Parâmetro | Tipo | Descrição |
|---|---|---|
stream_options | object | { include_usage: true } para contagem de tokens |
reasoning_effort | string | "low", "medium", "high" para modelos GPT-5 com raciocínio habilitado |
service_tier | string | "auto" ou "default" |
seed | integer | Saídas determinísticas |
logprobs | boolean | Retorna probabilidades logarítmicas |
top_logprobs | integer | Número de top logprobs (0-20) |
logit_bias | object | Mapa de viés por token (-100 a 100) |
frequency_penalty | number | Penalidade por repetição (-2 a 2) |
presence_penalty | number | Penalidade por tópico (-2 a 2) |
stop | string/array | Sequências de parada |
n | integer | Número de completions (1-128) |
user | string | Identificador do usuário para rastreamento |
Recursos Avançados do OpenAI
| Parâmetro | Tipo | Descrição |
|---|---|---|
modalities | array | ["text", "audio"] para multimodal |
audio | object | Configuração de saída de áudio (voz, formato) |
prediction | object | Saída prevista para conclusão mais rápida |
metadata | object | Pares chave-valor para rastreamento |
store | boolean | Armazenar para recuperação posterior |
Opções Específicas do Provedor
Parâmetros de Anthropic Messages
Parâmetros Básicos
| Parâmetro | Tipo | Descrição |
|---|---|---|
model | string | Identificador do modelo |
messages | array | Mensagens da conversa |
max_tokens | integer | Saída máxima (até 128000) |
system | string/array | Prompt do sistema |
stream | boolean | Habilitar streaming |
Chamada de Ferramenta
Pensamento Estendido
Parâmetros da API Responses
Parâmetros Básicos
| Parâmetro | Tipo | Descrição |
|---|---|---|
model | string | Identificador do modelo |
input | string/array | Conteúdo de entrada |
instructions | string | Instruções do sistema |
max_output_tokens | integer | Máximo de tokens de saída |
previous_response_id | string | Continuar a conversa |
Parâmetros Avançados
| Parâmetro | Tipo | Descrição |
|---|---|---|
truncation_strategy | string | "auto" ou "disabled" |
include | array | ["reasoning.encrypted_content"] |
reasoning_effort | string | Para modelos de raciocínio |
service_tier | string | Nível de prioridade |
Formato de Ferramenta
Suporta ambos os formatos de ferramenta OpenAI e Anthropic:Parâmetros da API Gemini
Parâmetros Básicos
| Parâmetro | Tipo | Descrição |
|---|---|---|
contents | array | Conteúdo da conversa |
systemInstruction | object | Prompt do sistema |
generationConfig | object | Configurações de geração |
Ferramentas
Configurações de Segurança
Parâmetros Adicionais
| Parâmetro | Tipo | Descrição |
|---|---|---|
cachedContent | string | Referência de conteúdo em cache |
responseMimeType | string | "text/plain" ou "application/json" |
responseSchema | object | JSON schema para saída estruturada |
Streaming
Todos os endpoints suportam streaming via Server-Sent Events (SSE):Tratamento de Erros
A TokenLab retorna respostas de erro compatíveis com OpenAI:Melhores Práticas
Use passthrough para parâmetros desconhecidos
Use passthrough para parâmetros desconhecidos
Todos os schemas usam
.passthrough() - parâmetros desconhecidos são encaminhados para provedores upstream.Prefira stream_options para cobrança precisa
Prefira stream_options para cobrança precisa
Habilite
stream_options.include_usage para contagens de tokens precisas em respostas com streaming.Use o formato apropriado de tool_choice
Use o formato apropriado de tool_choice
Combine com o formato esperado pelo seu SDK. A TokenLab aceita ambos os formatos OpenAI e Anthropic.