Faturamento e Preços

Visão Geral

A TokenLab utiliza o modelo de preços pay-as-you-go. Você paga apenas pelo que usar, sem assinaturas ou compromissos mínimos.

Como Funciona o Faturamento

Adicione créditos à sua conta
Use a API - os custos são deduzidos por requisição
Monitore o uso no seu painel
Recarregue quando seu saldo estiver baixo

Modelos de Preços

Preços ao vivo podem mudar conforme provedores, rotas e détails du modèle. Use o Dashboard, a página de modelos, GET /v1/models/:model/pricing e a Pricing API como referência atual.

Preços baseados em token

A maioria dos modelos de chat, raciocínio, embedding, rerank e alguns de imagem são cobrados por tokens de entrada, saída, cache ou saída de imagem.

Família de preço	Exemplos	Verificar preço atual
Chat / Responses	`gpt-5.4`, `claude-sonnet-4-6`, `gemini-3.5-flash`	模型页或 Pricing API
嵌入 / rerank	`text-embedding-3-small`, `qwen3-vl-rerank`	模型价格详情
按 token 计费的图像	`gpt-image-2`	`GET /v1/models/gpt-image-2/pricing`

Não copie tabelas estáticas de preço para a lógica de produção. Guarde apenas IDs de modelo no código e revise preços antes do lançamento.

Preços por requisição e tarefa

Modelos de imagem, vídeo, música, 3D, áudio e world podem ser cobrados por requisição, imagem, segundo/minuto, tarefa ou uso específico do provedor.

Família	Exemplos
图像	`flux-pro`, `qwen-image-plus`
视频	`veo3.1`, `seedance-2.0`
音乐	`suno-music`
3D	`tripo-h3.1`
音频	`tts-1`, `whisper-1`

Faturamento de Tarefas Assíncronas (Vídeo/Música/3D e Alguns Modelos de Imagem)

Em geração baseada em tarefas, criar a tarefa pode reservar ou pré-deduzir o custo estimado. A liquidação final só acontece depois que a tarefa assíncrona atinge um estado terminal de sucesso durante o polling ou a finalização.

Para fluxos de geração baseados em tarefas (vídeo, música, 3D e alguns modelos de imagem):

Envie a tarefa. A TokenLab pode aplicar uma pré-dedução ou reserva estimada para verificar saldo e limites de gasto da API Key.
Consulte a poll_url retornada, ou chame GET /v1/tasks/{id}, até que a tarefa alcance um estado terminal.
Quando a tarefa é concluída com sucesso, a liquidação final registra o uso e a resposta da tarefa inclui billing_transaction_id.
Se a criação falhar ou o estado terminal for failed, o valor pendente é reembolsado ou liberado e a solicitação é marcada como não faturável.

Se o dashboard não refletir a liquidação ou o reembolso depois que o estado terminal estiver visível, entre em contato com support@tokenlab.sh.

# Exemplo: Faturamento de geração de vídeo
response = client.post("/v1/videos/generations", json={
    "model": "veo3.1",
    "prompt": "A sunset over the ocean"
})
# O custo estimado pode ser reservado agora; a cobrança final aparece após sucesso.

poll_url = response.json()["poll_url"]
task_id = response.json()["task_id"]
# Consulte poll_url para verificar o status; billing_transaction_id aparece após a liquidação.

IDs de transação de faturamento

Respostas JSON faturáveis, não streaming e compatíveis com OpenAI incluem billing_transaction_id quando a liquidação é concluída antes de finalizar a resposta. O mesmo valor também é exposto no header X-Billing-Transaction-ID, para integrações em navegador e servidor. Rotas de compatibilidade nativa, como Gemini /v1beta, podem expor o valor apenas pelo header para preservar o formato nativo de resposta do provedor. Para tarefas de mídia assíncronas, consulte o poll_url retornado ou GET /v1/tasks/{id}; a resposta da tarefa inclui billing_transaction_id quando a liquidação termina. Respostas streaming podem ser liquidadas depois que o stream já foi enviado; se o header não estiver presente, use os logs de uso do dashboard para conciliação.

Contagem de Tokens

Tokens são as unidades básicas do processamento de texto:

~4 caracteres = 1 token (Inglês)
~1-2 caracteres = 1 token (Chinês)
1 imagem = varia conforme o tamanho e detalhes

Estimando Tokens

# Estimativa aproximada
def estimate_tokens(text):
    return len(text) / 4  # Aproximado para Inglês

# Contagem real (para modelos OpenAI)
import tiktoken
encoder = tiktoken.encoding_for_model("gpt-4o")
tokens = encoder.encode("Your text here")
print(f"Token count: {len(tokens)}")

Acompanhamento de Uso

Painel (Dashboard)

Monitore seu uso no Painel:

Saldo em tempo real
Histórico de uso por modelo
Detalhamento de custos
Uso de chaves de API

Resposta da API

Cada resposta inclui informações de uso:

{
  "usage": {
    "prompt_tokens": 50,
    "completion_tokens": 100,
    "total_tokens": 150
  }
}

Otimização de Custos

Use modelos apropriados

Use modelos menores (GPT-4o-mini, Gemini Flash) para tarefas simples.

Implemente cache

Armazene em cache as respostas para requisições idênticas repetidas.

Otimize prompts

Mantenha os prompts concisos, mantendo a clareza.

Defina max_tokens

Limite o comprimento da resposta quando respostas completas não forem necessárias.

Use streaming para respostas longas

O streaming não custa extra, mas melhora o desempenho percebido.

Alertas de Saldo Baixo

Configure alertas para quando seu saldo cair:

Vá para Painel → Configurações → Notificações
Defina o valor do seu limite
Receba notificações por e-mail

Adicionando Créditos

Métodos de Pagamento

Stripe (Visa, Mastercard)

Passos

Faça login no Painel
Clique em Adicionar Créditos
Selecione o valor e o método de pagamento
Conclua o pagamento

Os créditos são adicionados instantaneamente após a confirmação do pagamento.

Limites de Chave de API

Você pode definir limites de gastos em chaves de API individuais:

Vá para Painel → Chaves de API
Clique em uma chave para editar
Defina o Limite de Uso

Quando o limite for atingido, as requisições com essa chave retornarão 402 Payment Required.

Faturas

Para contas empresariais, as faturas estão disponíveis:

Vá para Painel → Faturamento
Visualize o histórico de transações
Baixe as faturas como PDF

Dúvidas?

Entre em contato com support@tokenlab.sh para consultas de faturamento.

​Visão Geral

​Como Funciona o Faturamento

​Modelos de Preços

​Preços baseados em token

​Preços por requisição e tarefa

​Faturamento de Tarefas Assíncronas (Vídeo/Música/3D e Alguns Modelos de Imagem)

​IDs de transação de faturamento

​Contagem de Tokens

​Estimando Tokens

​Acompanhamento de Uso

​Painel (Dashboard)

​Resposta da API

​Otimização de Custos

​Alertas de Saldo Baixo

​Adicionando Créditos

​Métodos de Pagamento

​Passos

​Limites de Chave de API

​Faturas

​Dúvidas?

Visão Geral

Como Funciona o Faturamento

Modelos de Preços

Preços baseados em token

Preços por requisição e tarefa

Faturamento de Tarefas Assíncronas (Vídeo/Música/3D e Alguns Modelos de Imagem)

IDs de transação de faturamento

Contagem de Tokens

Estimando Tokens

Acompanhamento de Uso

Painel (Dashboard)

Resposta da API

Otimização de Custos

Alertas de Saldo Baixo

Adicionando Créditos

Métodos de Pagamento

Passos

Limites de Chave de API

Faturas

Dúvidas?