账单与定价 - TokenLab

概览

TokenLab 采用按量计费定价。您只需为您使用的部分付费，无需订阅，也没有最低消费承诺。

账单运作方式

充值余额到您的账户
使用 API - 费用将按请求扣除
在您的控制面板中监控用量
余额不足时充值

定价模式

实时价格会随供应商、路由和模型详情变化。请以 Dashboard、模型页、GET /v1/models/:model/pricing 和 Pricing API 为准。

按 Token 计费

多数聊天、推理、嵌入、rerank 以及部分图像模型按输入、输出、缓存或图像输出 token 计费。

计费类型	示例	如何确认当前价格
Chat / Responses	`gpt-5.4`, `claude-sonnet-4-6`, `gemini-3.5-flash`	模型页或 Pricing API
嵌入 / rerank	`text-embedding-3-small`, `qwen3-vl-rerank`	模型价格详情
按 token 计费的图像	`gpt-image-2`	`GET /v1/models/gpt-image-2/pricing`

不要把静态价格表复制进生产逻辑。代码里只保存模型 ID，上线前再拉取或复核当前价格。

按请求和任务计费

图像、视频、音乐、3D、音频和 world 生成模型可能按请求、图片、秒/分钟、任务或供应商特定用量计费。生产使用前请检查所选模型详情。

家族	示例
图像	`flux-pro`, `qwen-image-plus`
视频	`veo3.1`, `seedance-2.0`
音乐	`suno-music`
3D	`tripo-h3.1`
音频	`tts-1`, `whisper-1`

异步任务计费（视频/音乐/3D 及部分图像模型）

对于基于任务的生成，创建任务时可能会预留或预扣预估费用。最终结算只会在异步任务通过轮询或终态处理进入成功终态后完成。

对于基于任务的生成流程（视频、音乐、3D 和部分图像模型）：

提交任务。TokenLab 可能会先做预估预扣或余额预留，用于校验余额和 API Key 消费限制。
按返回的 poll_url 轮询，或调用 GET /v1/tasks/{id}，直到任务进入终态。
任务成功完成时，系统完成最终结算并记录用量，任务响应会包含 billing_transaction_id。
如果创建失败或终态为失败，待处理的预扣金额会退款或释放，并将该请求标记为非计费。

如果任务已经进入终态，但 dashboard 中没有看到对应结算或退款，请联系 support@tokenlab.sh 寻求帮助。

# 示例：视频生成计费
response = client.post("/v1/videos/generations", json={
    "model": "veo3.1",
    "prompt": "A sunset over the ocean"
})
# 现在可能会预留预估费用；最终账单会在任务成功后出现。

poll_url = response.json()["poll_url"]
task_id = response.json()["task_id"]
# 轮询 poll_url 查看状态；结算后会出现 billing_transaction_id。

账单交易 ID

已完成结算的 OpenAI 兼容非流式 JSON 响应会返回 billing_transaction_id。同一个值也会通过 X-Billing-Transaction-ID 响应头暴露，便于浏览器和服务端集成读取。Gemini /v1beta 等原生兼容路由为了保持 provider 原生响应形状，可能只通过响应头暴露该值。对于异步媒体任务，请轮询创建响应返回的 poll_url 或 GET /v1/tasks/{id}；当结算完成后，任务响应会包含 billing_transaction_id。流式响应可能在流已经发送完成后才结算，因此如果响应头中没有该字段，请通过 dashboard 用量日志进行对账。

Token 计数

Token 是文本处理的基本单位：

约 4 个字符 = 1 token（英文）
约 1-2 个字符 = 1 token（中文）
1 张图像 = 根据尺寸和细节而定

估算 Token

# Rough estimation
def estimate_tokens(text):
    return len(text) / 4  # Approximate for English

# Actual count (for OpenAI models)
import tiktoken
encoder = tiktoken.encoding_for_model("gpt-4o")
tokens = encoder.encode("Your text here")
print(f"Token count: {len(tokens)}")

用量追踪

控制面板

在控制面板中监控您的用量：

实时余额
按模型分类的使用历史
费用明细
API key 使用情况

API 响应

每个响应都包含用量信息：

{
  "usage": {
    "prompt_tokens": 50,
    "completion_tokens": 100,
    "total_tokens": 150
  }
}

成本优化

使用合适的模型

对于简单的任务，使用较小的模型（如 GPT-4o-mini, Gemini Flash）。

实施缓存

对重复的相同请求缓存响应结果。

优化提示词

在保持清晰的同时，尽量使提示词简洁。

设置 max_tokens

当不需要完整响应时，限制响应长度。

对长响应使用流式传输

流式传输不会增加额外费用，但能提高感知性能。

余额不足提醒

配置余额下降时的提醒：

前往 控制面板 → 设置 → 通知
设置您的阈值金额
接收电子邮件通知

充值余额

支付方式

Stripe (Visa, Mastercard)

步骤

登录控制面板
点击 充值余额
选择金额和支付方式
完成支付

确认支付后，余额将立即到账。

API Key 限制

您可以为单个 API key 设置支出限制：

前往 控制面板 → API Keys
点击某个 key 进行编辑
设置 用量限制

达到限制后，使用该 key 的请求将返回 402 Payment Required。

有疑问？

如有账单咨询，请联系 support@tokenlab.sh。

​概览

​账单运作方式

​定价模式

​按 Token 计费

​按请求和任务计费

​异步任务计费（视频/音乐/3D 及部分图像模型）

​账单交易 ID

​Token 计数

​估算 Token

​用量追踪

​控制面板

​API 响应

​成本优化

​余额不足提醒

​充值余额

​支付方式

​步骤

​API Key 限制

​有疑问？

概览

账单运作方式

定价模式

按 Token 计费

按请求和任务计费

异步任务计费（视频/音乐/3D 及部分图像模型）

账单交易 ID

Token 计数

估算 Token

用量追踪

控制面板

API 响应

成本优化

余额不足提醒

充值余额

支付方式

步骤

API Key 限制

有疑问？