計費與定價 - TokenLab

概覽

TokenLab 採用 按量計費 (pay-as-you-go)。您只需為實際使用的部分付費，無需訂閱或最低消費承諾。

計費運作方式

儲值點數 到您的帳戶
使用 API - 費用將按請求扣除
監控用量 在您的控制面板中
餘額不足時儲值

定價模式

即時價格會隨供應商、路由和模型詳情變化。請以 Dashboard、模型頁、GET /v1/models/:model/pricing 和 Pricing API 為準。

按 Token 計費

多數聊天、推理、嵌入、rerank 以及部分圖像模型按輸入、輸出、快取或圖像輸出 token 計費。

計費類型	範例	如何確認目前價格
Chat / Responses	`gpt-5.4`, `claude-sonnet-4-6`, `gemini-3.5-flash`	模型页或 Pricing API
嵌入 / rerank	`text-embedding-3-small`, `qwen3-vl-rerank`	模型价格详情
按 token 计费的图像	`gpt-image-2`	`GET /v1/models/gpt-image-2/pricing`

不要把靜態價格表複製進生產邏輯。程式碼裡只保存模型 ID，上線前再拉取或複核目前價格。

按請求和任務計費

圖像、影片、音樂、3D、音訊和 world 生成模型可能按請求、圖片、秒/分鐘、任務或供應商特定用量計費。生產使用前請檢查所選模型詳情。

家族	範例
图像	`flux-pro`, `qwen-image-plus`
视频	`veo3.1`, `seedance-2.0`
音乐	`suno-music`
3D	`tripo-h3.1`
音频	`tts-1`, `whisper-1`

非同步任務計費 (影片/音樂/3D 及部分圖像模型)

對於基於任務的生成，建立任務時可能會預留或預扣預估費用。最終結算只會在非同步任務透過輪詢或終態處理進入成功終態後完成。

對於基於任務的生成流程（影片、音樂、3D 和部分圖像模型）：

提交任務。TokenLab 可能會先做預估預扣或餘額預留，用於檢查餘額與 API Key 消費限制。
按返回的 poll_url 輪詢，或呼叫 GET /v1/tasks/{id}，直到任務進入終態。
任務成功完成時，系統完成最終結算並記錄用量，任務回應會包含 billing_transaction_id。
如果建立失敗或終態為失敗，待處理的預扣金額會退款或釋放，並將該請求標記為非計費。

如果任務已經進入終態，但 dashboard 中沒有看到對應結算或退款，請聯繫 support@tokenlab.sh 尋求協助。

# 示例：影片生成計費
response = client.post("/v1/videos/generations", json={
    "model": "veo3.1",
    "prompt": "A sunset over the ocean"
})
# 現在可能會預留預估費用；最終帳單會在任務成功後出現。

poll_url = response.json()["poll_url"]
task_id = response.json()["task_id"]
# 輪詢 poll_url 查看狀態；結算後會出現 billing_transaction_id。

帳單交易 ID

已完成結算的 OpenAI 相容非串流 JSON 回應會返回 billing_transaction_id。同一個值也會透過 X-Billing-Transaction-ID 回應標頭暴露，方便瀏覽器與服務端整合讀取。Gemini /v1beta 等原生相容路由為了保持 provider 原生回應形狀，可能只透過回應標頭暴露該值。對於非同步媒體任務，請輪詢建立回應返回的 poll_url 或 GET /v1/tasks/{id}；當結算完成後，任務回應會包含 billing_transaction_id。串流回應可能在內容已送出後才完成結算，因此如果回應標頭中沒有該欄位，請透過 dashboard 用量記錄進行對帳。

Token 計數

Token 是文本處理的基本單位：

約 4 個字元 = 1 token (英文)
約 1-2 個字元 = 1 token (中文)
1 張圖片 = 視尺寸和細節而定

估算 Token

# Rough estimation
def estimate_tokens(text):
    return len(text) / 4  # Approximate for English

# Actual count (for OpenAI models)
import tiktoken
encoder = tiktoken.encoding_for_model("gpt-4o")
tokens = encoder.encode("Your text here")
print(f"Token count: {len(tokens)}")

用量追蹤

控制面板

在控制面板中監控您的用量：

即時餘額
按模型的用量歷史
費用明細
API key 使用情況

API 響應

每個響應都包含用量資訊：

{
  "usage": {
    "prompt_tokens": 50,
    "completion_tokens": 100,
    "total_tokens": 150
  }
}

成本優化

使用合適的模型

對於簡單任務，使用較小的模型 (GPT-4o-mini, Gemini Flash)。

實施快取

為重複的相同請求快取響應。

優化提示詞

在保持清晰的同時，讓提示詞保持簡潔。

設置 max_tokens

當不需要完整響應時，限制響應長度。

對長響應使用串流

串流 (Streaming) 不會增加額外費用，但能提升感知效能。

餘額不足警報

配置當餘額下降時的警報：

前往 控制面板 → 設置 → 通知
設置您的閾值金額
接收電子郵件通知

儲值點數

付款方式

Stripe (Visa, Mastercard)

步驟

登入控制面板
點擊 儲值點數
選擇金額和付款方式
完成付款

點數將在付款確認後立即入帳。

API Key 限制

您可以為個別 API key 設置支出限制：

前往 控制面板 → API Keys
點擊某個 key 進行編輯
設置 用量限制

當達到限制時，使用該 key 的請求將返回 402 Payment Required。

發票

對於企業帳戶，可提供發票：

前往 控制面板 → 計費
查看交易歷史
下載 PDF 格式發票

有疑問嗎？

如有計費諮詢，請聯繫 support@tokenlab.sh。

​概覽

​計費運作方式

​定價模式

​按 Token 計費

​按請求和任務計費

​非同步任務計費 (影片/音樂/3D 及部分圖像模型)

​帳單交易 ID

​Token 計數

​估算 Token

​用量追蹤

​控制面板

​API 響應

​成本優化

​餘額不足警報

​儲值點數

​付款方式

​步驟

​API Key 限制

​發票

​有疑問嗎？

概覽

計費運作方式

定價模式

按 Token 計費

按請求和任務計費

非同步任務計費 (影片/音樂/3D 及部分圖像模型)

帳單交易 ID

Token 計數

估算 Token

用量追蹤

控制面板

API 響應

成本優化

餘額不足警報

儲值點數

付款方式

步驟

API Key 限制

發票

有疑問嗎？