料金と支払い

概要

TokenLabは**従量課金制（pay-as-you-go pricing）**を採用しています。サブスクリプションや最低利用料金はなく、利用した分だけお支払いいただきます。

支払いの仕組み

アカウントにクレジットを追加します
APIを使用します - リクエストごとにコストが差し引かれます
ダッシュボードで使用状況を監視します
残高が少なくなったら**チャージ（Top up）**します

料金モデル

ライブ価格はプロバイダー、ルート、モデル詳細により変わります。Dashboard、モデルページ、GET /v1/models/:model/pricing、Pricing API を正としてください。

トークン単位の料金

多くのチャット、推論、embedding、rerank、一部の画像モデルは入力、出力、キャッシュ、画像出力 token で課金されます。

料金ファミリー	例	現在価格の確認方法
Chat / Responses	`gpt-5.4`, `claude-sonnet-4-6`, `gemini-3.5-flash`	模型页或 Pricing API
嵌入 / rerank	`text-embedding-3-small`, `qwen3-vl-rerank`	模型价格详情
按 token 计费的图像	`gpt-image-2`	`GET /v1/models/gpt-image-2/pricing`

静的な価格表を本番ロジックへコピーしないでください。コードにはモデル ID だけを置き、リリース前に現在価格を取得または確認します。

リクエストとタスクの料金

画像、動画、音楽、3D、音声、world 生成モデルは、リクエスト、画像、秒/分、タスク、またはプロバイダー固有の使用量で課金されることがあります。

ファミリー	例
图像	`flux-pro`, `qwen-image-plus`
视频	`veo3.1`, `seedance-2.0`
音乐	`suno-music`
3D	`tripo-h3.1`
音频	`tts-1`, `whisper-1`

非同期タスクの課金（ビデオ/音楽/3Dおよび一部の画像モデル）

タスクベースの生成では、タスク作成時に見積額が予約または事前控除される場合があります。最終的な課金は、ポーリングまたは最終化処理で非同期タスクが成功の終端状態になった後にのみ確定します。

タスクベースの生成フロー（ビデオ、音楽、3D、および一部の画像モデル）の場合：

タスクを送信します。TokenLab は残高と API Key の利用上限を確認するため、見積額を事前控除または予約する場合があります。
返された poll_url をポーリングするか、GET /v1/tasks/{id} を呼び出して、タスクが終端状態になるまで確認します。
タスクが正常に完了すると、最終決済が行われ、使用量が記録され、タスクレスポンスに billing_transaction_id が含まれます。
作成に失敗した場合、または終端状態が failed の場合、保留中の金額は返金または解放され、そのリクエストは非課金として記録されます。

終端状態が確認できるにもかかわらず dashboard に決済または返金が反映されない場合は、support@tokenlab.sh までお問い合わせください。

# 例: 動画生成の課金
response = client.post("/v1/videos/generations", json={
    "model": "veo3.1",
    "prompt": "A sunset over the ocean"
})
# 見積額がいま予約される場合があります。最終課金は成功後に表示されます。

poll_url = response.json()["poll_url"]
task_id = response.json()["task_id"]
# poll_url をポーリングします。決済後に billing_transaction_id が表示されます。

請求トランザクション ID

課金対象の OpenAI 互換の非ストリーミング JSON レスポンスでは、レスポンス確定前に決済が完了している場合に billing_transaction_id が含まれます。同じ値は X-Billing-Transaction-ID レスポンスヘッダーにも公開され、ブラウザやサーバー統合から参照できます。Gemini /v1beta などのネイティブ互換ルートでは、provider ネイティブのレスポンス形状を維持するため、ヘッダーのみで公開される場合があります。非同期メディアタスクでは、作成レスポンスの poll_url または GET /v1/tasks/{id} をポーリングしてください。決済完了後、タスクレスポンスに billing_transaction_id が含まれます。ストリーミングレスポンスは送信後に決済される場合があるため、ヘッダーがない場合は dashboard の利用ログで照合してください。

トークン数のカウント

トークンはテキスト処理の基本単位です：

約4文字 = 1トークン（英語）
約1〜2文字 = 1トークン（中国語）
1画像 = サイズと詳細度により異なります

トークンの見積もり

# Rough estimation
def estimate_tokens(text):
    return len(text) / 4  # Approximate for English

# Actual count (for OpenAI models)
import tiktoken
encoder = tiktoken.encoding_for_model("gpt-4o")
tokens = encoder.encode("Your text here")
print(f"Token count: {len(tokens)}")

使用状況の追跡

ダッシュボード

ダッシュボードで使用状況を監視できます：

リアルタイムの残高
モデル別の使用履歴
コストの内訳
APIキーの使用状況

APIレスポンス

各レスポンスには使用状況の情報が含まれています：

{
  "usage": {
    "prompt_tokens": 50,
    "completion_tokens": 100,
    "total_tokens": 150
  }
}

コストの最適化

適切なモデルの使用

シンプルなタスクには小規模なモデル（GPT-4o-mini, Gemini Flash）を使用します。

キャッシュの実装

繰り返される同一のリクエストに対してレスポンスをキャッシュします。

プロンプトの最適化

明確さを維持しつつ、プロンプトを簡潔に保ちます。

max_tokens の設定

完全なレスポンスが必要ない場合は、レスポンスの長さを制限します。

長いレスポンスにはストリーミングを使用

ストリーミングに追加料金はかかりませんが、体感的なパフォーマンスが向上します。

残高不足のアラート

残高が少なくなった際のアラートを設定できます：

Dashboard → Settings → Notifications に移動します
しきい値を設定します
メール通知を受け取ります

クレジットの追加

支払い方法

Stripe (Visa, Mastercard)

手順

ダッシュボードにログインします
Add Credits をクリックします
金額と支払い方法を選択します
支払いを完了します

クレジットは支払い確認後、即座に追加されます。

APIキーの制限

個別のAPIキーに使用制限を設定できます：

Dashboard → API Keys に移動します
編集するキーをクリックします
Usage Limit を設定します

制限に達すると、そのキーを使用したリクエストは 402 Payment Required を返します。

請求書

ビジネスアカウントでは請求書を利用できます：

Dashboard → Billing に移動します
取引履歴を表示します
請求書をPDFとしてダウンロードします

ご質問がある場合

請求に関するお問い合わせは support@tokenlab.sh までご連絡ください。

​概要

​支払いの仕組み

​料金モデル

​トークン単位の料金

​リクエストとタスクの料金

​非同期タスクの課金（ビデオ/音楽/3Dおよび一部の画像モデル）

​請求トランザクション ID

​トークン数のカウント

​トークンの見積もり

​使用状況の追跡

​ダッシュボード

​APIレスポンス

​コストの最適化

​残高不足のアラート

​クレジットの追加

​支払い方法

​手順

​APIキーの制限

​請求書

​ご質問がある場合

概要

支払いの仕組み

料金モデル

トークン単位の料金

リクエストとタスクの料金

非同期タスクの課金（ビデオ/音楽/3Dおよび一部の画像モデル）

請求トランザクション ID

トークン数のカウント

トークンの見積もり

使用状況の追跡

ダッシュボード

APIレスポンス

コストの最適化

残高不足のアラート

クレジットの追加

支払い方法

手順

APIキーの制限

請求書

ご質問がある場合