メインコンテンツへスキップ

Documentation Index

Fetch the complete documentation index at: https://docs.tokenlab.sh/llms.txt

Use this file to discover all available pages before exploring further.

概要

コーディング agent の場合は、まず GET /v1/models?recommended_for=image で現在推奨される画像モデルの候補を見つけ、そのうえで選んだ model をこのエンドポイントに明示的に渡してください。 gpt-image-2 は token 単位で課金される GPT Image モデルです。TokenLab は OpenAI 公式の usage 内訳に従い、テキスト入力、画像入力、報告されたキャッシュ入力、画像出力 token を精算します。固定の画像単価モデルとしては扱いません。 gpt-image-2 の画像生成でサポートされる公開パラメーターは、promptnsizequalityresponse_formatasyncbackgroundoutput_formatoutput_compression または compressionmoderationpartial_imagesuser です。size または quality を省略すると TokenLab は auto を使用します。カスタム size は下記の柔軟な WIDTHxHEIGHT 契約に従う必要があります。 互換性メモ: gpt-image-2 リクエストで input_fidelity が送信された場合、GPT Image 2 は画像入力を自動的に高忠実度で処理するため、TokenLab は上流へ転送する前にこのフィールドを削除します。

モデル動作メモ

Google Gemini の画像ファミリーは、同じセレクター契約を共有していません:
  • gemini-3.1-flash-image-previewgemini-3-pro-image-previewnano-banana-2、および nano-banana-pro は、テキストから画像の生成で aspect_ratioresolution1k2k4k)をサポートしています。
  • gemini-2.5-flash-imagenano-banana、および nano-banana-editaspect_ratio をサポートしますが、公開されている resolution の選択肢はありません。
  • gemini-2.0-flash-preview-image-generation は、ここではプロンプトのみのテキストから画像への生成として説明されています。
  • nano-banananano-banana-2nano-banana-pro の参照画像リクエストでは、このエンドポイント(/v1/images/generations)に operation: "image-to-image"image_urls を送信してください。Nano Banana の参照画像リクエストを /v1/images/edits に送信しないでください。
  • Nano Banana の image-to-image リクエストでは resolution を省略してください。nano-banana-2nano-banana-pro はテキストから画像の生成でのみ resolution を公開し、nano-banana は公開していません。
  • このエンドポイントの参照画像は、JSON の image_url / image_urls、または multipart の image ファイルとして渡せます。/v1/images/generations では images[]file_id は受け付けません。/v1/files の参照は、images[].file_id を明示的にサポートする /v1/images/edits モデルでのみ使用します。
Google の画像ファミリーでは aspect_ratio を優先し、モデルが明示的に対応している場合だけ resolution を送信してください。 xAI Grok Imagine 画像モデル(grok-imagine-imagegrok-imagine-image-quality、および legacy grok-imagine-image-pro)は aspect_ratioresolution1k2k)をサポートします。grok-imagine-image-pro は互換 ID として保持され、upstream では grok-imagine-image-quality にルーティングされます。

リクエストボディ

同期リクエストのタイムアウト: ルーティング先の画像プロバイダーによっては、生成完了まで待って最終画像をインラインで返します。高解像度または高品質のリクエストは 1 分前後、またはそれ以上かかることがあるため、HTTP クライアントのタイムアウトは少なくとも 120s に設定してください。作成レスポンスに status: "pending"task_id、または poll_url が含まれる場合は、返された poll_url をポーリングしてください。
model
string
デフォルト:"dall-e-3"
使用するモデル(例: gpt-image-2dall-e-3flux-promidjourney)。
prompt
string
必須
生成したい画像の説明テキスト。
image_url
string
image-to-image 生成に使う公開 HTTPS 参照画像 URL。Nano Banana ファミリーでは operationimage-to-image に設定し、その操作でモデルが明示的に対応していない限り resolution は省略してください。
image_urls
string[]
公開 HTTPS 参照画像 URL の配列。JSON リクエストで 1 枚以上の参照画像を渡す場合に使います。このエンドポイントでは file_idimages[] はサポートされません。
reference_image_urls
string[]
主入力画像と参照画像を区別するプロバイダー向けの、追加のモデル固有参照画像 URL。
image
file
image-to-image 生成用の multipart 参照画像ファイル。元画像が非公開、またはヘッダー認証を必要とする場合に使います。これは /v1/files の file_id とは異なり、このエンドポイントでは file_id は受け付けません。
n
integer
デフォルト:"1"
生成する画像の数(1-10、モデルに依存)。
size
string
デフォルト:"1024x1024"
画像サイズ。OpenAI 形式の画像ファミリーや、正確なピクセルサイズを受け付ける他のモデルで使用します。gpt-image-2 では、sizeauto または WIDTHxHEIGHT を受け付けます。カスタム寸法は両辺とも 16 の倍数、最長辺は 3840px 以下、長辺/短辺の比率は 3:1 以下、総ピクセル数は 655,360 から 8,294,400 の範囲である必要があります。aspect_ratioresolution は、現時点では TokenLab の gpt-image-2 公開契約には含まれません。Google Gemini 画像ファミリーでは、size は互換エイリアスとして扱われ、モデル公開の aspect_ratio 契約、および対応時の resolution 契約にマッピングされます。これらのモデルでは aspect_ratio を直接送信することを推奨します。
aspect_ratio
string
モデル依存のアスペクト比セレクタ。Google 画像ファミリーでよく使われる値には 1:116:99:163:22:3 があります。
resolution
string
モデル依存の出力解像度セレクタ。gemini-3.1-flash-image-previewgemini-3-pro-image-previewnano-banana-2nano-banana-pro、および同種の高解像度ファミリーでサポートされます。一般的な値は 1k2k4k です。モデル側で明記されていない限り、アスペクト比のみの Gemini 画像ファミリーには送信しないでください。xAI Grok Imagine 画像モデルでは 1k または 2k を使用してください。
quality
string
デフォルト:"standard"
画像品質。DALL-E モデルでは standard または hd を使用します。gpt-image-2 などの GPT Image モデルでは autolowmediumhigh を使用します。
response_format
string
デフォルト:"url"
レスポンス形式:url または b64_json。デフォルトは url です。Azure Official または Azure-compatible の gpt-image-2 ルートでは、TokenLab は response_format を upstream に転送しません。ゲートウェイは常に upstream から b64_json として画像データを受け取ります。url リクエストでは各画像を CDN にアップロードして data[].url を返します。CDN ストレージが利用できない、またはアップロードに失敗した場合は、Base64 にフォールバックせずリクエストを失敗させます。b64_json では生の Base64 を返します。
async
boolean
デフォルト:"false"
gpt-image-2 または公式 FLUX/BFL 画像モデルで true にすると、まずタスクを作成します。完了した非同期画像タスクは、要求された response_format に関係なく URL を返します。b64_json が必要な場合は同期リクエストを使用してください。
style
string
デフォルト:"vivid"
DALL-E 3のスタイル:vivid または natural
user
string
エンドユーザーの一意識別子。

レスポンス

インラインレスポンス

created
integer
作成時のUnixタイムスタンプ。
data
array
生成された画像の配列。各オブジェクトに含まれるもの:
  • url (string): 生成された画像のURL
  • b64_json (string): Base64エンコードされた画像(リクエストされた場合)
  • revised_prompt (string): 使用されたプロンプト(DALL-E 3)

非同期タスクレスポンス

gpt-image-2 または公式 FLUX/BFL 画像モデルで async: true を指定すると、作成リクエスト内で最終画像を待たずにタスクを作成します。レスポンスには status: "pending"task_idpoll_url が含まれます。タスクが completed または failed になるまで /v1/tasks/{task_id} をポーリングしてください。 非同期画像タスクは最終画像の URL のみを返します。生の b64_json 画像データが必要な場合は、同期リクエストを使用してください。 タスク作成時に見積額が予約される場合があります。完了したタスクは実使用量で精算され、失敗またはタイムアウトしたタスクは予約が解放または返金されます。
created
integer
作成時刻の Unix タイムスタンプ。
task_id
string
ポーリング用の一意なタスク識別子。
status
string
初期ステータス: pending
poll_url
string
結果をポーリングするための相対URL。例: /v1/tasks/{id}
data
array
タスクが保留中の間は空です。完了した画像タスクは data[].url に生成された画像URLを返します。
status: "pending" を受け取ったら、poll_url または GET /v1/tasks/{task_id} を使用して結果を取得します。
curl -X POST "https://api.tokenlab.sh/v1/images/generations" \
  -H "Authorization: Bearer sk-your-api-key" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gemini-3-pro-image-preview",
    "prompt": "A cinematic portrait of a white cat sitting on a rainy windowsill",
    "aspect_ratio": "16:9",
    "resolution": "2k",
    "n": 1
  }'
{
  "created": 1706000000,
  "data": [
    {
      "url": "https://...",
      "revised_prompt": "A fluffy white cat with bright eyes sitting peacefully on a wooden windowsill, watching raindrops stream down the glass window..."
    }
  ]
}