Documentation Index
Fetch the complete documentation index at: https://docs.tokenlab.sh/llms.txt
Use this file to discover all available pages before exploring further.
概要
コーディング agent の場合は、まずGET /v1/models?recommended_for=image で現在推奨される画像モデルの候補を見つけ、そのうえで選んだ model をこのエンドポイントに明示的に渡してください。
gpt-image-2 は token 単位で課金される GPT Image モデルです。TokenLab は OpenAI 公式の usage 内訳に従い、テキスト入力、画像入力、報告されたキャッシュ入力、画像出力 token を精算します。固定の画像単価モデルとしては扱いません。
gpt-image-2 の画像生成でサポートされる公開パラメーターは、prompt、n、size、quality、response_format、async、background、output_format、output_compression または compression、moderation、partial_images、user です。size または quality を省略すると TokenLab は auto を使用します。カスタム size は下記の柔軟な WIDTHxHEIGHT 契約に従う必要があります。
互換性メモ: gpt-image-2 リクエストで input_fidelity が送信された場合、GPT Image 2 は画像入力を自動的に高忠実度で処理するため、TokenLab は上流へ転送する前にこのフィールドを削除します。
モデル動作メモ
Google Gemini の画像ファミリーは、同じセレクター契約を共有していません:gemini-3.1-flash-image-preview、gemini-3-pro-image-preview、nano-banana-2、およびnano-banana-proは、テキストから画像の生成でaspect_ratioとresolution(1k、2k、4k)をサポートしています。gemini-2.5-flash-image、nano-banana、およびnano-banana-editはaspect_ratioをサポートしますが、公開されているresolutionの選択肢はありません。gemini-2.0-flash-preview-image-generationは、ここではプロンプトのみのテキストから画像への生成として説明されています。nano-banana、nano-banana-2、nano-banana-proの参照画像リクエストでは、このエンドポイント(/v1/images/generations)にoperation: "image-to-image"とimage_urlsを送信してください。Nano Banana の参照画像リクエストを/v1/images/editsに送信しないでください。- Nano Banana の image-to-image リクエストでは
resolutionを省略してください。nano-banana-2とnano-banana-proはテキストから画像の生成でのみresolutionを公開し、nano-bananaは公開していません。 - このエンドポイントの参照画像は、JSON の
image_url/image_urls、または multipart のimageファイルとして渡せます。/v1/images/generationsではimages[]とfile_idは受け付けません。/v1/filesの参照は、images[].file_idを明示的にサポートする/v1/images/editsモデルでのみ使用します。
aspect_ratio を優先し、モデルが明示的に対応している場合だけ resolution を送信してください。
xAI Grok Imagine 画像モデル(grok-imagine-image、grok-imagine-image-quality、および legacy grok-imagine-image-pro)は aspect_ratio と resolution(1k、2k)をサポートします。grok-imagine-image-pro は互換 ID として保持され、upstream では grok-imagine-image-quality にルーティングされます。
リクエストボディ
同期リクエストのタイムアウト: ルーティング先の画像プロバイダーによっては、生成完了まで待って最終画像をインラインで返します。高解像度または高品質のリクエストは 1 分前後、またはそれ以上かかることがあるため、HTTP クライアントのタイムアウトは少なくとも120s に設定してください。作成レスポンスに status: "pending"、task_id、または poll_url が含まれる場合は、返された poll_url をポーリングしてください。
使用するモデル(例:
gpt-image-2、dall-e-3、flux-pro、midjourney)。生成したい画像の説明テキスト。
image-to-image 生成に使う公開 HTTPS 参照画像 URL。Nano Banana ファミリーでは
operation を image-to-image に設定し、その操作でモデルが明示的に対応していない限り resolution は省略してください。公開 HTTPS 参照画像 URL の配列。JSON リクエストで 1 枚以上の参照画像を渡す場合に使います。このエンドポイントでは
file_id と images[] はサポートされません。主入力画像と参照画像を区別するプロバイダー向けの、追加のモデル固有参照画像 URL。
image-to-image 生成用の multipart 参照画像ファイル。元画像が非公開、またはヘッダー認証を必要とする場合に使います。これは /v1/files の
file_id とは異なり、このエンドポイントでは file_id は受け付けません。生成する画像の数(1-10、モデルに依存)。
画像サイズ。OpenAI 形式の画像ファミリーや、正確なピクセルサイズを受け付ける他のモデルで使用します。
gpt-image-2 では、size は auto または WIDTHxHEIGHT を受け付けます。カスタム寸法は両辺とも 16 の倍数、最長辺は 3840px 以下、長辺/短辺の比率は 3:1 以下、総ピクセル数は 655,360 から 8,294,400 の範囲である必要があります。aspect_ratio と resolution は、現時点では TokenLab の gpt-image-2 公開契約には含まれません。Google Gemini 画像ファミリーでは、size は互換エイリアスとして扱われ、モデル公開の aspect_ratio 契約、および対応時の resolution 契約にマッピングされます。これらのモデルでは aspect_ratio を直接送信することを推奨します。モデル依存のアスペクト比セレクタ。Google 画像ファミリーでよく使われる値には
1:1、16:9、9:16、3:2、2:3 があります。モデル依存の出力解像度セレクタ。
gemini-3.1-flash-image-preview、gemini-3-pro-image-preview、nano-banana-2、nano-banana-pro、および同種の高解像度ファミリーでサポートされます。一般的な値は 1k、2k、4k です。モデル側で明記されていない限り、アスペクト比のみの Gemini 画像ファミリーには送信しないでください。xAI Grok Imagine 画像モデルでは 1k または 2k を使用してください。画像品質。DALL-E モデルでは
standard または hd を使用します。gpt-image-2 などの GPT Image モデルでは auto、low、medium、high を使用します。レスポンス形式:
url または b64_json。デフォルトは url です。Azure Official または Azure-compatible の gpt-image-2 ルートでは、TokenLab は response_format を upstream に転送しません。ゲートウェイは常に upstream から b64_json として画像データを受け取ります。url リクエストでは各画像を CDN にアップロードして data[].url を返します。CDN ストレージが利用できない、またはアップロードに失敗した場合は、Base64 にフォールバックせずリクエストを失敗させます。b64_json では生の Base64 を返します。gpt-image-2 または公式 FLUX/BFL 画像モデルで true にすると、まずタスクを作成します。完了した非同期画像タスクは、要求された response_format に関係なく URL を返します。b64_json が必要な場合は同期リクエストを使用してください。DALL-E 3のスタイル:
vivid または natural。エンドユーザーの一意識別子。
レスポンス
インラインレスポンス
作成時のUnixタイムスタンプ。
生成された画像の配列。各オブジェクトに含まれるもの:
url(string): 生成された画像のURLb64_json(string): Base64エンコードされた画像(リクエストされた場合)revised_prompt(string): 使用されたプロンプト(DALL-E 3)
非同期タスクレスポンス
gpt-image-2 または公式 FLUX/BFL 画像モデルで async: true を指定すると、作成リクエスト内で最終画像を待たずにタスクを作成します。レスポンスには status: "pending"、task_id、poll_url が含まれます。タスクが completed または failed になるまで /v1/tasks/{task_id} をポーリングしてください。
非同期画像タスクは最終画像の URL のみを返します。生の b64_json 画像データが必要な場合は、同期リクエストを使用してください。
タスク作成時に見積額が予約される場合があります。完了したタスクは実使用量で精算され、失敗またはタイムアウトしたタスクは予約が解放または返金されます。
作成時刻の Unix タイムスタンプ。
ポーリング用の一意なタスク識別子。
初期ステータス:
pending。結果をポーリングするための相対URL。例:
/v1/tasks/{id}。タスクが保留中の間は空です。完了した画像タスクは
data[].url に生成された画像URLを返します。status: "pending" を受け取ったら、poll_url または GET /v1/tasks/{task_id} を使用して結果を取得します。