Responses API は、OpenAI のより新しいステートフルな会話 API です。TokenLab は、互換性のあるモデル向けの上級者向けオプション経路としてこの形式をサポートしています。Responses 固有の動作が明示的に必要でない限り、既定の OpenAI 互換 ルートとしてDocumentation Index
Fetch the complete documentation index at: https://docs.tokenlab.sh/llms.txt
Use this file to discover all available pages before exploring further.
POST /v1/chat/completions を使用してください。
リクエストボディ
会話を構成する入力アイテムのリスト。各アイテムは次のいずれかになります:
message: ロールとコンテンツを持つ会話メッセージfunction_call: 関数呼び出しのリクエストfunction_call_output: 関数呼び出しからの出力
message.content はプレーンな文字列かコンテンツブロックの配列のいずれかになります。GPT-5.4 系列のような画像対応モデルでは、URL や Base64 文字列をプレーンテキストに直接埋め込むのではなく、input_image ブロックとして画像を渡してください。例のコンテンツブロック:{ "type": "input_text", "text": "Describe this image" }{ "type": "input_image", "image_url": "https://example.com/image.jpg" }{ "type": "input_image", "image_url": "data:image/png;base64,..." }
モデルへのシステム指示(system message と同等)。
生成する最大の token 数。
サンプリングの温度。0 から 2 の間で指定します。
モデルが呼び出す可能性のあるツールのリスト。デフォルトの画像ツールモデルを使う、または明示的に
model: "gpt-image-2" を指定するホスト型 image_generation ツールでは、GPT Image 2 が画像入力をすでに高 fidelity として扱うため、TokenLab は未対応の input_fidelity を転送前に削除します。このツールでは background: "transparent" を送らないでください。出力の意味が変わるため、TokenLab はこれを黙って削除しません。true の場合、イベントのストリームを返します。
会話を続けるための前回のレスポンスの ID。
後で取得するためにレスポンスを保存するかどうか。
追跡目的でレスポンスに添付するメタデータ。
テキスト生成の設定オプション。
text.format の挙動は選択したモデルと経路によって異なり、すべてのモデルで一様に保証されるわけではありません。複数のツール呼び出しを並列で許可するかどうか。
Nucleus サンプリングのパラメータ(0〜1)。
GPT-5 系列などの推論対応モデル向けの推論設定。
effort(string): 推論の努力レベル(low、medium、high)
レスポンス
レスポンスの一意の識別子。
常に
response です。レスポンスが作成された時刻の Unix タイムスタンプ。
モデルが生成した出力アイテムのリスト。
token 使用統計。