Responses API 是 OpenAI 更新的有状态对话 API。TokenLab 将此格式作为兼容模型的高级可选路径提供支持;除非你明确需要 Responses 特定行为,否则请将Documentation Index
Fetch the complete documentation index at: https://docs.tokenlab.sh/llms.txt
Use this file to discover all available pages before exploring further.
POST /v1/chat/completions 作为默认的兼容 OpenAI 路由。
请求体
由对话组成的输入项列表。每个项可以是:
message: 带有角色和内容的对话消息function_call: 一个函数调用请求function_call_output: 来自函数调用的输出
message.content 可以是普通字符串,也可以是内容块数组。对于支持图像的模型(例如 GPT-5.4 变体),请将图像作为 input_image 块传递,而不是将 URL 或 Base64 字符串直接嵌入普通文本中。示例内容块:{ "type": "input_text", "text": "Describe this image" }{ "type": "input_image", "image_url": "https://example.com/image.jpg" }{ "type": "input_image", "image_url": "data:image/png;base64,..." }
提供给模型的系统指令(等同于 system 消息)。
生成的最大 token 数量。
采样温度,范围在 0 到 2 之间。
模型可能调用的工具列表。对于使用默认图片工具模型,或显式设置
model: "gpt-image-2" 的 hosted image_generation 工具,TokenLab 会在转发请求前移除不支持的 input_fidelity,因为 GPT Image 2 已经以高保真处理图片输入。请不要对这个工具传入 background: "transparent";TokenLab 不会静默移除它,因为这会改变输出语义。如果为 true,则返回事件流。
用于从某个先前响应继续对话的响应 ID。
是否存储响应以便后续检索。
附加到响应以用于跟踪的元数据。
文本生成的配置选项。
text.format 的行为取决于所选模型和路由路径;并不保证在每个模型上都一致。是否允许并行进行多个工具调用。
Nucleus 采样参数(0-1)。
针对具备推理能力的模型(例如 GPT-5 系列变体)的推理配置。
effort(string): 推理努力级别(low,medium,high)
响应
响应的唯一标识符。
始终为
response。响应创建时的 Unix 时间戳。
模型生成的输出项列表。
token 使用统计。