跳转到主要内容

Documentation Index

Fetch the complete documentation index at: https://docs.tokenlab.sh/llms.txt

Use this file to discover all available pages before exploring further.

概览

TokenLab 支持使用单个 API 密钥的三种原生 API 格式。选择最适合您用例的格式 — 无需更改配置。

OpenAI 格式

/v1/chat/completions 标准格式,兼容性最广

Anthropic 格式

/v1/messages 延展思维,原生 Claude 功能

Gemini 格式

/v1beta/models/:model:generateContent Google 生态系统集成

为什么使用多格式?

优点说明
无需切换 SDK在您偏好的 SDK 中使用任意模型
原生功能访问格式特定能力
原生优先迁移行为重要时保留提供商原生路由;已有 OpenAI 风格客户端使用 /v1 兼容路径
统一计费一个账户,一个 API 密钥,支持所有格式

格式比较

功能OpenAIAnthropicGemini
端点/v1/chat/completions/v1/messages/v1beta/models/:model:generateContent
认证头Authorization: Bearerx-api-keyAuthorization: Bearer
系统提示messages 数组中独立的 system 字段systemInstruction
延展思维
流式传输✅ SSE✅ SSE✅ SSE
工具调用
视觉能力

OpenAI 格式

这是面向已有 OpenAI SDK 集成、可移植聊天或 embeddings 的兼容路由。需要 Claude 或 Gemini 原生行为时,请使用下面的 Anthropic 或 Gemini 格式。
from openai import OpenAI

client = OpenAI(
    api_key="sk-your-tokenlab-key",
    base_url="https://api.tokenlab.sh/v1"
)

# Portable chat works across many models
response = client.chat.completions.create(
    model="claude-sonnet-4-6",  # Claude via OpenAI format
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Hello!"}
    ]
)
适用场景:
  • 通用场景
  • 已有 OpenAI SDK 集成
  • 最大兼容性

Anthropic 格式

原生 Anthropic Messages API。用于 Claude 特有功能,如延展思维。
from anthropic import Anthropic

client = Anthropic(
    api_key="sk-your-tokenlab-key",
    base_url="https://api.tokenlab.sh"  # No /v1 suffix!
)

message = client.messages.create(
    model="claude-sonnet-4-6",
    max_tokens=1024,
    system="You are a helpful assistant.",  # Separate system field
    messages=[
        {"role": "user", "content": "Hello!"}
    ]
)

延展思维(Claude Opus 4.6)

仅在 Anthropic 格式可用:
message = client.messages.create(
    model="claude-opus-4-6",
    max_tokens=16000,
    thinking={
        "type": "enabled",
        "budget_tokens": 10000
    },
    messages=[{"role": "user", "content": "Solve this complex problem..."}]
)

# Access thinking process
for block in message.content:
    if block.type == "thinking":
        print(f"Thinking: {block.thinking}")
    elif block.type == "text":
        print(f"Answer: {block.text}")
适用场景:
  • Claude 特有功能
  • 延展思维模式
  • 原生 Anthropic SDK 用户

Gemini 格式

原生 Google Gemini API 格式,适用于 Google 生态系统集成。
curl "https://api.tokenlab.sh/v1beta/models/gemini-2.5-flash:generateContent" \
  -H "Authorization: Bearer sk-your-tokenlab-key" \
  -H "Content-Type: application/json" \
  -d '{
    "contents": [{
      "parts": [{"text": "Hello!"}]
    }],
    "systemInstruction": {
      "parts": [{"text": "You are a helpful assistant."}]
    }
  }'

流式传输

curl "https://api.tokenlab.sh/v1beta/models/gemini-2.5-flash:streamGenerateContent?alt=sse" \
  -H "Authorization: Bearer sk-your-tokenlab-key" \
  -H "Content-Type: application/json" \
  -d '{
    "contents": [{"parts": [{"text": "Write a story"}]}]
  }'
适用场景:
  • Google Cloud 集成
  • 已有 Gemini SDK 代码
  • 原生 Gemini 功能
Gemini Files 和 Cache: 原生 Gemini 路径支持 /upload/v1beta/files/v1beta/files/v1beta/files:register/v1beta/cachedContents。Files 使用兼容 Gemini File API 的上游渠道;显式 Cache 资源也可以走 Vertex AI 渠道。通过 TokenLab 创建的资源会绑定到同一个上游渠道/key,后续 generateContent 会沿用该绑定。

工具兼容边界

当目标路径支持时,函数工具可以在不同格式之间转换。提供商原生工具必须保留在对应的原生路径上:
  • OpenAI Responses 托管和原生工具,例如 tool_searchweb_searchfile_searchcode_interpreter、MCP、shell/apply_patch 和 computer-use 工具,需要 /v1/responses
  • Anthropic server/native 工具,例如 web_search_*web_fetch_*code_execution_*tool_search_*、bash、computer-use 和 text-editor 工具,需要 /v1/messages
  • Gemini 内置工具,例如 googleSearchcodeExecutionurlContextcomputerUse 以及类似的 tools 字段,需要 /v1beta
如果 TokenLab 无法把带原生工具的请求路由到支持原生格式的上游路径,会返回明确的 unsupported-field 错误,而不是静默丢弃工具或伪装成 Chat Completions 函数。用户自定义函数工具仍然是最可移植的工具路径。

选择合适的格式

迁移指南

来自 OpenAI 官方 API

# Before (OpenAI)
client = OpenAI(api_key="sk-openai-key")

# After (TokenLab)
client = OpenAI(
    api_key="sk-tokenlab-key",
    base_url="https://api.tokenlab.sh/v1"  # Add this line
)
# That's it! Same code works

来自 Anthropic 官方 API

# Before (Anthropic)
client = Anthropic(api_key="sk-ant-key")

# After (TokenLab)
client = Anthropic(
    api_key="sk-tokenlab-key",
    base_url="https://api.tokenlab.sh"  # Add this line (no /v1!)
)

来自 Google AI Studio

# Before (Google)
import google.generativeai as genai
genai.configure(api_key="google-api-key")

# After (TokenLab) - Use REST API
import requests

response = requests.post(
    "https://api.tokenlab.sh/v1beta/models/gemini-2.5-flash:generateContent",
    headers={"Authorization": "Bearer sk-tokenlab-key"},
    json={"contents": [{"parts": [{"text": "Hello"}]}]}
)

跨模型兼容性

TokenLab 的魔力:使用 任意 SDK 访问 任意模型。网关会自动处理格式转换。

任意 SDK → 任意模型

# Anthropic SDK with GPT-4o (auto-converts to OpenAI format)
from anthropic import Anthropic

client = Anthropic(
    api_key="sk-tokenlab-key",
    base_url="https://api.tokenlab.sh"
)

response = client.messages.create(
    model="gpt-4o",  # ✅ Works! Auto-converted
    max_tokens=1024,
    messages=[{"role": "user", "content": "Hello!"}]
)

# Same compatibility SDK for portable chat; native-only features still need native routes
response = client.messages.create(model="gemini-2.5-flash", ...)  # ✅ Works!
response = client.messages.create(model="deepseek-r1", ...)       # ✅ Works!

OpenAI SDK → 所有模型

from openai import OpenAI

client = OpenAI(base_url="https://api.tokenlab.sh/v1", api_key="sk-...")

# These portable chat calls use the same /v1 compatibility SDK:
response = client.chat.completions.create(model="gpt-4o", ...)
response = client.chat.completions.create(model="claude-sonnet-4-6", ...)
response = client.chat.completions.create(model="gemini-2.5-flash", ...)

行业比较

平台OpenAI 格式Anthropic 格式Gemini 格式Responses API
TokenLab✅ 所有模型✅ 所有模型✅ 所有模型✅ 所有模型
OpenRouter✅ 所有模型
Together AI✅ 所有模型
Fireworks✅ 所有模型
虽然跨格式在大多数功能上可行,但格式特定的功能(例如 Anthropic 的延展思维)仍然需要使用原生格式。