跳转到主要内容

概览

这个端点用于实时语音识别、语音合成、语音翻译或实时多模态模型等会话。普通 GET 请求会返回端点元信息;WebSocket 升级请求会代理到路由后的实时上游会话。
Agent 应先通过 /v1/models 发现支持 realtime 的模型,再打开 socket。

连接

model
string
必填
实时模型 ID。请选择公开契约中包含 realtime 支持的模型。
Authorization
string
必填
Bearer API Key。WebSocket 客户端应在升级请求中发送 Authorization: Bearer sk-your-api-key
import WebSocket from 'ws';

const socket = new WebSocket('wss://api.tokenlab.sh/v1/realtime?model=qwen-tts-realtime', {
  headers: { Authorization: 'Bearer sk-your-api-key' }
});

socket.on('open', () => {
  socket.send(JSON.stringify({ type: 'session.start' }));
});

socket.on('message', (data) => {
  console.log('realtime event', data.toString());
});

消息

TokenLab 会在客户端和路由后的实时提供方之间转发 WebSocket 消息。请保留所选模型的官方事件结构,并通过查询参数传入 model

计费与关闭

实时会话使用同一 API Key 余额。TokenLab 会在 socket 打开时预扣小额估算费用,并在会话关闭时结算或退款。 会话完成后关闭客户端 socket。如果上游先关闭,TokenLab 会尽可能把关闭码转发给客户端。