Saltar para o conteúdo principal

Visão geral

Este endpoint é usado para reconhecimento de fala, síntese de fala, tradução de fala ou modelos multimodais em tempo real. Um GET comum retorna metadados; o upgrade WebSocket é proxificado para a sessão upstream roteada.
Agentes devem descobrir modelos com suporte a realtime em /v1/models antes de abrir o socket.

Conexão

model
string
obrigatório
ID do modelo em tempo real. Use um modelo cujo contrato público liste suporte a realtime.
Authorization
string
obrigatório
Chave API Bearer. Clientes WebSocket devem enviar Authorization: Bearer sk-your-api-key na requisição de upgrade.
import WebSocket from 'ws';

const socket = new WebSocket('wss://api.tokenlab.sh/v1/realtime?model=qwen-tts-realtime', {
  headers: { Authorization: 'Bearer sk-your-api-key' }
});

socket.on('open', () => {
  socket.send(JSON.stringify({ type: 'session.start' }));
});

socket.on('message', (data) => {
  console.log('realtime event', data.toString());
});

Mensagens

TokenLab encaminha mensagens WebSocket entre o cliente e o provedor realtime roteado. Preserve os eventos oficiais do modelo selecionado e passe model na query string.

Cobrança e encerramento

Sessões realtime usam o mesmo saldo da chave API. TokenLab pré-deduz uma pequena estimativa ao abrir e liquida ou reembolsa ao fechar. Feche o socket do cliente quando a sessão terminar. Se o upstream fechar primeiro, TokenLab repassa o código de fechamento quando possível.