Saltar al contenido principal

Resumen

Este endpoint sirve para reconocimiento de voz, síntesis de voz, traducción de voz o modelos multimodales en tiempo real. Un GET normal devuelve metadatos; el upgrade WebSocket se proxifica a la sesión upstream enrutada.
Los agentes deben descubrir modelos con soporte realtime en /v1/models antes de abrir el socket.

Conexión

model
string
requerido
ID del modelo en tiempo real. Usa un modelo cuyo contrato público indique soporte realtime.
Authorization
string
requerido
Clave API Bearer. Los clientes WebSocket deben enviar Authorization: Bearer sk-your-api-key durante el upgrade.
import WebSocket from 'ws';

const socket = new WebSocket('wss://api.tokenlab.sh/v1/realtime?model=qwen-tts-realtime', {
  headers: { Authorization: 'Bearer sk-your-api-key' }
});

socket.on('open', () => {
  socket.send(JSON.stringify({ type: 'session.start' }));
});

socket.on('message', (data) => {
  console.log('realtime event', data.toString());
});

Mensajes

TokenLab reenvía mensajes WebSocket entre tu cliente y el proveedor realtime enrutado. Conserva la forma oficial de eventos del modelo elegido y pasa model en la query string.

Facturación y cierre

Las sesiones realtime usan el mismo saldo de la clave API. TokenLab predescuenta una pequeña estimación al abrir y liquida o reembolsa al cerrar. Cierra el socket del cliente cuando termine la sesión. Si el upstream cierra primero, TokenLab reenvía el código de cierre cuando sea posible.