Passer au contenu principal

Aperçu

Cet endpoint sert aux sessions de reconnaissance vocale, synthèse vocale, traduction vocale ou modèles multimodaux en temps réel. Un GET classique renvoie les métadonnées; une requête WebSocket est proxifiée vers la session upstream routée.
Les agents doivent découvrir les modèles compatibles realtime avec /v1/models avant d’ouvrir le socket.

Connexion

model
string
requis
ID du modèle temps réel. Utilisez un modèle dont le contrat public indique la prise en charge realtime.
Authorization
string
requis
Clé API Bearer. Les clients WebSocket doivent envoyer Authorization: Bearer sk-your-api-key pendant la requête d’upgrade.
import WebSocket from 'ws';

const socket = new WebSocket('wss://api.tokenlab.sh/v1/realtime?model=qwen-tts-realtime', {
  headers: { Authorization: 'Bearer sk-your-api-key' }
});

socket.on('open', () => {
  socket.send(JSON.stringify({ type: 'session.start' }));
});

socket.on('message', (data) => {
  console.log('realtime event', data.toString());
});

Messages

TokenLab relaie les messages WebSocket entre votre client et le fournisseur temps réel routé. Conservez les formes d’événements officielles du modèle choisi et passez model dans la query string.

Facturation et fermeture

Les sessions realtime utilisent le même solde de clé API. TokenLab pré-déduit une petite estimation à l’ouverture, puis règle ou rembourse à la fermeture. Fermez le socket client quand la session est terminée. Si l’upstream ferme d’abord, TokenLab relaie le code de fermeture lorsque c’est possible.