Elegir El Flujo
| Flujo | Endpoint | Úsalo cuando |
|---|---|---|
| Texto a voz | POST /v1/audio/speech | Necesites un archivo de audio a partir de texto. |
| Transcripción | POST /v1/audio/transcriptions | Necesites texto a partir de un archivo de audio. |
| Traducción de audio | POST /v1/audio/translations | Necesites texto traducido desde un archivo de audio. |
| Sesión en tiempo real | GET /v1/realtime | Necesites audio bidireccional en streaming o eventos multimodales en tiempo real. |
Descubrir Modelos
Consulta el catálogo de modelos antes de fijar un modelo. Usa listas recomendadas para voz y transcripción, y confirma soporte realtime en los detalles del modelo antes de abrir un socket.Solicitudes De Audio Síncronas
Las solicitudes de voz, transcripción y traducción responden directamente en la solicitud HTTP. Las entradas grandes pueden tardar más que los timeouts habituales del cliente, así que usa un timeout amplio y guarda request IDs para soporte.Sesiones En Tiempo Real
Abre un WebSocket con el modelo en la query string y la API key en el encabezado Authorization. Usa el formato de eventos documentado para el modelo realtime elegido y cierra el socket al terminar la sesión.Manejo De Estado
- Guarda los archivos de audio generados en lugar de repetir la misma solicitud al refrescar.
- Para transcripción y traducción, muestra estados de subida y procesamiento aunque la llamada sea síncrona.
- Para realtime, maneja eventos de cierre y reconecta solo cuando el usuario inicia una nueva sesión.
- No pongas API keys, URLs privadas ni secretos de cuenta en el texto de audio.
Referencia API
| Tema | Referencia |
|---|---|
| Crear Voz | Crear Voz |
| Crear Transcripción | Crear Transcripción |
| Crear Traducción | Crear Traducción |
| WebSocket En Tiempo Real | WebSocket En Tiempo Real |
| Listar Modelos | Listar Modelos |
| Facturación y precios | Facturación y precios |