Escolher O Fluxo
| Fluxo | Endpoint | Use quando |
|---|---|---|
| Texto para fala | POST /v1/audio/speech | Você precisa de um arquivo de áudio a partir de texto. |
| Transcrição | POST /v1/audio/transcriptions | Você precisa de texto a partir de um arquivo de áudio. |
| Tradução de áudio | POST /v1/audio/translations | Você precisa de texto traduzido a partir de um arquivo de áudio. |
| Sessão em tempo real | GET /v1/realtime | Você precisa de áudio bidirecional em streaming ou eventos multimodais em tempo real. |
Descobrir Modelos
Consulte o catálogo de modelos antes de fixar um modelo. Use listas recomendadas para fala e transcrição, e confirme suporte realtime nos detalhes do modelo antes de abrir um socket.Requisições De Áudio Síncronas
Requisições de fala, transcrição e tradução respondem diretamente na requisição HTTP. Entradas grandes podem demorar mais que timeouts comuns de clientes, então defina um timeout generoso e salve request IDs para suporte.Sessões Em Tempo Real
Abra um WebSocket com o modelo na query string e a API key no header Authorization. Use o formato de eventos documentado para o modelo realtime escolhido e feche o socket quando a sessão terminar.Tratamento De Estado
- Salve arquivos de áudio gerados em vez de repetir a mesma requisição ao atualizar.
- Para transcrição e tradução, mostre estados de upload e processamento mesmo quando a chamada for síncrona.
- Para realtime, trate eventos de fechamento e reconecte apenas quando o usuário iniciar uma nova sessão.
- Não coloque API keys, URLs privadas ou segredos de conta no texto de áudio.
Referência Da API
| Tópico | Referência |
|---|---|
| Criar Voz | Criar Voz |
| Criar Transcrição | Criar Transcrição |
| Criar Tradução | Criar Tradução |
| WebSocket Em Tempo Real | WebSocket Em Tempo Real |
| Listar Modelos | Listar Modelos |
| Faturamento e preços | Faturamento e preços |