워크플로 선택
| 워크플로 | Endpoint | 사용 시점 |
|---|---|---|
| 텍스트 음성 변환 | POST /v1/audio/speech | 텍스트에서 오디오 파일이 필요할 때. |
| 전사 | POST /v1/audio/transcriptions | 오디오 파일에서 텍스트가 필요할 때. |
| 오디오 번역 | POST /v1/audio/translations | 오디오 파일에서 번역된 텍스트가 필요할 때. |
| 실시간 세션 | GET /v1/realtime | 양방향 스트리밍 오디오나 실시간 멀티모달 이벤트가 필요할 때. |
모델 찾기
클라이언트에 모델 목록을 고정하지 마세요. 음성과 전사는 추천 목록을 사용하고, realtime은 socket을 열기 전에 모델 상세에서 지원 여부를 확인하세요.동기 오디오 요청
음성, 전사, 번역은 HTTP 요청에서 직접 반환됩니다. 큰 입력은 일반적인 클라이언트 timeout보다 오래 걸릴 수 있으므로 넉넉한 timeout과 request ID 저장을 권장합니다.실시간 세션
WebSocket을 열 때 query string에 model을, Authorization header에 API key를 넣습니다. 선택한 realtime 모델 문서의 이벤트 형식을 사용하고, 세션이 끝나면 socket을 닫으세요.상태 처리
- 생성된 오디오 파일을 저장하고 새로고침 때 같은 요청을 반복하지 마세요.
- 전사와 번역은 동기 호출이어도 업로드 및 처리 상태를 보여주세요.
- realtime은 close 이벤트를 처리하고 사용자가 새 세션을 시작할 때만 재연결하세요.
- API key, 비공개 URL, 계정 secret을 오디오 텍스트 입력에 넣지 마세요.