Chọn Luồng
| Luồng | Endpoint | Dùng khi |
|---|---|---|
| Văn bản thành giọng nói | POST /v1/audio/speech | Bạn cần tệp âm thanh từ văn bản. |
| Phiên âm | POST /v1/audio/transcriptions | Bạn cần văn bản từ tệp âm thanh. |
| Dịch âm thanh | POST /v1/audio/translations | Bạn cần văn bản đã dịch từ tệp âm thanh. |
| Phiên thời gian thực | GET /v1/realtime | Bạn cần âm thanh streaming hai chiều hoặc sự kiện đa phương thức thời gian thực. |
Khám Phá Mô Hình
Hãy truy vấn danh mục mô hình trước khi hard-code model. Dùng danh sách đề xuất cho speech và transcription, đồng thời kiểm tra hỗ trợ realtime trong chi tiết model trước khi mở socket.Yêu Cầu Âm Thanh Đồng Bộ
Yêu cầu speech, transcription và translation trả về trực tiếp trong HTTP request. Đầu vào lớn có thể lâu hơn timeout phổ biến của client, vì vậy hãy đặt timeout rộng và lưu request ID để hỗ trợ.Phiên Thời Gian Thực
Mở WebSocket với model trong query string và API key trong header Authorization. Dùng định dạng sự kiện được tài liệu hóa cho realtime model đã chọn, rồi đóng socket khi phiên hoàn tất.Xử Lý Trạng Thái
- Lưu tệp âm thanh đã tạo thay vì phát lại cùng một yêu cầu khi refresh.
- Với phiên âm và dịch, vẫn hiển thị trạng thái tải lên và xử lý dù API call là đồng bộ.
- Với realtime, xử lý sự kiện đóng và chỉ kết nối lại khi người dùng bắt đầu phiên mới.
- Không đặt API key, URL riêng tư hoặc bí mật tài khoản trong văn bản âm thanh.
Tham Chiếu API
| Chủ đề | Tham chiếu |
|---|---|
| Tạo Giọng Nói | Tạo Giọng Nói |
| Tạo Phiên Âm | Tạo Phiên Âm |
| Tạo Bản Dịch | Tạo Bản Dịch |
| WebSocket Thời Gian Thực | WebSocket Thời Gian Thực |
| Liệt Kê Mô Hình | Liệt Kê Mô Hình |
| Thanh toán & giá | Thanh toán & giá |