Documentation Index
Fetch the complete documentation index at: https://docs.tokenlab.sh/llms.txt
Use this file to discover all available pages before exploring further.
請求主體
同步請求逾時: 這個非聊天端點會等待路由到的模型完成處理。大型輸入、長音訊或大量批次可能超過常見的 30s 用戶端預設逾時,因此請將 HTTP 用戶端逾時設定為至少120s。
要使用的 embedding 模型 ID(例如:
text-embedding-3-small)。要進行 embedding 的輸入文字。可以是字串或字串陣列。
embeddings 的格式:
float 或 base64。輸出的維度數量(依模型而定)。
代表終端使用者的唯一識別碼,用於濫用監控。
可用模型
| 模型 | 維度 | 說明 |
|---|---|---|
text-embedding-3-large | 3072 | 最佳品質 |
text-embedding-3-small | 1536 | 平衡 |
text-embedding-ada-002 | 1536 | 舊版 |
回應
一律為
list。embedding 物件的陣列。每個物件包含:
object(string):embeddingindex(integer):輸入陣列中的索引embedding(array):embedding 向量
使用的模型。
Token 使用量,包含
prompt_tokens 和 total_tokens。