Chuyển đến nội dung chính

Documentation Index

Fetch the complete documentation index at: https://docs.tokenlab.sh/llms.txt

Use this file to discover all available pages before exploring further.

Nội dung Request

Timeout cho yêu cầu đồng bộ: endpoint không phải chat này chờ model được định tuyến hoàn tất. Input lớn, audio dài, hoặc batch lớn có thể vượt quá mặc định 30s phổ biến của client, vì vậy hãy đặt timeout của HTTP client ít nhất là 120s.
model
string
bắt buộc
ID của model embedding sẽ sử dụng (ví dụ: text-embedding-3-small).
input
string | array
bắt buộc
Văn bản đầu vào để tạo embedding. Có thể là một chuỗi hoặc một mảng các chuỗi.
encoding_format
string
mặc định:"float"
Định dạng cho embeddings: float hoặc base64.
dimensions
integer
Số chiều cho đầu ra (phụ thuộc vào model).
user
string
Một mã định danh duy nhất đại diện cho end-user của bạn để giám sát lạm dụng.

Các Model Khả Dụng

Mô hìnhKích thướcMô tả
text-embedding-3-large3072Chất lượng tốt nhất
text-embedding-3-small1536Cân bằng
text-embedding-ada-0021536Phiên bản cũ

Phản hồi

object
string
Luôn là list.
data
array
Mảng các đối tượng embedding.Mỗi đối tượng bao gồm:
  • object (string): embedding
  • index (integer): Chỉ mục trong mảng đầu vào
  • embedding (array): Vector embedding
model
string
Model được sử dụng.
usage
object
Mức sử dụng token với prompt_tokenstotal_tokens.
curl -X POST "https://api.tokenlab.sh/v1/embeddings" \
  -H "Authorization: Bearer sk-your-api-key" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "text-embedding-3-small",
    "input": "The quick brown fox jumps over the lazy dog"
  }'
{
  "object": "list",
  "data": [
    {
      "object": "embedding",
      "index": 0,
      "embedding": [0.0023, -0.0194, 0.0081, ...]
    }
  ],
  "model": "text-embedding-3-small",
  "usage": {
    "prompt_tokens": 9,
    "total_tokens": 9
  }
}

Embeddings theo lô

# Embed multiple texts at once
response = client.embeddings.create(
    model="text-embedding-3-small",
    input=[
        "First document text",
        "Second document text",
        "Third document text"
    ]
)

for i, data in enumerate(response.data):
    print(f"Document {i}: {len(data.embedding)} dimensions")