Xếp hạng lại các tài liệu bằng cách sử dụng các mô hình tương đồng ngữ nghĩa. Hữu ích cho việc cải thiện kết quả tìm kiếm và các ứng dụng RAG.Documentation Index
Fetch the complete documentation index at: https://docs.tokenlab.sh/llms.txt
Use this file to discover all available pages before exploring further.
Nội dung yêu cầu
Timeout cho yêu cầu đồng bộ: endpoint không phải chat này chờ model được định tuyến hoàn tất. Input lớn, audio dài, hoặc batch lớn có thể vượt quá mặc định 30s phổ biến của client, vì vậy hãy đặt timeout của HTTP client ít nhất là120s.
ID của mô hình reranker cần sử dụng (ví dụ:
BAAI/bge-reranker-v2-m3, qwen3-rerank).Truy vấn để xếp hạng các tài liệu dựa trên đó. Độ dài tối đa:
32,000 ký tự.Danh sách các tài liệu (chuỗi) cần xếp hạng lại. Giới hạn: tối đa
1,000 tài liệu, mỗi tài liệu tối đa 100,000 ký tự, và tổng số ký tự tài liệu tối đa 2,000,000.Số lượng kết quả hàng đầu cần trả về. Mặc định là tất cả tài liệu. Phải tối thiểu là
1 và không được lớn hơn documents.length. Hiện TokenLab chưa có hard cap thấp hơn theo từng provider đã được quản trị; nếu provider công bố giới hạn đó sau này, giới hạn phải được thêm vào truth request-shape của rerank trước khi được tài liệu hóa hoặc áp dụng.Có bao gồm văn bản tài liệu gốc trong phản hồi hay không.
Phản hồi
Danh sách các tài liệu đã được xếp hạng kèm theo điểm số.Mỗi kết quả bao gồm:
index(integer): Chỉ mục tài liệu gốcrelevance_score(number): Điểm số liên quan (0-1)document(string): Văn bản gốc (nếureturn_documents=true)
Mô hình được sử dụng để xếp hạng lại.
Thống kê mức sử dụng token.