Urutkan ulang dokumen menggunakan model kesamaan semantik. Berguna untuk meningkatkan hasil pencarian dan aplikasi RAG.Documentation Index
Fetch the complete documentation index at: https://docs.tokenlab.sh/llms.txt
Use this file to discover all available pages before exploring further.
Isi Permintaan
Timeout permintaan sinkron: endpoint non-chat ini menunggu model yang dirutekan selesai. Input besar, audio panjang, atau batch besar dapat melebihi default client umum 30s, jadi atur timeout HTTP client Anda minimal120s.
ID model reranker yang akan digunakan (misalnya,
BAAI/bge-reranker-v2-m3, qwen3-rerank).Kueri untuk membandingkan peringkat dokumen. Panjang maksimum:
32,000 karakter.Daftar dokumen (string) untuk diurutkan ulang. Batas: hingga
1,000 dokumen, setiap dokumen hingga 100,000 karakter, dan total karakter dokumen paling banyak 2,000,000.Jumlah hasil teratas yang akan dikembalikan. Default ke semua dokumen. Nilainya harus minimal
1 dan tidak boleh lebih besar dari documents.length. Saat ini TokenLab tidak memiliki hard cap lebih rendah khusus provider yang sudah dikelola; jika provider menerbitkannya nanti, nilai tersebut harus ditambahkan dulu ke truth request-shape rerank sebelum didokumentasikan atau diberlakukan.Apakah akan menyertakan teks dokumen asli dalam respons.
Respons
Daftar dokumen yang telah diurutkan beserta skornya.Setiap hasil berisi:
index(integer): Indeks dokumen aslirelevance_score(number): Skor relevansi (0-1)document(string): Teks asli (jikareturn_documents=true)
Model yang digunakan untuk reranking.
Statistik penggunaan token.