Ordnen Sie Dokumente mithilfe von semantischen Ähnlichkeitsmodellen neu. Nützlich zur Verbesserung von Suchergebnissen und RAG-Anwendungen.Documentation Index
Fetch the complete documentation index at: https://docs.tokenlab.sh/llms.txt
Use this file to discover all available pages before exploring further.
Anfragekörper
Timeout für synchrone Anfragen: Dieser Nicht-Chat-Endpunkt wartet, bis das geroutete Modell fertig ist. Große Eingaben, lange Audiodateien oder große Batches können übliche 30s-Client-Defaults überschreiten; setzen Sie das Timeout Ihres HTTP-Clients daher auf mindestens120s.
ID des zu verwendenden Reranker-Modells (z. B.
BAAI/bge-reranker-v2-m3, qwen3-rerank).Die Suchanfrage, gegen die die Dokumente bewertet werden sollen. Maximale Länge:
32,000 Zeichen.Liste der neu zu ordnenden Dokumente (Strings). Limits: bis zu
1,000 Dokumente, jedes Dokument bis zu 100,000 Zeichen und höchstens 2,000,000 Dokumentzeichen insgesamt.Anzahl der zurückzugebenden Top-Ergebnisse. Standardmäßig werden alle Dokumente zurückgegeben. Muss mindestens
1 sein und darf documents.length nicht überschreiten. TokenLab hat derzeit keinen verwalteten, anbieterspezifischen niedrigeren Hard-Cap; falls ein Anbieter später einen veröffentlicht, muss diese Wahrheit zuerst in die rerank request-shape truth aufgenommen werden, bevor sie dokumentiert oder erzwungen wird.Gibt an, ob der ursprüngliche Dokumenttext in der Antwort enthalten sein soll.
Antwort
Rangliste der Dokumente mit Scores.Jedes Ergebnis enthält:
index(integer): Ursprünglicher Dokument-Indexrelevance_score(number): Relevanz-Score (0-1)document(string): Ursprünglicher Text (wennreturn_documents=true)
Das für das Reranking verwendete Modell.
Statistiken zur Token-Nutzung.