Réorganisez les documents à l’aide de modèles de similitude sémantique. Utile pour améliorer les résultats de recherche et les applications RAG.Documentation Index
Fetch the complete documentation index at: https://docs.tokenlab.sh/llms.txt
Use this file to discover all available pages before exploring further.
Corps de la requête
Timeout des requêtes synchrones : cet endpoint non-chat attend que le modèle routé termine son traitement. Les entrées volumineuses, les longs fichiers audio ou les grands lots peuvent dépasser les valeurs par défaut courantes de 30s côté client ; configurez donc le timeout de votre client HTTP à au moins120s.
ID du modèle de reranker à utiliser (par ex.,
BAAI/bge-reranker-v2-m3, qwen3-rerank).La requête par rapport à laquelle classer les documents. Longueur maximale :
32,000 caractères.Liste de documents (chaînes de caractères) à réorganiser. Limites : jusqu’à
1,000 documents, chaque document jusqu’à 100,000 caractères, et au plus 2,000,000 caractères de documents au total.Nombre de meilleurs résultats à retourner. Par défaut, tous les documents. Doit être au moins
1 et ne pas dépasser documents.length. TokenLab n’a actuellement aucun hard cap inférieur spécifique à un fournisseur sous gouvernance ; si un fournisseur en publie un plus tard, il devra d’abord être ajouté à la truth de request-shape rerank avant d’être documenté ou appliqué.Indique s’il faut inclure le texte original du document dans la réponse.
Réponse
Liste classée des documents avec scores.Chaque résultat contient :
index(integer) : Index du document originalrelevance_score(number) : Score de pertinence (0-1)document(string) : Texte original (sireturn_documents=true)
Le modèle utilisé pour la réorganisation.
Statistiques d’utilisation des tokens.