Reordene documentos usando modelos de similaridade semântica. Útil para melhorar resultados de busca e aplicações de RAG.Documentation Index
Fetch the complete documentation index at: https://docs.tokenlab.sh/llms.txt
Use this file to discover all available pages before exploring further.
Corpo da Requisição
Timeout de solicitações síncronas: este endpoint não-chat aguarda o modelo roteado terminar. Entradas grandes, áudios longos ou lotes grandes podem exceder os padrões comuns de 30s dos clientes, então configure o timeout do seu cliente HTTP para pelo menos120s.
ID do modelo de reranker a ser usado (ex:
BAAI/bge-reranker-v2-m3, qwen3-rerank).A consulta para classificar os documentos. Comprimento máximo:
32,000 caracteres.Lista de documentos (strings) para reordenar. Limites: até
1,000 documentos, cada documento com até 100,000 caracteres e no máximo 2,000,000 caracteres de documentos no total.Número de resultados principais a retornar. O padrão é retornar todos os documentos. Deve ser pelo menos
1 e não pode ser maior que documents.length. Atualmente a TokenLab não tem um limite rígido inferior específico de provedor sob governança; se um provedor publicar um posteriormente, ele deverá ser adicionado primeiro à truth de request-shape de rerank antes de ser documentado ou aplicado.Se deve incluir o texto original do documento na resposta.
Resposta
Lista classificada de documentos com pontuações.Cada resultado contém:
index(integer): Índice original do documentorelevance_score(number): Pontuação de relevância (0-1)document(string): Texto original (sereturn_documents=true)
O modelo usado para a reordenação.
Estatísticas de uso de tokens.