시맨틱 유사도 모델을 사용하여 문서의 순위를 재조정합니다. 검색 결과 개선 및 RAG 애플리케이션에 유용합니다.Documentation Index
Fetch the complete documentation index at: https://docs.tokenlab.sh/llms.txt
Use this file to discover all available pages before exploring further.
요청 본문
동기 요청 타임아웃: 이 비채팅 엔드포인트는 라우팅된 모델이 완료될 때까지 기다립니다. 큰 입력, 긴 오디오, 큰 배치는 일반적인 30s 클라이언트 기본값을 초과할 수 있으므로 HTTP 클라이언트 타임아웃을 최소120s 로 설정하세요.
사용할 reranker 모델의 ID입니다 (예:
BAAI/bge-reranker-v2-m3, qwen3-rerank).문서 순위를 매길 기준이 되는 쿼리입니다. 최대 길이:
32,000자.재순위화할 문서(문자열) 목록입니다. 제한: 최대
1,000개 문서, 각 문서는 최대 100,000자, 전체 문서 합계는 최대 2,000,000자입니다.반환할 상위 결과의 개수입니다. 기본값은 모든 문서입니다. 최소
1이어야 하며 documents.length보다 클 수 없습니다. 현재 TokenLab에는 관리 중인 제공자별 더 낮은 하드 캡이 없습니다. 제공자가 나중에 이를 공개하면 문서화하거나 강제하기 전에 rerank request-shape truth에 먼저 추가해야 합니다.응답에 원본 문서 텍스트를 포함할지 여부입니다.
응답 (Response)
점수가 포함된 문서의 순위 목록입니다.각 결과에는 다음이 포함됩니다:
index(integer): 원본 문서 인덱스relevance_score(number): 관련성 점수 (0-1)document(string): 원본 텍스트 (return_documents=true인 경우)
재순위화에 사용된 모델입니다.
토큰 사용량 통계입니다.