메인 콘텐츠로 건너뛰기

Documentation Index

Fetch the complete documentation index at: https://docs.tokenlab.sh/llms.txt

Use this file to discover all available pages before exploring further.

시맨틱 유사도 모델을 사용하여 문서의 순위를 재조정합니다. 검색 결과 개선 및 RAG 애플리케이션에 유용합니다.

요청 본문

동기 요청 타임아웃: 이 비채팅 엔드포인트는 라우팅된 모델이 완료될 때까지 기다립니다. 큰 입력, 긴 오디오, 큰 배치는 일반적인 30s 클라이언트 기본값을 초과할 수 있으므로 HTTP 클라이언트 타임아웃을 최소 120s 로 설정하세요.
model
string
필수
사용할 reranker 모델의 ID입니다 (예: BAAI/bge-reranker-v2-m3, qwen3-rerank).
query
string
필수
문서 순위를 매길 기준이 되는 쿼리입니다. 최대 길이: 32,000자.
documents
array
필수
재순위화할 문서(문자열) 목록입니다. 제한: 최대 1,000개 문서, 각 문서는 최대 100,000자, 전체 문서 합계는 최대 2,000,000자입니다.
top_n
integer
반환할 상위 결과의 개수입니다. 기본값은 모든 문서입니다. 최소 1이어야 하며 documents.length보다 클 수 없습니다. 현재 TokenLab에는 관리 중인 제공자별 더 낮은 하드 캡이 없습니다. 제공자가 나중에 이를 공개하면 문서화하거나 강제하기 전에 rerank request-shape truth에 먼저 추가해야 합니다.
return_documents
boolean
기본값:"false"
응답에 원본 문서 텍스트를 포함할지 여부입니다.

응답 (Response)

results
array
점수가 포함된 문서의 순위 목록입니다.각 결과에는 다음이 포함됩니다:
  • index (integer): 원본 문서 인덱스
  • relevance_score (number): 관련성 점수 (0-1)
  • document (string): 원본 텍스트 (return_documents=true인 경우)
model
string
재순위화에 사용된 모델입니다.
usage
object
토큰 사용량 통계입니다.
curl -X POST "https://api.tokenlab.sh/v1/rerank" \
  -H "Authorization: Bearer sk-your-api-key" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "BAAI/bge-reranker-v2-m3",
    "query": "What is machine learning?",
    "documents": [
      "Machine learning is a subset of AI",
      "The weather is nice today",
      "Deep learning uses neural networks"
    ],
    "top_n": 2,
    "return_documents": true
  }'
{
  "results": [
    {
      "index": 0,
      "relevance_score": 0.95,
      "document": "Machine learning is a subset of AI"
    },
    {
      "index": 2,
      "relevance_score": 0.82,
      "document": "Deep learning uses neural networks"
    }
  ],
  "model": "BAAI/bge-reranker-v2-m3",
  "usage": {
    "prompt_tokens": 45,
    "total_tokens": 45
  }
}