Documentation Index
Fetch the complete documentation index at: https://docs.tokenlab.sh/llms.txt
Use this file to discover all available pages before exploring further.
Corpo da Requisição
Timeout de solicitações síncronas: este endpoint não-chat aguarda o modelo roteado terminar. Entradas grandes, áudios longos ou lotes grandes podem exceder os padrões comuns de 30s dos clientes, então configure o timeout do seu cliente HTTP para pelo menos120s.
ID do modelo de embedding a ser usado (ex.:
text-embedding-3-small).Texto de entrada para gerar embedding. Pode ser uma string ou um array de strings.
Formato para os embeddings:
float ou base64.Número de dimensões para a saída (específico do modelo).
Um identificador único representando seu usuário final para monitoramento de abuso.
Modelos Disponíveis
| Modelo | Dimensões | Descrição |
|---|---|---|
text-embedding-3-large | 3072 | Melhor qualidade |
text-embedding-3-small | 1536 | Equilibrado |
text-embedding-ada-002 | 1536 | Legado |
Resposta
Sempre
list.Array de objetos de embedding.Cada objeto contém:
object(string):embeddingindex(integer): Índice no array de entradaembedding(array): O vetor de embedding
Modelo usado.
Uso de tokens com
prompt_tokens e total_tokens.