Documentation Index
Fetch the complete documentation index at: https://docs.tokenlab.sh/llms.txt
Use this file to discover all available pages before exploring further.
Cuerpo de la solicitud
Tiempo de espera de solicitudes síncronas: este endpoint no-chat espera a que el modelo enrutado termine. Entradas grandes, audio largo o lotes grandes pueden superar los valores predeterminados habituales de 30s del cliente, así que configura el timeout de tu cliente HTTP en al menos120s.
ID del modelo de embedding que se va a usar (p. ej.,
text-embedding-3-small).Texto de entrada para generar el embedding. Puede ser una cadena o un array de cadenas.
Formato para los embeddings:
float o base64.Número de dimensiones para la salida (específico del modelo).
Un identificador único que representa a tu usuario final para la supervisión de abuso.
Modelos disponibles
| Modelo | Dimensiones | Descripción |
|---|---|---|
text-embedding-3-large | 3072 | Mejor calidad |
text-embedding-3-small | 1536 | Equilibrado |
text-embedding-ada-002 | 1536 | Heredado |
Respuesta
Siempre
list.Array de objetos de embedding.Cada objeto contiene:
object(string):embeddingindex(integer): Índice en el array de entradaembedding(array): El vector de embedding
Modelo utilizado.
Uso de tokens con
prompt_tokens y total_tokens.