Saltar al contenido principal

Documentation Index

Fetch the complete documentation index at: https://docs.tokenlab.sh/llms.txt

Use this file to discover all available pages before exploring further.

Cuerpo de la solicitud

Tiempo de espera de solicitudes síncronas: este endpoint no-chat espera a que el modelo enrutado termine. Entradas grandes, audio largo o lotes grandes pueden superar los valores predeterminados habituales de 30s del cliente, así que configura el timeout de tu cliente HTTP en al menos 120s.
model
string
requerido
ID del modelo de embedding que se va a usar (p. ej., text-embedding-3-small).
input
string | array
requerido
Texto de entrada para generar el embedding. Puede ser una cadena o un array de cadenas.
encoding_format
string
predeterminado:"float"
Formato para los embeddings: float o base64.
dimensions
integer
Número de dimensiones para la salida (específico del modelo).
user
string
Un identificador único que representa a tu usuario final para la supervisión de abuso.

Modelos disponibles

ModeloDimensionesDescripción
text-embedding-3-large3072Mejor calidad
text-embedding-3-small1536Equilibrado
text-embedding-ada-0021536Heredado

Respuesta

object
string
Siempre list.
data
array
Array de objetos de embedding.Cada objeto contiene:
  • object (string): embedding
  • index (integer): Índice en el array de entrada
  • embedding (array): El vector de embedding
model
string
Modelo utilizado.
usage
object
Uso de tokens con prompt_tokens y total_tokens.
curl -X POST "https://api.tokenlab.sh/v1/embeddings" \
  -H "Authorization: Bearer sk-your-api-key" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "text-embedding-3-small",
    "input": "The quick brown fox jumps over the lazy dog"
  }'
{
  "object": "list",
  "data": [
    {
      "object": "embedding",
      "index": 0,
      "embedding": [0.0023, -0.0194, 0.0081, ...]
    }
  ],
  "model": "text-embedding-3-small",
  "usage": {
    "prompt_tokens": 9,
    "total_tokens": 9
  }
}

Embeddings por lotes

# Embed multiple texts at once
response = client.embeddings.create(
    model="text-embedding-3-small",
    input=[
        "First document text",
        "Second document text",
        "Third document text"
    ]
)

for i, data in enumerate(response.data):
    print(f"Document {i}: {len(data.embedding)} dimensions")