Documentation Index
Fetch the complete documentation index at: https://docs.tokenlab.sh/llms.txt
Use this file to discover all available pages before exploring further.
Corps de la requête
Timeout des requêtes synchrones : cet endpoint non-chat attend que le modèle routé termine son traitement. Les entrées volumineuses, les longs fichiers audio ou les grands lots peuvent dépasser les valeurs par défaut courantes de 30s côté client ; configurez donc le timeout de votre client HTTP à au moins120s.
ID du modèle d’embedding à utiliser (par ex.,
text-embedding-3-small).Texte d’entrée à transformer en embedding. Peut être une chaîne de caractères ou un tableau de chaînes.
Format des embeddings :
float ou base64.Nombre de dimensions pour la sortie (spécifique au modèle).
Un identifiant unique représentant votre utilisateur final pour la surveillance des abus.
Modèles disponibles
| Modèle | Dimensions | Description |
|---|---|---|
text-embedding-3-large | 3072 | Meilleure qualité |
text-embedding-3-small | 1536 | Équilibré |
text-embedding-ada-002 | 1536 | Hérité |
Réponse
Toujours
list.Tableau d’objets embedding.Chaque objet contient :
object(string) :embeddingindex(integer) : Index dans le tableau d’entréeembedding(array) : Le vecteur d’embedding
Modèle utilisé.
Utilisation des tokens avec
prompt_tokens et total_tokens.