Documentation Index
Fetch the complete documentation index at: https://docs.tokenlab.sh/llms.txt
Use this file to discover all available pages before exploring further.
Anfragekörper
Timeout für synchrone Anfragen: Dieser Nicht-Chat-Endpunkt wartet, bis das geroutete Modell fertig ist. Große Eingaben, lange Audiodateien oder große Batches können übliche 30s-Client-Defaults überschreiten; setzen Sie das Timeout Ihres HTTP-Clients daher auf mindestens120s.
ID des zu verwendenden Embedding-Modells (z. B.
text-embedding-3-small).Eingabetext für das Embedding. Kann ein String oder ein Array von Strings sein.
Format für die Embeddings:
float oder base64.Anzahl der Dimensionen für die Ausgabe (modellspezifisch).
Eine eindeutige Kennung, die Ihren Endbenutzer für die Missbrauchsüberwachung repräsentiert.
Verfügbare Modelle
| Modell | Dimensionen | Beschreibung |
|---|---|---|
text-embedding-3-large | 3072 | Beste Qualität |
text-embedding-3-small | 1536 | Ausgewogen |
text-embedding-ada-002 | 1536 | Veraltet |
Antwort
Immer
list.Array von Embedding-Objekten.Jedes Objekt enthält:
object(string):embeddingindex(integer): Index im Eingabe-Arrayembedding(array): Der Embedding-Vektor
Verwendetes Modell.
Token-Nutzung mit
prompt_tokens und total_tokens.