Documentation Index
Fetch the complete documentation index at: https://docs.tokenlab.sh/llms.txt
Use this file to discover all available pages before exploring further.
Übersicht
Für Coding-Agenten zuerst die aktuelle empfohlene Bild-Shortlist mitGET /v1/models?recommended_for=image ermitteln und dann das ausgewählte model explizit an diesen Endpunkt senden.
gpt-image-2 ist ein GPT-Image-Modell mit tokenbasierter Abrechnung. TokenLab rechnet nach der offiziellen OpenAI-Usage-Aufschlüsselung für Texteingabe, Bildeingabe, gemeldete Cache-Eingabe und Bildausgabe-Token ab; es wird nicht als Festpreis-pro-Bild-Modell behandelt.
Für die Bilderzeugung mit gpt-image-2 unterstützt der öffentliche Vertrag prompt, n, size, quality, response_format, async, background, output_format, output_compression oder compression, moderation, partial_images und user. Wenn size oder quality fehlt, verwendet TokenLab auto; eigene size-Werte müssen dem unten beschriebenen flexiblen WIDTHxHEIGHT-Vertrag entsprechen.
Kompatibilitätshinweis: Wenn eine gpt-image-2-Anfrage input_fidelity enthält, entfernt TokenLab das Feld vor der Weiterleitung, weil GPT Image 2 Bildeingaben bereits automatisch mit hoher Treue verarbeitet.
Hinweise zum Modellverhalten
Google-Gemini-Bildfamilien verwenden keinen gemeinsamen Auswahlvertrag:gemini-3.1-flash-image-preview,gemini-3-pro-image-preview,nano-banana-2undnano-banana-prounterstützen bei Text-zu-Bild-Generierungaspect_ratiosowieresolution(1k,2k,4k).gemini-2.5-flash-image,nano-bananaundnano-banana-editunterstützenaspect_ratio, bieten aber keine öffentliche Auswahl vonresolution.gemini-2.0-flash-preview-image-generationwird hier als reines Prompt-zu-Bild-Text-zu-Bild beschrieben.- Verwenden Sie für Referenzbild-Anfragen mit
nano-banana,nano-banana-2undnano-banana-prodiesen Endpunkt (/v1/images/generations) mitoperation: "image-to-image"undimage_urls. Senden Sie Nano-Banana-Referenzbild-Anfragen nicht an/v1/images/edits. - Lassen Sie bei Nano-Banana-Image-to-Image-Anfragen
resolutionweg.nano-banana-2undnano-banana-proveröffentlichenresolutionnur für Text-zu-Bild;nano-bananaveröffentlicht diesen Parameter nicht. - Referenzbilder können an diesem Endpunkt als JSON
image_url/image_urlsoder als multipart-image-Datei übergeben werden./v1/images/generationsakzeptiert wederimages[]nochfile_id;/v1/files-Referenzen gelten nur für/v1/images/edits-Modelle, dieimages[].file_idausdrücklich dokumentieren.
aspect_ratio und senden Sie resolution nur, wenn das Modell es ausdrücklich unterstützt.
xAI-Grok-Imagine-Bildmodelle (grok-imagine-image, grok-imagine-image-quality und das legacy grok-imagine-image-pro) unterstützen aspect_ratio sowie resolution (1k, 2k). grok-imagine-image-pro bleibt als Kompatibilitäts-ID erhalten und wird upstream an grok-imagine-image-quality geroutet.
Anfragekörper
Timeout für synchrone Anfragen: Einige geroutete Bildanbieter geben das endgültige Bild inline zurück und warten dafür, bis die Generierung abgeschlossen ist. Hochauflösende oder hochwertige Anfragen können fast eine Minute oder länger dauern; setzen Sie das Timeout Ihres HTTP-Clients daher auf mindestens120s. Wenn die Create-Antwort status: "pending", task_id oder poll_url enthält, folgen Sie stattdessen der zurückgegebenen poll_url.
Zu verwendendes Modell (z. B.
gpt-image-2, dall-e-3, flux-pro, midjourney).Textbeschreibung des gewünschten Bildes.
Öffentliche HTTPS-Referenzbild-URL für Image-to-Image-Generierung. Setzen Sie bei Nano-Banana-Familien
operation auf image-to-image und lassen Sie resolution weg, sofern das Modell sie für diese Operation nicht ausdrücklich unterstützt.Öffentliche HTTPS-Referenzbild-URLs. Verwenden Sie dieses Feld für ein oder mehrere Referenzbilder in JSON-Anfragen.
file_id und images[] werden an diesem Endpunkt nicht unterstützt.Zusätzliche modellspezifische Referenzbild-URLs für Anbieter, die primäre Eingabebilder von Referenzen unterscheiden.
Multipart-Referenzbilddatei für Image-to-Image-Generierung. Verwenden Sie dies, wenn das Quellbild privat ist oder Header-Authentifizierung benötigt. Dies ist keine /v1/files-
file_id; dieser Endpunkt akzeptiert keine file_id.Anzahl der zu generierenden Bilder (1-10, modellabhängig).
Bildgröße. Verwenden Sie dieses Feld für OpenAI-ähnliche Bildfamilien und andere Modelle, die exakte Pixelgrößen akzeptieren.Für
gpt-image-2 akzeptiert size auto oder WIDTHxHEIGHT. Benutzerdefinierte Abmessungen müssen auf beiden Seiten Vielfache von 16 sein, die längste Kante darf höchstens 3840px betragen, das Verhältnis lange/kurze Kante höchstens 3:1, und die Gesamtpixelzahl muss zwischen 655,360 und 8,294,400 liegen. aspect_ratio und resolution gehören derzeit nicht zum öffentlichen TokenLab-Vertrag für gpt-image-2.Für Google-Gemini-Bildfamilien wird size als Kompatibilitätsalias behandelt und auf den öffentlichen aspect_ratio-Vertrag des Modells sowie, falls unterstützt, auf resolution abgebildet. Für diese Modelle sollten Sie vorzugsweise aspect_ratio direkt senden.Modellabhängiger Seitenverhältnis-Selektor.Häufige Werte für Google-Bildfamilien sind
1:1, 16:9, 9:16, 3:2 und 2:3.Modellabhängiger Auflösungs-Selektor.Unterstützt auf
gemini-3.1-flash-image-preview, gemini-3-pro-image-preview, nano-banana-2, nano-banana-pro und ähnlichen High-Resolution-Familien. Typische Werte sind 1k, 2k und 4k. Senden Sie diesen Parameter nicht an reine Aspect-Ratio-Gemini-Bildfamilien, außer das Modell dokumentiert ihn ausdrücklich. Für xAI-Grok-Imagine-Bildmodelle verwenden Sie 1k oder 2k.Bildqualität. DALL-E-Modelle verwenden
standard oder hd; GPT-Image-Modelle wie gpt-image-2 verwenden auto, low, medium oder high.Antwortformat:
url oder b64_json. Standard ist url.Bei Azure Official- oder Azure-kompatiblen gpt-image-2-Routen leitet TokenLab response_format nicht an upstream weiter. Das Gateway erhält die Bilddaten upstream immer als b64_json; bei url-Anfragen lädt es jedes Bild in das CDN hoch und gibt data[].url zurück. Wenn der CDN-Speicher nicht verfügbar ist oder der Upload fehlschlägt, schlägt die Anfrage fehl, statt auf Base64 zurückzufallen. Bei b64_json wird das rohe Base64 zurückgegeben.Auf
true setzen, um mit gpt-image-2 oder offiziellen FLUX/BFL-Bildmodellen zuerst eine Aufgabe zu erstellen. Abgeschlossene Async-Bildaufgaben liefern unabhängig vom angeforderten response_format URLs; verwenden Sie synchrone Anfragen, wenn Sie b64_json benötigen.Stil für DALL-E 3:
vivid oder natural.Eine eindeutige Kennung für den Endbenutzer.
Antwort
Inline-Antwort
Unix-Zeitstempel der Erstellung.
Array der generierten Bilder.Jedes Objekt enthält:
url(string): URL des generierten Bildesb64_json(string): Base64-kodiertes Bild (falls angefordert)revised_prompt(string): Der verwendete Prompt (DALL-E 3)
Antwort für asynchrone Aufgaben
Setzen Sieasync: true mit gpt-image-2 oder offiziellen FLUX/BFL-Bildmodellen, um eine Aufgabe zu erstellen, statt im Create-Request auf das endgültige Bild zu warten. Die Antwort enthält status: "pending", task_id und poll_url. Fragen Sie /v1/tasks/{task_id} ab, bis die Aufgabe completed oder failed erreicht.
Asynchrone Bildaufgaben liefern nur die endgültigen Bild-URLs. Wenn Sie rohe b64_json-Bilddaten benötigen, verwenden Sie eine synchrone Anfrage.
Beim Erstellen der Aufgabe kann der geschätzte Betrag reserviert werden. Abgeschlossene Aufgaben werden nach tatsächlicher Nutzung abgerechnet; fehlgeschlagene oder abgelaufene Aufgaben werden freigegeben oder erstattet.
Unix-Zeitstempel der Erstellung.
Eindeutige Aufgaben-ID zum Abfragen.
Anfänglicher Status:
pending.Relative URL zum Abfragen der Ergebnisse, zum Beispiel
/v1/tasks/{id}.Leer, solange die Aufgabe aussteht. Abgeschlossene Bildaufgaben geben generierte Bild-URLs in
data[].url zurück.status: "pending" erhältst, verwende poll_url oder GET /v1/tasks/{task_id}, um das Ergebnis abzurufen.
Verfügbare Modelle
| Modell | Typ | Merkmale |
|---|---|---|
dall-e-3 | Meist inline | Beste Qualität, Prompt-Verbesserung |
dall-e-2 | Meist inline | Schneller, günstiger |
flux-pro | Oft task-basiert | Fotorealistisch, hohe Qualität |
flux-schnell | Meist inline | Sehr schnell |
midjourney | Oft task-basiert | Künstlerischer Stil |
ideogram-v3 | Oft task-basiert | Beste Textdarstellung |
stable-diffusion-3 | Meist inline | Open Source, anpassbar |
status: "pending" zurückgibt, folgen Sie poll_url und pollen Sie bis zum Abschluss.