Zum Hauptinhalt springen

Documentation Index

Fetch the complete documentation index at: https://docs.tokenlab.sh/llms.txt

Use this file to discover all available pages before exploring further.

Übersicht

Für Coding-Agenten zuerst die aktuelle empfohlene Bild-Shortlist mit GET /v1/models?recommended_for=image ermitteln und dann das ausgewählte model explizit an diesen Endpunkt senden. gpt-image-2 ist ein GPT-Image-Modell mit tokenbasierter Abrechnung. TokenLab rechnet nach der offiziellen OpenAI-Usage-Aufschlüsselung für Texteingabe, Bildeingabe, gemeldete Cache-Eingabe und Bildausgabe-Token ab; es wird nicht als Festpreis-pro-Bild-Modell behandelt. Für die Bilderzeugung mit gpt-image-2 unterstützt der öffentliche Vertrag prompt, n, size, quality, response_format, async, background, output_format, output_compression oder compression, moderation, partial_images und user. Wenn size oder quality fehlt, verwendet TokenLab auto; eigene size-Werte müssen dem unten beschriebenen flexiblen WIDTHxHEIGHT-Vertrag entsprechen. Kompatibilitätshinweis: Wenn eine gpt-image-2-Anfrage input_fidelity enthält, entfernt TokenLab das Feld vor der Weiterleitung, weil GPT Image 2 Bildeingaben bereits automatisch mit hoher Treue verarbeitet.

Hinweise zum Modellverhalten

Google-Gemini-Bildfamilien verwenden keinen gemeinsamen Auswahlvertrag:
  • gemini-3.1-flash-image-preview, gemini-3-pro-image-preview, nano-banana-2 und nano-banana-pro unterstützen bei Text-zu-Bild-Generierung aspect_ratio sowie resolution (1k, 2k, 4k).
  • gemini-2.5-flash-image, nano-banana und nano-banana-edit unterstützen aspect_ratio, bieten aber keine öffentliche Auswahl von resolution.
  • gemini-2.0-flash-preview-image-generation wird hier als reines Prompt-zu-Bild-Text-zu-Bild beschrieben.
  • Verwenden Sie für Referenzbild-Anfragen mit nano-banana, nano-banana-2 und nano-banana-pro diesen Endpunkt (/v1/images/generations) mit operation: "image-to-image" und image_urls. Senden Sie Nano-Banana-Referenzbild-Anfragen nicht an /v1/images/edits.
  • Lassen Sie bei Nano-Banana-Image-to-Image-Anfragen resolution weg. nano-banana-2 und nano-banana-pro veröffentlichen resolution nur für Text-zu-Bild; nano-banana veröffentlicht diesen Parameter nicht.
  • Referenzbilder können an diesem Endpunkt als JSON image_url / image_urls oder als multipart-image-Datei übergeben werden. /v1/images/generations akzeptiert weder images[] noch file_id; /v1/files-Referenzen gelten nur für /v1/images/edits-Modelle, die images[].file_id ausdrücklich dokumentieren.
Bei Google-Bildfamilien bevorzugen Sie aspect_ratio und senden Sie resolution nur, wenn das Modell es ausdrücklich unterstützt. xAI-Grok-Imagine-Bildmodelle (grok-imagine-image, grok-imagine-image-quality und das legacy grok-imagine-image-pro) unterstützen aspect_ratio sowie resolution (1k, 2k). grok-imagine-image-pro bleibt als Kompatibilitäts-ID erhalten und wird upstream an grok-imagine-image-quality geroutet.

Anfragekörper

Timeout für synchrone Anfragen: Einige geroutete Bildanbieter geben das endgültige Bild inline zurück und warten dafür, bis die Generierung abgeschlossen ist. Hochauflösende oder hochwertige Anfragen können fast eine Minute oder länger dauern; setzen Sie das Timeout Ihres HTTP-Clients daher auf mindestens 120s. Wenn die Create-Antwort status: "pending", task_id oder poll_url enthält, folgen Sie stattdessen der zurückgegebenen poll_url.
model
string
Standard:"dall-e-3"
Zu verwendendes Modell (z. B. gpt-image-2, dall-e-3, flux-pro, midjourney).
prompt
string
erforderlich
Textbeschreibung des gewünschten Bildes.
image_url
string
Öffentliche HTTPS-Referenzbild-URL für Image-to-Image-Generierung. Setzen Sie bei Nano-Banana-Familien operation auf image-to-image und lassen Sie resolution weg, sofern das Modell sie für diese Operation nicht ausdrücklich unterstützt.
image_urls
string[]
Öffentliche HTTPS-Referenzbild-URLs. Verwenden Sie dieses Feld für ein oder mehrere Referenzbilder in JSON-Anfragen. file_id und images[] werden an diesem Endpunkt nicht unterstützt.
reference_image_urls
string[]
Zusätzliche modellspezifische Referenzbild-URLs für Anbieter, die primäre Eingabebilder von Referenzen unterscheiden.
image
file
Multipart-Referenzbilddatei für Image-to-Image-Generierung. Verwenden Sie dies, wenn das Quellbild privat ist oder Header-Authentifizierung benötigt. Dies ist keine /v1/files-file_id; dieser Endpunkt akzeptiert keine file_id.
n
integer
Standard:"1"
Anzahl der zu generierenden Bilder (1-10, modellabhängig).
size
string
Standard:"1024x1024"
Bildgröße. Verwenden Sie dieses Feld für OpenAI-ähnliche Bildfamilien und andere Modelle, die exakte Pixelgrößen akzeptieren.Für gpt-image-2 akzeptiert size auto oder WIDTHxHEIGHT. Benutzerdefinierte Abmessungen müssen auf beiden Seiten Vielfache von 16 sein, die längste Kante darf höchstens 3840px betragen, das Verhältnis lange/kurze Kante höchstens 3:1, und die Gesamtpixelzahl muss zwischen 655,360 und 8,294,400 liegen. aspect_ratio und resolution gehören derzeit nicht zum öffentlichen TokenLab-Vertrag für gpt-image-2.Für Google-Gemini-Bildfamilien wird size als Kompatibilitätsalias behandelt und auf den öffentlichen aspect_ratio-Vertrag des Modells sowie, falls unterstützt, auf resolution abgebildet. Für diese Modelle sollten Sie vorzugsweise aspect_ratio direkt senden.
aspect_ratio
string
Modellabhängiger Seitenverhältnis-Selektor.Häufige Werte für Google-Bildfamilien sind 1:1, 16:9, 9:16, 3:2 und 2:3.
resolution
string
Modellabhängiger Auflösungs-Selektor.Unterstützt auf gemini-3.1-flash-image-preview, gemini-3-pro-image-preview, nano-banana-2, nano-banana-pro und ähnlichen High-Resolution-Familien. Typische Werte sind 1k, 2k und 4k. Senden Sie diesen Parameter nicht an reine Aspect-Ratio-Gemini-Bildfamilien, außer das Modell dokumentiert ihn ausdrücklich. Für xAI-Grok-Imagine-Bildmodelle verwenden Sie 1k oder 2k.
quality
string
Standard:"standard"
Bildqualität. DALL-E-Modelle verwenden standard oder hd; GPT-Image-Modelle wie gpt-image-2 verwenden auto, low, medium oder high.
response_format
string
Standard:"url"
Antwortformat: url oder b64_json. Standard ist url.Bei Azure Official- oder Azure-kompatiblen gpt-image-2-Routen leitet TokenLab response_format nicht an upstream weiter. Das Gateway erhält die Bilddaten upstream immer als b64_json; bei url-Anfragen lädt es jedes Bild in das CDN hoch und gibt data[].url zurück. Wenn der CDN-Speicher nicht verfügbar ist oder der Upload fehlschlägt, schlägt die Anfrage fehl, statt auf Base64 zurückzufallen. Bei b64_json wird das rohe Base64 zurückgegeben.
async
boolean
Standard:"false"
Auf true setzen, um mit gpt-image-2 oder offiziellen FLUX/BFL-Bildmodellen zuerst eine Aufgabe zu erstellen. Abgeschlossene Async-Bildaufgaben liefern unabhängig vom angeforderten response_format URLs; verwenden Sie synchrone Anfragen, wenn Sie b64_json benötigen.
style
string
Standard:"vivid"
Stil für DALL-E 3: vivid oder natural.
user
string
Eine eindeutige Kennung für den Endbenutzer.

Antwort

Inline-Antwort

created
integer
Unix-Zeitstempel der Erstellung.
data
array
Array der generierten Bilder.Jedes Objekt enthält:
  • url (string): URL des generierten Bildes
  • b64_json (string): Base64-kodiertes Bild (falls angefordert)
  • revised_prompt (string): Der verwendete Prompt (DALL-E 3)

Antwort für asynchrone Aufgaben

Setzen Sie async: true mit gpt-image-2 oder offiziellen FLUX/BFL-Bildmodellen, um eine Aufgabe zu erstellen, statt im Create-Request auf das endgültige Bild zu warten. Die Antwort enthält status: "pending", task_id und poll_url. Fragen Sie /v1/tasks/{task_id} ab, bis die Aufgabe completed oder failed erreicht. Asynchrone Bildaufgaben liefern nur die endgültigen Bild-URLs. Wenn Sie rohe b64_json-Bilddaten benötigen, verwenden Sie eine synchrone Anfrage. Beim Erstellen der Aufgabe kann der geschätzte Betrag reserviert werden. Abgeschlossene Aufgaben werden nach tatsächlicher Nutzung abgerechnet; fehlgeschlagene oder abgelaufene Aufgaben werden freigegeben oder erstattet.
created
integer
Unix-Zeitstempel der Erstellung.
task_id
string
Eindeutige Aufgaben-ID zum Abfragen.
status
string
Anfänglicher Status: pending.
poll_url
string
Relative URL zum Abfragen der Ergebnisse, zum Beispiel /v1/tasks/{id}.
data
array
Leer, solange die Aufgabe aussteht. Abgeschlossene Bildaufgaben geben generierte Bild-URLs in data[].url zurück.
Wenn du status: "pending" erhältst, verwende poll_url oder GET /v1/tasks/{task_id}, um das Ergebnis abzurufen.
curl -X POST "https://api.tokenlab.sh/v1/images/generations" \
  -H "Authorization: Bearer sk-your-api-key" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gemini-3-pro-image-preview",
    "prompt": "A cinematic portrait of a white cat sitting on a rainy windowsill",
    "aspect_ratio": "16:9",
    "resolution": "2k",
    "n": 1
  }'
{
  "created": 1706000000,
  "data": [
    {
      "url": "https://...",
      "revised_prompt": "A fluffy white cat with bright eyes sitting peacefully on a wooden windowsill, watching raindrops stream down the glass window..."
    }
  ]
}

Verfügbare Modelle

ModellTypMerkmale
dall-e-3Meist inlineBeste Qualität, Prompt-Verbesserung
dall-e-2Meist inlineSchneller, günstiger
flux-proOft task-basiertFotorealistisch, hohe Qualität
flux-schnellMeist inlineSehr schnell
midjourneyOft task-basiertKünstlerischer Stil
ideogram-v3Oft task-basiertBeste Textdarstellung
stable-diffusion-3Meist inlineOpen Source, anpassbar
Behandeln Sie ein Modell nicht statisch als immer synchron oder immer asynchron. Wenn die Create-Antwort status: "pending" zurückgibt, folgen Sie poll_url und pollen Sie bis zum Abschluss.