Documentation Index
Fetch the complete documentation index at: https://docs.tokenlab.sh/llms.txt
Use this file to discover all available pages before exploring further.
Tổng quan
Dành cho coding agents, hãy khám phá shortlist hình ảnh được khuyến nghị hiện tại trước bằngGET /v1/models?recommended_for=image, rồi gửi rõ model đã chọn đến endpoint này.
gpt-image-2 là model GPT Image tính phí theo token. TokenLab bám theo chi tiết usage chính thức của OpenAI để tính token đầu vào văn bản, đầu vào hình ảnh, đầu vào cache khi được báo cáo, và token đầu ra hình ảnh; model này không được tính như giá cố định cho mỗi ảnh.
Với tạo ảnh bằng gpt-image-2, các tham số public được hỗ trợ gồm prompt, n, size, quality, response_format, async, background, output_format, output_compression hoặc compression, moderation, partial_images, và user. Nếu bỏ qua size hoặc quality, TokenLab dùng auto; giá trị size tùy chỉnh phải theo hợp đồng linh hoạt WIDTHxHEIGHT được mô tả bên dưới.
Ghi chu tuong thich: neu yeu cau gpt-image-2 gui input_fidelity, TokenLab se xoa truong nay truoc khi chuyen tiep vi GPT Image 2 tu dong xu ly dau vao hinh anh voi do trung thuc cao.
Ghi chú hành vi mô hình
Google Gemini không dùng cùng một hợp đồng selector:gemini-3.1-flash-image-preview,gemini-3-pro-image-preview,nano-banana-2, vànano-banana-prohỗ trợaspect_ratiocùngresolution(1k,2k,4k) cho text-to-image.gemini-2.5-flash-image,nano-banana, vànano-banana-edithỗ trợaspect_rationhưng không công khairesolution.gemini-2.0-flash-preview-image-generationđược tài liệu hoá ở đây như một mô hình text-to-image chỉ dùng prompt.- Với request ảnh tham chiếu cho
nano-banana,nano-banana-2, vànano-banana-pro, hãy dùng endpoint này (/v1/images/generations) vớioperation: "image-to-image"vàimage_urls. Đừng gửi request ảnh tham chiếu Nano Banana tới/v1/images/edits. - Với request image-to-image Nano Banana, hãy bỏ qua
resolution.nano-banana-2vànano-banana-prochỉ công khairesolutioncho text-to-image, cònnano-bananakhông công khai trường này. - Ảnh tham chiếu trên endpoint này có thể gửi bằng JSON
image_url/image_urls, hoặc file multipartimage./v1/images/generationskhông nhậnimages[]hayfile_id; tham chiếu/v1/fileschỉ dùng cho model/v1/images/editscó tài liệu rõimages[].file_id.
aspect_ratio và chỉ gửi resolution khi model đó hỗ trợ rõ ràng.
Các model hình ảnh xAI Grok Imagine (grok-imagine-image, grok-imagine-image-quality, và legacy grok-imagine-image-pro) hỗ trợ aspect_ratio cùng resolution (1k, 2k). grok-imagine-image-pro được giữ làm ID tương thích và route upstream tới grok-imagine-image-quality.
Thân Yêu Cầu
Timeout cho yêu cầu đồng bộ: một số nhà cung cấp hình ảnh được định tuyến sẽ trả ảnh cuối cùng inline và chờ quá trình tạo hoàn tất. Yêu cầu độ phân giải cao hoặc chất lượng cao có thể mất gần một phút hoặc lâu hơn, vì vậy hãy đặt timeout của HTTP client ít nhất là120s. Nếu phản hồi tạo có status: "pending", task_id, hoặc poll_url, hãy theo poll_url được trả về để polling.
Model cần dùng (ví dụ:
gpt-image-2, dall-e-3, flux-pro, midjourney).Mô tả bằng văn bản cho hình ảnh mong muốn.
URL HTTPS công khai của ảnh tham chiếu cho image-to-image. Với họ Nano Banana, đặt
operation là image-to-image và bỏ qua resolution trừ khi model hỗ trợ rõ trường này cho operation đó.Danh sách URL HTTPS công khai của ảnh tham chiếu. Dùng khi request JSON cần một hoặc nhiều ảnh tham chiếu. Endpoint này không hỗ trợ
file_id và images[].URL ảnh tham chiếu bổ sung theo từng model, dành cho provider phân biệt ảnh đầu vào chính và ảnh tham chiếu.
File ảnh tham chiếu multipart cho image-to-image. Dùng khi ảnh nguồn là riêng tư hoặc cần header xác thực. Trường này khác với
file_id của /v1/files; endpoint này không nhận file_id.Số lượng hình ảnh cần tạo (1-10, tùy theo model).
Kích thước ảnh. Dùng cho các dòng ảnh kiểu OpenAI và các model khác chấp nhận kích thước pixel chính xác.Với
gpt-image-2, size chấp nhận auto hoặc WIDTHxHEIGHT. Kích thước tùy chỉnh phải có cả hai cạnh là bội số của 16, cạnh dài nhất không quá 3840px, tỷ lệ cạnh dài/cạnh ngắn không quá 3:1, và tổng số pixel nằm trong khoảng 655,360 đến 8,294,400. aspect_ratio và resolution hiện không thuộc hợp đồng công khai của TokenLab cho gpt-image-2.Với các dòng ảnh Google Gemini, size được xem là alias tương thích ánh xạ sang hợp đồng công khai aspect_ratio của model và, khi được hỗ trợ, resolution. Với các model này, nên gửi trực tiếp aspect_ratio.Bộ chọn tỷ lệ khung hình theo từng model.Các giá trị phổ biến của nhóm model hình ảnh Google gồm
1:1, 16:9, 9:16, 3:2, và 2:3.Bộ chọn độ phân giải đầu ra theo từng model.Được hỗ trợ trên
gemini-3.1-flash-image-preview, gemini-3-pro-image-preview, nano-banana-2, nano-banana-pro, và các nhóm độ phân giải cao tương tự. Giá trị thường dùng là 1k, 2k, và 4k. Không gửi tham số này cho các model Gemini hình ảnh chỉ nhận tỷ lệ khung hình trừ khi tài liệu của model đó nói rõ. Với model hình ảnh xAI Grok Imagine, dùng 1k hoặc 2k.Chất lượng ảnh. Model DALL-E dùng
standard hoặc hd; các model GPT Image như gpt-image-2 dùng auto, low, medium hoặc high.Định dạng response:
url hoặc b64_json. Mặc định là url.Với các tuyến gpt-image-2 Azure Official hoặc tương thích Azure, TokenLab không chuyển response_format lên upstream. Gateway luôn nhận dữ liệu ảnh upstream dưới dạng b64_json; với request url, gateway tải từng ảnh lên CDN rồi trả về data[].url. Nếu CDN storage không khả dụng hoặc upload thất bại, request sẽ fail thay vì fallback về Base64. Với b64_json, Base64 gốc được trả về.Đặt
true với gpt-image-2 hoặc các model hình ảnh FLUX/BFL chính thức để tạo task trước. Task ảnh async hoàn tất trả về URL bất kể response_format được yêu cầu; dùng request đồng bộ nếu cần b64_json.Phong cách cho DALL-E 3:
vivid hoặc natural.Một định danh duy nhất cho end-user.
Phản Hồi
Phản Hồi Đồng Bộ
Unix timestamp của thời điểm tạo.
Mảng các hình ảnh được tạo.Mỗi object chứa:
url(string): URL của hình ảnh được tạob64_json(string): Hình ảnh mã hoá Base64 (nếu được yêu cầu)revised_prompt(string): Prompt đã được dùng (DALL-E 3)
Phản hồi task async
Đặtasync: true với gpt-image-2 hoặc các model hình ảnh FLUX/BFL chính thức để tạo task thay vì chờ ảnh cuối trong request tạo ảnh. Phản hồi gồm status: "pending", task_id và poll_url. Hãy poll /v1/tasks/{task_id} cho đến khi task chuyển sang completed hoặc failed.
Task ảnh async chỉ trả về URL của ảnh cuối. Nếu cần dữ liệu ảnh thô b64_json, hãy dùng request đồng bộ.
Khi tạo task, hệ thống có thể giữ trước chi phí ước tính. Task hoàn tất được tính theo mức dùng thực tế; task thất bại hoặc timeout sẽ giải phóng hoặc hoàn lại khoản giữ trước.
Dấu thời gian Unix khi tạo.
Mã định danh tác vụ duy nhất để thăm dò.
Trạng thái ban đầu:
pending.URL tương đối để thăm dò kết quả, ví dụ
/v1/tasks/{id}.Trống trong khi tác vụ đang chờ xử lý. Các tác vụ hình ảnh đã hoàn tất trả về các URL hình ảnh được tạo trong
data[].url.status: "pending", hãy dùng poll_url hoặc GET /v1/tasks/{task_id} để truy xuất kết quả.
Model Khả Dụng
| Mô hình | Loại | Tính năng |
|---|---|---|
dall-e-3 | Thường là inline | Chất lượng tốt nhất, cải thiện prompt |
dall-e-2 | Thường là inline | Nhanh hơn, chi phí thấp hơn |
flux-pro | Thường là task | Photorealistic, chất lượng cao |
flux-schnell | Thường là inline | Rất nhanh |
midjourney | Thường là task | Phong cách nghệ thuật |
ideogram-v3 | Thường là task | Xử lý chữ tốt nhất |
stable-diffusion-3 | Thường là inline | Mã nguồn mở, tuỳ biến cao |
status: "pending", hãy theo poll_url và polling đến khi hoàn tất.
Xử Lý Phản Hồi Dựa Trên Task
Với các model hình ảnh, luôn kiểm tra xem response có chứastatus: "pending" hay không: