The Responses API adalah API percakapan stateful terbaru dari OpenAI. TokenLab mendukung format ini sebagai jalur opsional lanjutan untuk model yang kompatibel; gunakanDocumentation Index
Fetch the complete documentation index at: https://docs.tokenlab.sh/llms.txt
Use this file to discover all available pages before exploring further.
POST /v1/chat/completions sebagai jalur default yang kompatibel dengan OpenAI kecuali Anda secara eksplisit memerlukan perilaku khusus Responses.
Isi Permintaan
Daftar item input yang membentuk percakapan.Setiap item dapat berupa:
message: Sebuah pesan percakapan dengan role dan contentfunction_call: Permintaan pemanggilan fungsifunction_call_output: Output dari pemanggilan fungsi
message.content dapat berupa string biasa atau array blok konten. Untuk model yang mendukung gambar seperti varian GPT-5.4, kirim gambar sebagai blok input_image alih-alih menyematkan URL atau string Base64 langsung ke dalam teks biasa.Contoh blok konten:{ "type": "input_text", "text": "Describe this image" }{ "type": "input_image", "image_url": "https://example.com/image.jpg" }{ "type": "input_image", "image_url": "data:image/png;base64,..." }
Instruksi sistem untuk model (setara dengan pesan sistem).
Jumlah maksimum token yang akan dihasilkan.
Sampling temperature antara 0 dan 2.
Daftar tools yang mungkin dipanggil oleh model.Untuk tool hosted
image_generation yang memakai model tool gambar default atau secara eksplisit menyetel model: "gpt-image-2", TokenLab menghapus input_fidelity yang tidak didukung sebelum meneruskan request karena GPT Image 2 sudah memperlakukan input gambar sebagai high fidelity. Jangan kirim background: "transparent" untuk tool ini; TokenLab tidak menghapusnya diam-diam karena itu mengubah semantik output.Jika true, mengembalikan aliran events.
ID dari respons sebelumnya untuk melanjutkan percakapan.
Menentukan apakah respons disimpan untuk pengambilan nanti.
Metadata yang dilampirkan pada respons untuk keperluan pelacakan.
Opsi konfigurasi untuk generasi teks. Perilaku
text.format bergantung pada model dan jalur yang dipilih; tidak dijamin seragam di setiap model.Menentukan apakah memperbolehkan beberapa pemanggilan tool secara paralel.
Parameter nucleus sampling (0-1).
Konfigurasi reasoning untuk model yang mendukung reasoning seperti varian keluarga GPT-5.
effort(string): Tingkat usaha reasoning (low,medium,high)
Respons
Identifier unik untuk respons.
Selalu
response.Timestamp Unix saat respons dibuat.
Daftar item output yang dihasilkan oleh model.
Statistik penggunaan token.