Pilih Rute
| Kebutuhan | Rute | Gunakan bentuk ini |
|---|---|---|
| Respon objek JSON portabel | /v1/chat/completions | response_format: {"type": "json_object"} |
| Panggilan fungsi yang kompatibel dengan OpenAI | /v1/chat/completions | tools: [{ "type": "function", "function": ... }] |
| Alat Respon OpenAI | /v1/responses | Bidang tools, tool_choice, dan text |
| Penggunaan alat atau pemikiran asli Claude | /v1/messages | Skema alat Pesan Anthropic |
| Deklarasi fungsi Gemini atau alat bawaan | /v1beta/models/:model:generateContent | tools dan bagian konten asli Gemini |
Mode JSON
Untuk respon terstruktur yang portabel, mulai dengan mode JSON Chat Completions:text dan json_object. json_schema, strict, dan penegakan skema spesifik penyedia mungkin ada untuk beberapa rute hulu atau jalur konversi, tetapi mereka bukan janji umum di setiap rute dan model TokenLab. Verifikasi mereka terhadap model yang dipilih sebelum mengandalkannya.
Selalu analisis dan validasi JSON yang dikembalikan di server Anda. Mode JSON meningkatkan bentuk, tetapi tidak menggantikan validasi skema tingkat aplikasi.
Loop Panggilan Alat
TokenLab tidak mengeksekusi fungsi Anda. Aplikasi Anda memiliki loop:- Kirim pesan ditambah definisi alat.
- Baca respon model untuk
tool_calls,function_call,tool_useAnthropic, atau bagian panggilan fungsi Gemini. - Eksekusi alat di backend Anda sendiri.
- Tambahkan hasil alat dalam format yang diperlukan oleh rute yang sama.
- Lanjutkan percakapan sampai model mengembalikan jawaban akhir.
Contoh Chat Completions
Desain Skema
- Pertahankan skema kecil dan eksplisit. Skema bersarang besar menambah token dan mengurangi keandalan.
- Utamakan bidang yang diperlukan untuk nilai yang tidak dapat dilanjutkan produk Anda tanpa itu.
- Gunakan enum untuk set tertutup yang bergantung pada UI atau backend Anda.
- Sertakan contoh dalam prompt ketika model kesulitan dengan bentuk.
- Perlakukan kesalahan bidang yang tidak didukung sebagai umpan balik kontrak. Hapus bidang tersebut atau gunakan rute asli yang mendokumentasikannya.
Daftar Periksa Produksi
- Catat rute, model, nama alat, dan bentuk skema yang telah disanitasi dalam log.
- Validasi argumen alat sebelum mengeksekusi efek samping apa pun.
- Terapkan pemeriksaan izin Anda sendiri sebelum eksekusi alat.
- Buat eksekusi alat idempotent ketika klien mencoba ulang dapat mengulangi panggilan alat yang sama.
- Jangan catat rahasia yang dikembalikan oleh alat ke dalam pesan yang terlihat oleh model.
Referensi API
| Topik | Referensi |
|---|---|
| API Multi-Format | API Multi-Format |
| Buat Chat Completion | Buat Chat Completion |
| Buat Respon | Buat Respon |
| Buat Pesan | Buat Pesan |
| Hasilkan Konten Gemini | Hasilkan Konten Gemini |