Documentation Index
Fetch the complete documentation index at: https://docs.tokenlab.sh/llms.txt
Use this file to discover all available pages before exploring further.
Tổng quan
Endpoint này cung cấp khả năng tương thích gốc với Anthropic Messages API. Hãy sử dụng endpoint này cho các model Claude với các tính năng như extended thinking. Endpoint này giữ nguyên hợp đồng native của Anthropic.messages phải là mảng tin nhắn user / assistant, system nằm ở field cấp cao nhất system, và max_tokens là bắt buộc. Nếu payload dùng role kiểu OpenAI như system, developer, hoặc tool bên trong messages, hãy gửi sang /v1/chat/completions.
Base URL cho Anthropic SDK:
https://api.tokenlab.sh (không có hậu tố /v1)Header của Request
API key TokenLab của bạn. Phương án thay thế cho Bearer token.
Phiên bản Anthropic API. Sử dụng
2023-06-01.Body của Request
ID model Claude (ví dụ:
claude-sonnet-4-6 hoặc claude-opus-4-6).Mảng các object tin nhắn với
role và content.Số lượng token tối đa để tạo.
System prompt (tách biệt với mảng messages).
Nhiệt độ lấy mẫu (0-1).
Bật phản hồi dạng streaming.
Cấu hình extended thinking (Claude Opus 4.5).
type(string):"enabled"để bậtbudget_tokens(integer): Ngân sách token cho thinking
Các công cụ khả dụng cho model.
Cách model nên sử dụng công cụ. Các tùy chọn:
auto, any, tool (công cụ cụ thể).Tham số nucleus sampling. Chỉ dùng temperature hoặc top_p, không dùng cả hai.
Chỉ lấy mẫu từ K lựa chọn hàng đầu cho mỗi token.
Các chuỗi dừng tùy chỉnh sẽ khiến model ngừng tạo.
Metadata được đính kèm vào request nhằm mục đích theo dõi.
Phản hồi
Định danh duy nhất của tin nhắn.
Luôn là
message.Luôn là
assistant.Mảng các khối nội dung (text, thinking, tool_use).
Model được sử dụng.
Lý do việc tạo nội dung dừng lại (
end_turn, max_tokens, tool_use).Mức sử dụng token với
input_tokens và output_tokens.Ví dụ đầu vào thị giác
Với các mô hình Claude có hỗ trợ thị giác, hãy đặt hình ảnh bên trongmessages[].content dưới dạng các khối ảnh có cấu trúc.