Thanh toán & Giá cả

Tổng quan

TokenLab sử dụng mô hình giá pay-as-you-go. Bạn chỉ trả tiền cho những gì bạn sử dụng, không có phí đăng ký hàng tháng hoặc cam kết tối thiểu.

Cơ chế thanh toán

Nạp tiền (credits) vào tài khoản của bạn
Sử dụng API - chi phí sẽ được trừ trên mỗi yêu cầu
Theo dõi mức sử dụng trong bảng điều khiển (dashboard) của bạn
Nạp thêm tiền khi số dư của bạn thấp

Các mô hình giá

Giá live có thể thay đổi theo provider, route và hợp đồng model. Hãy coi Dashboard, trang Models, GET /v1/models/:model/pricing và Pricing API là nguồn sự thật.

Giá theo token

Phần lớn model chat, reasoning, embedding, rerank và một số model ảnh được tính theo token đầu vào, đầu ra, cache hoặc token đầu ra ảnh.

Nhóm giá	Ví dụ	Kiểm tra giá hiện tại
Chat / Responses	`gpt-5.4`, `claude-sonnet-4-6`, `gemini-3.5-flash`	模型页或 Pricing API
嵌入 / rerank	`text-embedding-3-small`, `qwen3-vl-rerank`	模型价格详情
按 token 计费的图像	`gpt-image-2`	`GET /v1/models/gpt-image-2/pricing`

Đừng sao chép bảng giá tĩnh vào logic production. Chỉ lưu model ID trong code và kiểm tra giá hiện tại trước khi launch.

Giá theo yêu cầu và tác vụ

Model ảnh, video, nhạc, 3D, audio và world có thể tính theo request, ảnh, giây/phút, task hoặc usage đặc thù provider.

Nhóm	Ví dụ
图像	`flux-pro`, `qwen-image-plus`
视频	`veo3.1`, `seedance-2.0`
音乐	`suno-music`
3D	`tripo-h3.1`
音频	`tts-1`, `whisper-1`

Thanh toán tác vụ không đồng bộ (Video/Nhạc/3D và một số mô hình hình ảnh)

Với quy trình tạo dựa trên tác vụ, việc tạo tác vụ có thể giữ chỗ hoặc trừ trước chi phí ước tính. Việc quyết toán cuối cùng chỉ diễn ra sau khi tác vụ không đồng bộ đạt trạng thái cuối thành công trong quá trình polling hoặc finalization.

Đối với quy trình tạo dựa trên tác vụ (video, nhạc, 3D và một số mô hình hình ảnh):

Gửi tác vụ. TokenLab có thể giữ chỗ hoặc trừ trước chi phí ước tính để kiểm tra số dư và giới hạn chi tiêu của API Key.
Poll poll_url được trả về, hoặc gọi GET /v1/tasks/{id}, cho đến khi tác vụ đạt trạng thái cuối.
Khi tác vụ hoàn tất thành công, việc quyết toán cuối cùng ghi nhận usage và phản hồi tác vụ bao gồm billing_transaction_id.
Nếu tạo tác vụ thất bại hoặc trạng thái cuối là failed, khoản đang chờ sẽ được hoàn lại hoặc giải phóng và request được đánh dấu là không tính phí.

Nếu dashboard không phản ánh quyết toán hoặc hoàn tiền sau khi trạng thái cuối đã hiển thị, hãy liên hệ support@tokenlab.sh để được hỗ trợ.

# Ví dụ: billing cho tạo video
response = client.post("/v1/videos/generations", json={
    "model": "veo3.1",
    "prompt": "A sunset over the ocean"
})
# Chi phí ước tính có thể được giữ chỗ ngay; billing cuối cùng xuất hiện sau khi thành công.

poll_url = response.json()["poll_url"]
task_id = response.json()["task_id"]
# Poll poll_url để xem trạng thái; billing_transaction_id xuất hiện sau settlement.

ID giao dịch billing

Các phản hồi JSON có tính phí, không streaming và tương thích OpenAI sẽ bao gồm billing_transaction_id khi việc settlement hoàn tất trước lúc phản hồi được hoàn thiện. Cùng giá trị này cũng được expose qua header X-Billing-Transaction-ID cho tích hợp trình duyệt và server. Các route tương thích native như Gemini /v1beta có thể chỉ expose giá trị qua header để giữ nguyên hình dạng phản hồi native của provider. Với task media bất đồng bộ, hãy poll poll_url trả về hoặc GET /v1/tasks/{id}; phản hồi task sẽ có billing_transaction_id sau khi settlement hoàn tất. Phản hồi streaming có thể settlement sau khi stream đã được gửi, vì vậy nếu không có header này, hãy dùng usage logs trong dashboard để đối soát.

Đếm Token

Token là các đơn vị cơ bản của xử lý văn bản:

~4 ký tự = 1 token (Tiếng Anh)
~1-2 ký tự = 1 token (Tiếng Trung)
1 hình ảnh = thay đổi tùy theo kích thước và chi tiết

Ước tính Token

# Rough estimation
def estimate_tokens(text):
    return len(text) / 4  # Approximate for English

# Actual count (for OpenAI models)
import tiktoken
encoder = tiktoken.encoding_for_model("gpt-4o")
tokens = encoder.encode("Your text here")
print(f"Token count: {len(tokens)}")

Theo dõi mức sử dụng

Bảng điều khiển

Theo dõi mức sử dụng của bạn trong Dashboard:

Số dư thời gian thực
Lịch sử sử dụng theo mô hình
Phân tích chi phí
Mức sử dụng API key

Phản hồi API

Mỗi phản hồi bao gồm thông tin sử dụng:

{
  "usage": {
    "prompt_tokens": 50,
    "completion_tokens": 100,
    "total_tokens": 150
  }
}

Tối ưu hóa chi phí

Sử dụng mô hình phù hợp

Sử dụng các mô hình nhỏ hơn (GPT-4o-mini, Gemini Flash) cho các tác vụ đơn giản.

Triển khai bộ nhớ đệm

Lưu bộ nhớ đệm (cache) các phản hồi cho các yêu cầu giống hệt nhau được lặp lại.

Tối ưu hóa prompt

Giữ cho prompt ngắn gọn trong khi vẫn duy trì sự rõ ràng.

Thiết lập max_tokens

Giới hạn độ dài phản hồi khi không cần phản hồi đầy đủ.

Sử dụng streaming cho các phản hồi dài

Streaming không tốn thêm phí nhưng cải thiện hiệu suất cảm nhận được.

Cảnh báo số dư thấp

Cấu hình cảnh báo khi số dư của bạn giảm xuống:

Đi tới Dashboard → Settings → Notifications
Thiết lập số tiền ngưỡng của bạn
Nhận thông báo qua email

Nạp tiền

Phương thức thanh toán

Stripe (Visa, Mastercard)

Các bước thực hiện

Đăng nhập vào Dashboard
Nhấp vào Add Credits
Chọn số tiền và phương thức thanh toán
Hoàn tất thanh toán

Tiền sẽ được cộng vào tài khoản ngay lập tức sau khi xác nhận thanh toán.

Giới hạn API Key

Bạn có thể thiết lập giới hạn chi tiêu cho từng API Key riêng lẻ:

Đi tới Dashboard → API Keys
Nhấp vào một key để chỉnh sửa
Thiết lập Usage Limit

Khi đạt đến giới hạn, các yêu cầu với key đó sẽ trả về lỗi 402 Payment Required.

Hóa đơn

Đối với tài khoản doanh nghiệp, hóa đơn luôn có sẵn:

Đi tới Dashboard → Billing
Xem lịch sử giao dịch
Tải hóa đơn dưới dạng PDF

Câu hỏi?

Liên hệ support@tokenlab.sh cho các thắc mắc về thanh toán.

​Tổng quan

​Cơ chế thanh toán

​Các mô hình giá

​Giá theo token

​Giá theo yêu cầu và tác vụ

​Thanh toán tác vụ không đồng bộ (Video/Nhạc/3D và một số mô hình hình ảnh)

​ID giao dịch billing

​Đếm Token

​Ước tính Token

​Theo dõi mức sử dụng

​Bảng điều khiển

​Phản hồi API

​Tối ưu hóa chi phí

​Cảnh báo số dư thấp

​Nạp tiền

​Phương thức thanh toán

​Các bước thực hiện

​Giới hạn API Key

​Hóa đơn

​Câu hỏi?

Tổng quan

Cơ chế thanh toán

Các mô hình giá

Giá theo token

Giá theo yêu cầu và tác vụ

Thanh toán tác vụ không đồng bộ (Video/Nhạc/3D và một số mô hình hình ảnh)

ID giao dịch billing

Đếm Token

Ước tính Token

Theo dõi mức sử dụng

Bảng điều khiển

Phản hồi API

Tối ưu hóa chi phí

Cảnh báo số dư thấp

Nạp tiền

Phương thức thanh toán

Các bước thực hiện

Giới hạn API Key

Hóa đơn

Câu hỏi?