Facturation et Tarification

Aperçu

TokenLab utilise une tarification à l’usage (pay-as-you-go). Vous ne payez que pour ce que vous utilisez, sans abonnement ni engagement minimum.

Fonctionnement de la facturation

Ajoutez des crédits à votre compte
Utilisez l’API - les coûts sont déduits par requête
Surveillez l’utilisation dans votre tableau de bord
Rechargez lorsque votre solde est bas

Modèles de tarification

Les prix en direct peuvent changer selon les fournisseurs, routes et détails du modèle. Le Dashboard, la page Modèles, GET /v1/models/:model/pricing et la Pricing API font foi.

Tarification par token

La plupart des modèles chat, raisonnement, embedding, rerank et certains modèles image sont facturés selon les tokens d’entrée, de sortie, de cache ou de sortie image.

Famille de prix	Exemples	Vérifier le prix actuel
Chat / Responses	`gpt-5.4`, `claude-sonnet-4-6`, `gemini-3.5-flash`	模型页或 Pricing API
嵌入 / rerank	`text-embedding-3-small`, `qwen3-vl-rerank`	模型价格详情
按 token 计费的图像	`gpt-image-2`	`GET /v1/models/gpt-image-2/pricing`

Ne copiez pas de tableaux de prix statiques dans la logique de production. Gardez seulement les IDs de modèle dans le code et vérifiez les prix avant le lancement.

Tarification par requête et tâche

Les modèles image, vidéo, musique, 3D, audio et world peuvent être facturés par requête, image, seconde/minute, tâche ou usage propre au fournisseur.

Famille	Exemples
图像	`flux-pro`, `qwen-image-plus`
视频	`veo3.1`, `seedance-2.0`
音乐	`suno-music`
3D	`tripo-h3.1`
音频	`tts-1`, `whisper-1`

Facturation des tâches asynchrones (Vidéo/Musique/3D et certains modèles d’image)

Pour la génération basée sur des tâches, la création de la tâche peut réserver ou prélever le coût estimé. Le règlement final n’a lieu qu’une fois que la tâche asynchrone atteint un état terminal réussi lors du polling ou de la finalisation.

Pour les flux de génération basés sur des tâches (vidéo, musique, 3D et certains modèles d’image) :

Soumettez la tâche. TokenLab peut effectuer un pré-prélèvement ou une réservation estimée afin de vérifier le solde et les limites de dépense de la clé API.
Interrogez le poll_url retourné, ou appelez GET /v1/tasks/{id}, jusqu’à ce que la tâche atteigne un état terminal.
Quand la tâche se termine avec succès, le règlement final enregistre l’usage et la réponse de tâche inclut billing_transaction_id.
Si la création échoue ou si l’état terminal est failed, le montant en attente est remboursé ou libéré et la requête est marquée comme non facturable.

Si le dashboard ne reflète pas le règlement ou le remboursement après l’apparition de l’état terminal, contactez support@tokenlab.sh.

# Exemple : Facturation de génération vidéo
response = client.post("/v1/videos/generations", json={
    "model": "veo3.1",
    "prompt": "A sunset over the ocean"
})
# Le coût estimé peut être réservé maintenant ; la facturation finale apparaît après succès.

poll_url = response.json()["poll_url"]
task_id = response.json()["task_id"]
# Interrogez poll_url pour le statut ; billing_transaction_id apparaît après règlement.

ID de transaction de facturation

Les réponses JSON facturables non streamées compatibles OpenAI incluent billing_transaction_id lorsque le règlement est terminé avant la finalisation de la réponse. La même valeur est également exposée via l’en-tête X-Billing-Transaction-ID pour les intégrations navigateur et serveur. Les routes de compatibilité native, comme Gemini /v1beta, peuvent exposer la valeur uniquement via l’en-tête afin de préserver la forme native de réponse du provider. Pour les tâches média asynchrones, interrogez le poll_url retourné ou GET /v1/tasks/{id} ; la réponse de tâche inclut billing_transaction_id une fois le règlement terminé. Les réponses streamées peuvent être réglées après l’envoi du flux ; si l’en-tête est absent, utilisez les logs d’usage du dashboard pour le rapprochement.

Comptage des tokens

Les tokens sont les unités de base du traitement de texte :

~4 caractères = 1 token (Anglais)
~1-2 caractères = 1 token (Chinois)
1 image = varie selon la taille et les détails

Estimation des tokens

# Estimation approximative
def estimate_tokens(text):
    return len(text) / 4  # Approximatif pour l'anglais

# Comptage réel (pour les modèles OpenAI)
import tiktoken
encoder = tiktoken.encoding_for_model("gpt-4o")
tokens = encoder.encode("Votre texte ici")
print(f"Nombre de tokens : {len(tokens)}")

Suivi de l’utilisation

Tableau de bord

Surveillez votre utilisation dans le Tableau de bord :

Solde en temps réel
Historique d’utilisation par modèle
Répartition des coûts
Utilisation des clés API

Réponse de l’API

Chaque réponse inclut des informations sur l’utilisation :

{
  "usage": {
    "prompt_tokens": 50,
    "completion_tokens": 100,
    "total_tokens": 150
  }
}

Optimisation des coûts

Utiliser des modèles appropriés

Utilisez des modèles plus petits (GPT-4o-mini, Gemini Flash) pour les tâches simples.

Implémenter la mise en cache

Mettez en cache les réponses pour les requêtes identiques répétées.

Optimiser les prompts

Gardez les prompts concis tout en maintenant la clarté.

Définir max_tokens

Limitez la longueur de la réponse lorsque des réponses complètes ne sont pas nécessaires.

Utiliser le streaming pour les réponses longues

Le streaming ne coûte pas plus cher mais améliore la performance perçue.

Alertes de solde bas

Configurez des alertes lorsque votre solde diminue :

Allez dans Tableau de bord → Paramètres → Notifications
Définissez votre montant seuil
Recevez des notifications par e-mail

Ajouter des crédits

Méthodes de paiement

Stripe (Visa, Mastercard)

Étapes

Connectez-vous au Tableau de bord
Cliquez sur Ajouter des crédits
Sélectionnez le montant et la méthode de paiement
Finalisez le paiement

Les crédits sont ajoutés instantanément après la confirmation du paiement.

Limites des clés API

Vous pouvez définir des limites de dépenses sur des clés API individuelles :

Allez dans Tableau de bord → Clés API
Cliquez sur une clé pour la modifier
Définissez une Limite d’utilisation

Lorsque la limite est atteinte, les requêtes avec cette clé renverront 402 Payment Required.

Factures

Pour les comptes professionnels, des factures sont disponibles :

Allez dans Tableau de bord → Facturation
Consultez l’historique des transactions
Téléchargez les factures au format PDF

Des questions ?

Contactez support@tokenlab.sh pour toute demande concernant la facturation.

​Aperçu

​Fonctionnement de la facturation

​Modèles de tarification

​Tarification par token

​Tarification par requête et tâche

​Facturation des tâches asynchrones (Vidéo/Musique/3D et certains modèles d’image)

​ID de transaction de facturation

​Comptage des tokens

​Estimation des tokens

​Suivi de l’utilisation

​Tableau de bord

​Réponse de l’API

​Optimisation des coûts

​Alertes de solde bas

​Ajouter des crédits

​Méthodes de paiement

​Étapes

​Limites des clés API

​Factures

​Des questions ?

Aperçu

Fonctionnement de la facturation

Modèles de tarification

Tarification par token

Tarification par requête et tâche

Facturation des tâches asynchrones (Vidéo/Musique/3D et certains modèles d’image)

ID de transaction de facturation

Comptage des tokens

Estimation des tokens

Suivi de l’utilisation

Tableau de bord

Réponse de l’API

Optimisation des coûts

Alertes de solde bas

Ajouter des crédits

Méthodes de paiement

Étapes

Limites des clés API

Factures

Des questions ?