Documentation Index
Fetch the complete documentation index at: https://docs.tokenlab.sh/llms.txt
Use this file to discover all available pages before exploring further.
Aperçu
TokenLab utilise une tarification à l’usage (pay-as-you-go). Vous ne payez que pour ce que vous utilisez, sans abonnement ni engagement minimum.Fonctionnement de la facturation
- Ajoutez des crédits à votre compte
- Utilisez l’API - les coûts sont déduits par requête
- Surveillez l’utilisation dans votre tableau de bord
- Rechargez lorsque votre solde est bas
Modèles de tarification
Tarification par Token
La plupart des modèles de génération de texte sont facturés par million de tokens :| Modèle | Entrée (par 1M de tokens) | Sortie (par 1M de tokens) |
|---|---|---|
| GPT-4o | $1.75 | $7.00 |
| GPT-4o-mini | $0.105 | $0.42 |
| Claude Opus 4.5 | $3.50 | $17.50 |
| Claude Sonnet 4.5 | $2.10 | $10.50 |
| Claude Haiku 4.5 | $0.70 | $3.50 |
| Gemini 2.5 Pro | $0.875 | $7.00 |
| Gemini 2.5 Flash | $0.1225 | $0.525 |
| DeepSeek R1 | $0.385 | $1.533 |
| DeepSeek V3.2 | $0.196 | $0.294 |
Les prix affichés sont des prix de plateforme réduits. Les prix réels peuvent varier. Consultez la page de tarification pour les tarifs actuels.
Tarification par requête
Les modèles d’image, de vidéo et d’audio sont facturés par requête :| Modèle | Prix par requête |
|---|---|
| DALL-E 3 (1024x1024) | $0.04 |
| Midjourney | $0.05 |
| Vidéo Sora (5s) | $0.20 |
| Whisper (par minute) | $0.006 |
| TTS-1 | $0.015 |
Facturation des tâches asynchrones (Vidéo/Musique/3D et certains modèles d’image)
Pour la génération basée sur des tâches, la création de la tâche peut réserver ou prélever le coût estimé. Le règlement final n’a lieu qu’une fois que la tâche asynchrone atteint un état terminal réussi lors du polling ou de la finalisation.
- Soumettez la tâche. TokenLab peut effectuer un pré-prélèvement ou une réservation estimée afin de vérifier le solde et les limites de dépense de la clé API.
- Interrogez le
poll_urlretourné, ou appelezGET /v1/tasks/{id}, jusqu’à ce que la tâche atteigne un état terminal. - Quand la tâche se termine avec succès, le règlement final enregistre l’usage et la réponse de tâche inclut
billing_transaction_id. - Si la création échoue ou si l’état terminal est failed, le montant en attente est remboursé ou libéré et la requête est marquée comme non facturable.
ID de transaction de facturation
Les réponses JSON facturables non streamées compatibles OpenAI incluentbilling_transaction_id lorsque le règlement est terminé avant la finalisation de la réponse. La même valeur est également exposée via l’en-tête X-Billing-Transaction-ID pour les intégrations navigateur et serveur. Les routes de compatibilité native, comme Gemini /v1beta, peuvent exposer la valeur uniquement via l’en-tête afin de préserver la forme native de réponse du provider. Pour les tâches média asynchrones, interrogez le poll_url retourné ou GET /v1/tasks/{id} ; la réponse de tâche inclut billing_transaction_id une fois le règlement terminé. Les réponses streamées peuvent être réglées après l’envoi du flux ; si l’en-tête est absent, utilisez les logs d’usage du dashboard pour le rapprochement.
Comptage des tokens
Les tokens sont les unités de base du traitement de texte :- ~4 caractères = 1 token (Anglais)
- ~1-2 caractères = 1 token (Chinois)
- 1 image = varie selon la taille et les détails
Estimation des tokens
Suivi de l’utilisation
Tableau de bord
Surveillez votre utilisation dans le Tableau de bord :- Solde en temps réel
- Historique d’utilisation par modèle
- Répartition des coûts
- Utilisation des clés API
Réponse de l’API
Chaque réponse inclut des informations sur l’utilisation :Optimisation des coûts
Utiliser des modèles appropriés
Utiliser des modèles appropriés
Utilisez des modèles plus petits (GPT-4o-mini, Gemini Flash) pour les tâches simples.
Implémenter la mise en cache
Implémenter la mise en cache
Mettez en cache les réponses pour les requêtes identiques répétées.
Optimiser les prompts
Optimiser les prompts
Gardez les prompts concis tout en maintenant la clarté.
Définir max_tokens
Définir max_tokens
Limitez la longueur de la réponse lorsque des réponses complètes ne sont pas nécessaires.
Utiliser le streaming pour les réponses longues
Utiliser le streaming pour les réponses longues
Le streaming ne coûte pas plus cher mais améliore la performance perçue.
Alertes de solde bas
Configurez des alertes lorsque votre solde diminue :- Allez dans Tableau de bord → Paramètres → Notifications
- Définissez votre montant seuil
- Recevez des notifications par e-mail
Ajouter des crédits
Méthodes de paiement
- Stripe (Visa, Mastercard)
Étapes
- Connectez-vous au Tableau de bord
- Cliquez sur Ajouter des crédits
- Sélectionnez le montant et la méthode de paiement
- Finalisez le paiement
Limites des clés API
Vous pouvez définir des limites de dépenses sur des clés API individuelles :- Allez dans Tableau de bord → Clés API
- Cliquez sur une clé pour la modifier
- Définissez une Limite d’utilisation
402 Payment Required.
Factures
Pour les comptes professionnels, des factures sont disponibles :- Allez dans Tableau de bord → Facturation
- Consultez l’historique des transactions
- Téléchargez les factures au format PDF