Facturación y Precios

Resumen

TokenLab utiliza un modelo de precios de pago por uso. Solo paga por lo que utiliza, sin suscripciones ni compromisos mínimos.

Cómo funciona la facturación

Añada créditos a su cuenta
Use la API - los costes se deducen por solicitud
Monitoree el uso en su panel de control
Recargue cuando su saldo sea bajo

Modelos de precios

Los precios en vivo pueden cambiar según proveedores, rutas y détails du modèle. Usa el Dashboard, la página de modelos, GET /v1/models/:model/pricing y la Pricing API como referencia actual.

Precios basados en tokens

La mayoría de modelos de chat, razonamiento, embedding, rerank y algunos de imagen se cobran por tokens de entrada, salida, cache o salida de imagen.

Familia de precio	Ejemplos	Verificar precio actual
Chat / Responses	`gpt-5.4`, `claude-sonnet-4-6`, `gemini-3.5-flash`	模型页或 Pricing API
嵌入 / rerank	`text-embedding-3-small`, `qwen3-vl-rerank`	模型价格详情
按 token 计费的图像	`gpt-image-2`	`GET /v1/models/gpt-image-2/pricing`

No copies tablas de precios estáticas en lógica de producción. Guarda solo IDs de modelo en código y revisa precios antes del lanzamiento.

Precios por solicitud y tarea

Los modelos de imagen, video, música, 3D, audio y world pueden cobrarse por solicitud, imagen, segundo/minuto, tarea o uso específico del proveedor.

Familia	Ejemplos
图像	`flux-pro`, `qwen-image-plus`
视频	`veo3.1`, `seedance-2.0`
音乐	`suno-music`
3D	`tripo-h3.1`
音频	`tts-1`, `whisper-1`

Facturación de tareas asíncronas (Vídeo/Música/3D y algunos modelos de imagen)

En la generación basada en tareas, crear la tarea puede reservar o predescontar el coste estimado. La liquidación final solo ocurre después de que la tarea asíncrona alcance un estado terminal exitoso durante el polling o la finalización.

Para flujos de generación basados en tareas (vídeo, música, 3D y algunos modelos de imagen):

Envía la tarea. TokenLab puede aplicar una reserva o predescuento estimado para verificar el saldo y los límites de gasto de la API Key.
Consulta la poll_url devuelta, o llama a GET /v1/tasks/{id}, hasta que la tarea alcance un estado terminal.
Cuando la tarea se completa correctamente, la liquidación final registra el uso y la respuesta de la tarea incluye billing_transaction_id.
Si la creación falla o el estado terminal es failed, el importe pendiente se reembolsa o libera y la solicitud se marca como no facturable.

Si el dashboard no refleja la liquidación o el reembolso después de que el estado terminal sea visible, contacta con support@tokenlab.sh.

# Ejemplo: Facturación de generación de vídeo
response = client.post("/v1/videos/generations", json={
    "model": "veo3.1",
    "prompt": "A sunset over the ocean"
})
# El coste estimado puede reservarse ahora; la facturación final aparece después del éxito.

poll_url = response.json()["poll_url"]
task_id = response.json()["task_id"]
# Consulta poll_url para ver el estado; billing_transaction_id aparece tras la liquidación.

ID de transacción de facturación

Las respuestas JSON facturables, no streaming y compatibles con OpenAI incluyen billing_transaction_id cuando la liquidación se completa antes de finalizar la respuesta. El mismo valor también se expone en el header X-Billing-Transaction-ID, para integraciones en navegador y servidor. Las rutas de compatibilidad nativa, como Gemini /v1beta, pueden exponer el valor solo por header para conservar la forma nativa de respuesta del proveedor. Para tareas multimedia asíncronas, consulta el poll_url devuelto o GET /v1/tasks/{id}; la respuesta de la tarea incluye billing_transaction_id cuando la liquidación termina. Las respuestas streaming pueden liquidarse después de que el stream ya fue enviado; si el header no está presente, usa los logs de uso del dashboard para reconciliación.

Conteo de tokens

Los tokens son las unidades básicas del procesamiento de texto:

~4 caracteres = 1 token (Inglés)
~1-2 caracteres = 1 token (Chino)
1 imagen = varía según el tamaño y el detalle

Estimación de tokens

# Estimación aproximada
def estimate_tokens(text):
    return len(text) / 4  # Aproximado para inglés

# Conteo real (para modelos de OpenAI)
import tiktoken
encoder = tiktoken.encoding_for_model("gpt-4o")
tokens = encoder.encode("Your text here")
print(f"Token count: {len(tokens)}")

Seguimiento de uso

Panel de control

Monitoree su uso en el Panel de control:

Saldo en tiempo real
Historial de uso por modelo
Desglose de costes
Uso de claves API

Respuesta de la API

Cada respuesta incluye información de uso:

{
  "usage": {
    "prompt_tokens": 50,
    "completion_tokens": 100,
    "total_tokens": 150
  }
}

Optimización de costes

Use modelos adecuados

Utilice modelos más pequeños (GPT-4o-mini, Gemini Flash) para tareas sencillas.

Implemente el almacenamiento en caché

Almacene en caché las respuestas para solicitudes idénticas repetidas.

Optimice los prompts

Mantenga los prompts concisos manteniendo la claridad.

Establezca max_tokens

Limite la longitud de la respuesta cuando no se necesiten respuestas completas.

Use streaming para respuestas largas

El streaming no tiene un coste adicional pero mejora el rendimiento percibido.

Alertas de saldo bajo

Configure alertas para cuando su saldo disminuya:

Vaya a Panel de control → Configuración → Notificaciones
Establezca su cantidad de umbral
Reciba notificaciones por correo electrónico

Añadir créditos

Métodos de pago

Stripe (Visa, Mastercard)

Pasos

Inicie sesión en el Panel de control
Haga clic en Añadir créditos
Seleccione la cantidad y el método de pago
Complete el pago

Los créditos se añaden instantáneamente tras la confirmación del pago.

Límites de claves API

Puede establecer límites de gasto en claves API individuales:

Vaya a Panel de control → Claves API
Haga clic en una clave para editarla
Establezca el Límite de uso

Cuando se alcance el límite, las solicitudes con esa clave devolverán 402 Payment Required.

Facturas

Para cuentas de empresa, las facturas están disponibles:

Vaya a Panel de control → Facturación
Vea el historial de transacciones
Descargue las facturas como PDF

¿Preguntas?

Póngase en contacto con support@tokenlab.sh para consultas de facturación.

​Resumen

​Cómo funciona la facturación

​Modelos de precios

​Precios basados en tokens

​Precios por solicitud y tarea

​Facturación de tareas asíncronas (Vídeo/Música/3D y algunos modelos de imagen)

​ID de transacción de facturación

​Conteo de tokens

​Estimación de tokens

​Seguimiento de uso

​Panel de control

​Respuesta de la API

​Optimización de costes

​Alertas de saldo bajo

​Añadir créditos

​Métodos de pago

​Pasos

​Límites de claves API

​Facturas

​¿Preguntas?

Resumen

Cómo funciona la facturación

Modelos de precios

Precios basados en tokens

Precios por solicitud y tarea

Facturación de tareas asíncronas (Vídeo/Música/3D y algunos modelos de imagen)

ID de transacción de facturación

Conteo de tokens

Estimación de tokens

Seguimiento de uso

Panel de control

Respuesta de la API

Optimización de costes

Alertas de saldo bajo

Añadir créditos

Métodos de pago

Pasos

Límites de claves API

Facturas

¿Preguntas?