just-use-nan | Inferencia GPU a tarifa fija, modelos abiertos, sin contador de tokens

// 01_PROBLEM

El problema.

comparativa · contador vs coste fijo

El billing por token está diseñado para ser imprevisible a propósito. Cuanto mejor funciona tu producto, más pagas. Cuanto mejores son tus prompts, más largos se vuelven. El éxito es el castigo.

APIs cerradas · pago por token NaN · 70€/mes fijos

× un bucle con bug te despierta con una factura de 2.000$ ✓ quema todos los tokens que quieras · la factura no se mueve

× rate limits ahogando producción a las 3 de la mañana ✓ cluster compartido dimensionado para builders que envían

× prompts registrados, almacenados, usados para entrenar ✓ zero logs · tus prompts no salen de tu sesión

× subidas de precio sin negociación posible ✓ mismo precio el mes que viene · y el año que viene

× los pesos del modelo son secretos ✓ Qwen, Gemma, DeepSeek · pesos públicos · audita lo que quieras

× depreciaciones de modelo cuando les apetece ✓ modelos votados por la comunidad cada trimestre

× capas a tus propios usuarios para proteger tu margen ✓ envía el producto que querías enviar de verdad

× el coste del lock-in supera al de migrar cada año ✓ API compatible con OpenAI · cambias base_url y fuera

// 02_NUMBERS

Los números.

recibos · 100% verificados

€70

96GB

// 03_THESIS

La tesis.

manifiesto · uno por página

+ + + +

LOS MODELOS ABIERTOS YA SONLO BASTANTE BUENOS. LAS GPUSEXISTEN. EL STACK ESTÁ RESUELTO.SIGUES PAGANDO POR TOKENPORQUE NADIE TE HA DICHOQUE PUEDES PARAR.

// 04_LOSS

Lo que te cuesta el billing por token.

6 categorías · auditoría honesta

// PREDICTABLE COSTS

Una tarifa fija te deja planificar, fijar precios y dormir. Con billing por token cada demo day, cada tweet viral, cada usuario agresivo es un evento financiero. Dejas de construir features porque no puedes modelar el coste.

// PRODUCT VELOCITY

El contador castiga la iteración. ¿Contexto largo? Caro. ¿Tool calls en bucle? Caro. ¿Modelos de razonamiento pensando en voz alta? Carísimo. Envías productos peores porque la versión buena cuesta demasiado de probar.

// USER EXPERIENCE

Tier gratis con 10 mensajes. Tier pro con 200. ¿Por qué? No porque el modelo no aguante más. Porque tu margen no aguanta. Tus usuarios lo notan. Se van. El cap nunca fue por ellos, fue por ti.

// DATA SOVEREIGNTY

Cada prompt que mandas se convierte en su señal de entrenamiento. Las queries de tus competidores. Los secretos de tus clientes. Su próximo modelo. Tu responsabilidad legal. Leer los ToS no lo hace desaparecer. Solo lo confirma.

// MODEL CHOICE

Los modelos abiertos como Qwen, Gemma, DeepSeek, Llama han cerrado la brecha. Están dentro del cluster. No tienes que esperar a que un lab cerrado libere la versión que ya está en Hugging Face. El futuro es abierto y ya llegó.

// EXIT VELOCITY

NaN habla la API de OpenAI. Si algún día quieres irte, cambias un base_url y estás fuera. Sin SDK propietario, sin endpoints custom, sin lock-in. El coste de cambiar es una línea de código. Ese es el trato.

// 05_CODE

Es literalmente una línea.

código · diff real

Deja de fingir que migrar es difícil. NaN expone una API compatible con OpenAI. Si tu código ya llama a OpenAI, este es el diff entero:

$ closed API · metered

client = OpenAI(

  api_key="sk-..."

)
 
response = client.chat.completions.create(

  model="gpt-4o",

  messages=your_data

)
 # meter spinning · invoice growing

$ NaN · flat rate

client = OpenAI(

  api_key="sk-...",

  base_url="https://nan.builders/v1"

)
 
response = client.chat.completions.create(

  model="qwen3.6",

  messages=your_data

)
 # €70/month · meter never started

// 06_RECEIPTS

Sus páginas de pricing dicen esto.

citas directas · textuales

"PRECIO POR 1M DE TOKENS DE INPUT" // "OUTPUT TOKENS FACTURADOS APARTE" // "INPUT CACHEADO A OTRA TARIFA" // "LOS REASONING TOKENS CUENTAN COMO OUTPUT" // "RATE LIMITS SEGÚN TIER" // "PRECIOS SUJETOS A CAMBIO" // "PODEMOS USAR TU USO PARA MEJORAR NUESTROS MODELOS" // "EXCESOS FACTURADOS AL FINAL DEL CICLO"

DEJA DE PAGAR
POR TOKEN POR
MODELOS QUE
NO SON
TUYOS

El problema.

Los números.

La tesis.

Lo que te cuesta el billing por token.

Es literalmente una línea.

Sus páginas de pricing dicen esto.

Just use NaN.

DEJA DE PAGARPOR TOKEN PORMODELOS QUENO SONTUYOS

El problema.

Los números.

La tesis.

Lo que te cuesta el billing por token.

Es literalmente una línea.

Sus páginas de pricing dicen esto.

Just use NaN.

DEJA DE PAGAR
POR TOKEN POR
MODELOS QUE
NO SON
TUYOS