just-use-nan.
ES / EN
· v1.0 · LIVE
INFRAESTRUCTURA / inferencia a coste fijo / sin contador de tokens

DEJA DE PAGAR
POR TOKEN POR
MODELOS QUE
NO SON
TUYOS

Cada llamada a la API es una tragaperras. Tu bucle de reintentos. Tu agente desbocado a las 3 de la mañana. Tu usuario pegándole 400 veces al mismo endpoint por un bug. Todo medido. Todo facturado. Todo apilándose en una factura escrita por alguien que gana dinero cuando tu código se equivoca.

// 01_PROBLEM

El problema.

comparativa · contador vs coste fijo

El billing por token está diseñado para ser imprevisible a propósito. Cuanto mejor funciona tu producto, más pagas. Cuanto mejores son tus prompts, más largos se vuelven. El éxito es el castigo.

APIs cerradas · pago por token NaN · 70€/mes fijos
× un bucle con bug te despierta con una factura de 2.000$ ✓ quema todos los tokens que quieras · la factura no se mueve
× rate limits ahogando producción a las 3 de la mañana ✓ cluster compartido dimensionado para builders que envían
× prompts registrados, almacenados, usados para entrenar ✓ zero logs · tus prompts no salen de tu sesión
× subidas de precio sin negociación posible ✓ mismo precio el mes que viene · y el año que viene
× los pesos del modelo son secretos ✓ Qwen, Gemma, DeepSeek · pesos públicos · audita lo que quieras
× depreciaciones de modelo cuando les apetece ✓ modelos votados por la comunidad cada trimestre
× capas a tus propios usuarios para proteger tu margen ✓ envía el producto que querías enviar de verdad
× el coste del lock-in supera al de migrar cada año ✓ API compatible con OpenAI · cambias base_url y fuera
// 02_NUMBERS

Los números.

recibos · 100% verificados
€70
96GB
0
// 03_THESIS

La tesis.

manifiesto · uno por página
+ + + +
LOS MODELOS ABIERTOS YA SONLO BASTANTE BUENOS. LAS GPUSEXISTEN. EL STACK ESTÁ RESUELTO.SIGUES PAGANDO POR TOKENPORQUE NADIE TE HA DICHOQUE PUEDES PARAR.
// 04_LOSS

Lo que te cuesta el billing por token.

6 categorías · auditoría honesta
// PREDICTABLE COSTS
Una tarifa fija te deja planificar, fijar precios y dormir. Con billing por token cada demo day, cada tweet viral, cada usuario agresivo es un evento financiero. Dejas de construir features porque no puedes modelar el coste.
// PRODUCT VELOCITY
El contador castiga la iteración. ¿Contexto largo? Caro. ¿Tool calls en bucle? Caro. ¿Modelos de razonamiento pensando en voz alta? Carísimo. Envías productos peores porque la versión buena cuesta demasiado de probar.
// USER EXPERIENCE
Tier gratis con 10 mensajes. Tier pro con 200. ¿Por qué? No porque el modelo no aguante más. Porque tu margen no aguanta. Tus usuarios lo notan. Se van. El cap nunca fue por ellos, fue por ti.
// DATA SOVEREIGNTY
Cada prompt que mandas se convierte en su señal de entrenamiento. Las queries de tus competidores. Los secretos de tus clientes. Su próximo modelo. Tu responsabilidad legal. Leer los ToS no lo hace desaparecer. Solo lo confirma.
// MODEL CHOICE
Los modelos abiertos como Qwen, Gemma, DeepSeek, Llama han cerrado la brecha. Están dentro del cluster. No tienes que esperar a que un lab cerrado libere la versión que ya está en Hugging Face. El futuro es abierto y ya llegó.
// EXIT VELOCITY
NaN habla la API de OpenAI. Si algún día quieres irte, cambias un base_url y estás fuera. Sin SDK propietario, sin endpoints custom, sin lock-in. El coste de cambiar es una línea de código. Ese es el trato.
// 05_CODE

Es literalmente una línea.

código · diff real

Deja de fingir que migrar es difícil. NaN expone una API compatible con OpenAI. Si tu código ya llama a OpenAI, este es el diff entero:

$ closed API · metered
client = OpenAI(
  api_key="sk-..."
)

response = client.chat.completions.create(
  model="gpt-4o",
  messages=your_data
)
# meter spinning · invoice growing
$ NaN · flat rate
client = OpenAI(
  api_key="sk-...",
  base_url="https://nan.builders/v1"
)

response = client.chat.completions.create(
  model="qwen3.6",
  messages=your_data
)
# €70/month · meter never started
// 06_RECEIPTS

Sus páginas de pricing dicen esto.

citas directas · textuales
"PRECIO POR 1M DE TOKENS DE INPUT" // "OUTPUT TOKENS FACTURADOS APARTE" // "INPUT CACHEADO A OTRA TARIFA" // "LOS REASONING TOKENS CUENTAN COMO OUTPUT" // "RATE LIMITS SEGÚN TIER" // "PRECIOS SUJETOS A CAMBIO" // "PODEMOS USAR TU USO PARA MEJORAR NUESTROS MODELOS" // "EXCESOS FACTURADOS AL FINAL DEL CICLO"
// 07_CTA

Just use NaN.

despliegue · inmediato

70€ al mes. GPU compartida. Modelos abiertos. Sin contador de tokens. Sin facturas sorpresa. Sin prompts logueados. Lo único que se interpone entre tú y una factura de IA predecible es la decisión de dejar de alimentar el contador.

tarifa fija
modelos abiertos
zero logs
sin contador