Ir al contenido

Modelos de IA

Un solo punto de acceso

Todo el acceso al LLM pasa por core/aiuda_core/engine/llm.py (ClaudeRunner): complete() para redacción, classify() para triage, run_tool_loop() para el loop agéntico con gates de aprobación. Ningún otro módulo importa el SDK del proveedor. Esa decisión es deliberada: el runtime es pluggable por diseño.

Modelos por tarea

Tarea	Variable	Default	Por qué
Triage: clasificar respuestas, mapear columnas de Excel	`MODEL_TRIAGE`	`claude-haiku-4-5`	Barato y suficiente
Redacción y conversación con clientes	`MODEL_REDACCION`	`claude-sonnet-4-6`	El mejor en español e instrucciones complejas

El modelo se elige en código, por tarea — no es una preferencia global. Un mes de cobranza activa típica cuesta centavos de dólar, y cada token queda registrado por tenant en usage_events.

La postura anti lock-in

Anthropic es la implementación de referencia (y la que usa aiuda Cloud). Pero un proyecto open source serio no puede exigirte un proveedor:

Hoy: cambias de modelo Anthropic por configuración.
Roadmap declarado: un runner OpenAI-compatible, que de un golpe habilita Ollama (modelos locales gratis), vLLM, Groq y DeepSeek. Es deuda pública del proyecto, no una promesa vaga: el contrato ya está aislado para recibirlo.

Si quieres contribuir el runner alternativo, el contrato a implementar son los tres métodos de ClaudeRunner y el registro de uso. Abre un issue para coordinarlo.

¿Qué sigue?