Modelos de IA
Un solo punto de acceso
Sección titulada «Un solo punto de acceso»Todo el acceso al LLM pasa por core/aiuda_core/engine/llm.py (ClaudeRunner):
complete() para redacción, classify() para triage, run_tool_loop() para el
loop agéntico con gates de aprobación. Ningún otro módulo importa el SDK del
proveedor. Esa decisión es deliberada: el runtime es pluggable por diseño.
Modelos por tarea
Sección titulada «Modelos por tarea»| Tarea | Variable | Default | Por qué |
|---|---|---|---|
| Triage: clasificar respuestas, mapear columnas de Excel | MODEL_TRIAGE | claude-haiku-4-5 | Barato y suficiente |
| Redacción y conversación con clientes | MODEL_REDACCION | claude-sonnet-4-6 | El mejor en español e instrucciones complejas |
El modelo se elige en código, por tarea — no es una preferencia global. Un mes
de cobranza activa típica cuesta centavos de dólar, y cada token queda registrado
por tenant en usage_events.
La postura anti lock-in
Sección titulada «La postura anti lock-in»Anthropic es la implementación de referencia (y la que usa aiuda Cloud). Pero un proyecto open source serio no puede exigirte un proveedor:
- Hoy: cambias de modelo Anthropic por configuración.
- Roadmap declarado: un runner OpenAI-compatible, que de un golpe habilita Ollama (modelos locales gratis), vLLM, Groq y DeepSeek. Es deuda pública del proyecto, no una promesa vaga: el contrato ya está aislado para recibirlo.
Si quieres contribuir el runner alternativo, el contrato a implementar son los tres
métodos de ClaudeRunner y el registro de uso. Abre un issue para coordinarlo.