stack recomendado · arranque cuando Miles termine fase 1
Construir el workaround stack con tecnologías ganadoras 2026, sin esperar SubQ.
SubQ y Gemini 3 con 2M context son el futuro pero no están en producción usable hoy
(private beta SubQ, degrada Gemini). Mientras tanto, Anthropic context caching
es la mejor mitigación del costo y InsForge pgvector + Voyage 3.5 large + Cohere Rerank
forman un stack RAG modesto, barato y bien calibrado para Agent Squad.
El plan de 4 fases entrega valor incremental en 3-5 semanas: Fase A habilita
memoria persistente de oficina, B sube precision con rerank, C
wirea al agente, D tritura costo con caching. Cada fase shipea independiente.
Cuando SubQ shippee GA con benchmarks third-party verificados (Q3 2026 optimista),
el stack se simplifica: las capas 2-4 desaparecen y queda solo L1 + L5. Pero hasta entonces,
este es el camino.