05BLOG

>>> AI ENGINEERING STUDIO · NOTAS DE ENGENHARIA

Arquitetura, agentes e ciclos curtos de entrega.

O que aprendemos construindo software com IA em produção: arquitetura de contexto, memória de agentes e processo de engenharia que entrega.

Capa do artigo: A Redis acabou de lançar o Iris: a primeira tentativa séria de tratar contexto de agente como camada de infraestrutura em produção

A Redis acabou de lançar o Iris: a primeira tentativa séria de tratar contexto de agente como camada de infraestrutura em produção

Em escala, agente em produção raramente cai por causa do LLM: cai porque o contexto não foi desenhado pra escalar junto. O vector store envelhece em segundos, o banco transacional começa a apanhar com chamada de retrieval, a memória da sessão evapora, o cache semântico devolve resposta de outro caso. A Redis lançou o Iris pra tratar contexto de agente como categoria de infraestrutura.

LER ARTIGO
Capa do artigo: Trocar de modelo não faz código melhor. Trocar o processo entre 3 modelos, sim. 23 tarefas em 4h48m, sem humano no código

Trocar de modelo não faz código melhor. Trocar o processo entre 3 modelos, sim. 23 tarefas em 4h48m, sem humano no código

A discussão de adoção de IA pra desenvolvimento ainda gira muito em torno da pergunta errada: líder da eng pergunta qual modelo usar. Time troca Sonnet por Opus, troca Opus por GPT-5, mede a diferença num prompt isolado, conclui que agora vai. O gargalo não é qual modelo. É o processo entre modelos. Montei um harness com três níveis de agência e rodei 23 tarefas, 8 rodadas de review, zero humano no código.

LER ARTIGO
Capa do artigo: Conheça Memória Observacional, a arquitetura que bate até o oracle no LongMemEval

Conheça Memória Observacional, a arquitetura que bate até o oracle no LongMemEval

Cena que vivo no dia a dia construindo agentes para automação de atendimento: o usuário diz no terceiro turno que prefere WhatsApp, cinco dias depois numa nova sessão o agente envia um e-mail e o time se defende com 'mas a janela de contexto era de 200 mil tokens, tinha tudo lá'. Tinha, e mesmo assim esqueceu. Memória Observacional é a arquitetura que resolve isso e bate até o oracle no LongMemEval.

LER ARTIGO