
Toda vez que eu mostro um agente fazendo uma tarefa de ponta a ponta, vem a mesma reação dividida: metade da sala se encanta, a outra metade trava de medo. E eu entendo as duas. O encantamento é fácil de explicar — a coisa funciona. O medo também: se ela funciona sozinha, o que impede de dar errado sozinha?
Demorei pra perceber que essa pergunta tem uma resposta técnica, e ela não está no modelo. Está no que a gente coloca em volta dele.
Agente = modelo + harness
A formulação que organizou minha cabeça foi a da Birgitta Böckeler, da Thoughtworks: um agente é igual a modelo mais harness. O modelo é o cérebro probabilístico, a parte que todo mundo olha. O harness é todo o resto — o arnês, os trilhos, a estrutura que envolve esse cérebro e decide o que ele pode tocar, com o que ele se informa antes de agir e como a gente percebe quando ele saiu da linha.
Gosto dessa equação porque ela desfaz uma confusão comum. Quando um agente faz besteira, o impulso é culpar o modelo: "a IA alucinou". Às vezes é isso mesmo. Mas, na maioria das vezes que vi de perto, o modelo fez o que dava pra fazer com o pouco que tinha em volta. Faltava harness — faltava o contexto certo na entrada e o sensor certo na saída.
Trocar por um modelo mais novo ajuda, claro. Mas é o harness que transforma um agente esperto numa peça em que dá pra confiar. E, mais importante pra mim, é o harness que faz a diferença entre um truque que funciona na minha máquina e uma capacidade que a empresa inteira pode usar sem prender a respiração.
Os dois tipos de trilho
Na prática, o harness se divide em duas famílias, e elas atacam momentos diferentes.
A primeira age antes da ação, restringindo o espaço onde o agente pode se mover. São os guias: o type checker que não deixa passar besteira, o schema que define o formato aceitável, o linter, e também as instruções de contexto — aquele arquivo que diz ao agente como as coisas funcionam aqui, quais os caminhos recomendados, o que é proibido. É a diferença entre soltar alguém numa cidade sem mapa e entregar um mapa com as ruas certas já marcadas.
A segunda age depois, detectando desvio. São os sensores: os testes que rodam contra o que o agente produziu, a análise estática, a revisão — inclusive revisão feita por outra IA — e a observabilidade que percebe quando o comportamento começou a derivar do esperado. Não impedem o erro de nascer; pegam ele antes de virar problema de produção.
O que me fez a ficha cair é que essas duas famílias não são "boas práticas opcionais" que a gente acrescenta se sobrar tempo. Com geração automática, elas são a condição pra autonomia existir. Um agente sem guias na entrada gera no escuro; sem sensores na saída, ninguém percebe quando ele errou. Tirar o harness não te dá mais liberdade — te dá mais risco com a mesma cara de sucesso.
Por que mais autonomia exige mais estrutura, não menos
Tem uma intuição velha da cibernética que cai como uma luva aqui: quem controla um sistema precisa ter pelo menos tanta variedade quanto o sistema que está controlando. Em português de obra: quanto mais coisas o agente pode fazer, mais variado precisa ser o conjunto de trilhos e sensores em volta dele. Senão o controle ou quebra ou estrangula tudo a ponto de a autonomia não servir pra nada.
É por isso que eu desconfio das duas pontas do discurso. Da turma do "libera geral, a IA se vira", porque autonomia sem harness é só velocidade na direção errada. E da turma do "trava tudo, revisa na mão", porque aí você jogou fora justamente o ganho que foi buscar. O harness é o meio-termo com método: ele não tenta tirar o humano do circuito, ele direciona o humano pra onde a presença dele rende mais.
Isso conversa direto com duas coisas que eu já venho defendendo. Com o paradigma 70/30 do V-Bounce — se o valor migrou pra intenção e pra validação, o harness é a engenharia que materializa esses dois braços. E com as camadas de autonomia — quanto mais crítica a camada, mais robusto o harness antes de eu soltar qualquer agente nela.
O que isso mudou no meu trabalho
Mudou onde eu gasto energia. Antes, eu olhava primeiro pro modelo e pro prompt. Hoje, antes de colocar um agente pra trabalhar de verdade, a primeira pergunta é outra: que trilhos esse agente tem na entrada e que sensores ele tem na saída? Se a resposta for "nenhum", não importa quão bom seja o modelo — não está pronto.
E mudou o que eu considero entrega. Construir o harness — escrever as instruções de contexto, montar a malha de testes, ligar a observabilidade — deixou de ser tarefa de bastidor e virou a parte mais arquitetural do trabalho. É ali, e não no prompt da moda, que a IA deixa de ser um ganho pessoal meu e vira uma capacidade que o time pode herdar.
A barreira técnica caiu, eu repito sempre. Mas cair a barreira não é o mesmo que sumir o critério. O harness é o critério feito engenharia: a forma de dar liberdade à máquina sem abrir mão da responsabilidade pelo resultado.