Mais código não é mais produto

entrega de softwareai-nativeprodutividade

A CircleCI analisou 28 milhões de workflows de engenharia ao longo de 2025 e chegou a um número que me ficou na cabeça. O throughput médio entre os times subiu 59%. O maior crescimento que eles já mediram. Os 5% dos times do topo quase dobraram os resultados, com 97% de aumento. O time mediano: 4%. O quartil inferior: crescimento zero, mensurável.

Todo mundo teve acesso às mesmas ferramentas de IA. O resultado foi completamente diferente.

Isso me fez parar para pensar no que, de fato, separa esses dois lados. E a resposta é menos sobre IA do que parece.

A bifurcação que ninguém previa

Se a IA fosse um equalizer, você esperaria que o quartil inferior acelerasse mais que o topo. E há um estudo que mostra exatamente isso. A Plandek analisou dados de mais de 2.000 times de engenharia no mundo e encontrou que times de baixa performance reduziram seu lead time para entrega em cerca de 50% ao adotar IA. Os times de alta performance melhoraram entre 10 e 15%.

A IA ajudou mais quem mais precisava. Em termos proporcionais.

Mas aí vem o problema. O gap absoluto não fechou. Times de alta performance entregam mudanças em produção em 22,5 dias. Os do quartil inferior levam mais de 62 dias. A diferença proporcional diminuiu. A diferença real ficou no mesmo lugar.

O CEO da Plandek, Charlie Ponsonby, foi direto: a IA melhora a velocidade, mas não conserta sistemas de entrega quebrados. A frase é simples e diz o que os dados confirmam.

O que entrou pelo fundo quando o throughput subiu

A taxa de sucesso na branch principal dos times na plataforma da CircleCI caiu para 70,8% em 2025. O menor número em cinco anos. O benchmark recomendado é 90%.

Isso significa que quase três em cada dez tentativas de merge para produção estão falhando. O tempo médio de recuperação depois de uma falha subiu para 72 minutos, 13% acima do ano anterior.

Tem uma mecânica simples acontecendo aqui. A geração de código ficou barata. O volume de PRs explodiu. Mas tudo que vem depois de gerar código, revisar, validar, integrar, estabilizar, continua dependendo de gente e de processo. A CircleCI resume em uma frase que vale repetir: a IA está amplificando as forças de entrega que já existiam, não distribuindo elas de forma uniforme.

O time que já tinha review rápido ficou ainda mais rápido. O time com review lento ficou com mais fila para revisar.

O fundamento que determina o retorno

O relatório ROI of AI-Assisted Software Development da equipe DORA, publicado em maio de 2026, é o mais claro que li sobre por que isso acontece. Nathen Harvey, que lidera a iniciativa DORA no Google Cloud, colocou assim: sem fundações sólidas, a IA cria bolsos locais de produtividade que somem no caos downstream.

O estudo modela o retorno para uma organização de 500 engenheiros e chega a um ROI de 39% no primeiro ano, com payback de oito meses. Mas ele também mapeia a curva J que precede isso. Existe uma queda inicial antes da virada, curva de aprendizado, custo de verificar código gerado por IA, necessidade de adaptar testes e aprovações para o volume novo. O DORA chama isso de "tuition cost of transformation". Esse custo se paga, mas só se você tem o sistema para absorver a transição.

O ponto que o relatório faz ressoa com o que venho escrevendo sobre o paradigma 70/30. O retorno real não vem das ferramentas de IA. Vem da qualidade da plataforma interna, da clareza dos fluxos de trabalho, do alinhamento entre times. A IA amplifica o que já existe. E se o que existe já está bom, o resultado é notável. Se está quebrado, o resultado é mais volume de problema.

O que os 5% fizeram diferente

A Thoughtworks publicou uma análise sobre os dados da CircleCI que vai no mesmo ponto. O título diz o que precisa ser dito: o gap de entrega é o gap de estratégia. Os times de elite que escalaram criação e entrega ao mesmo tempo investiram em duas coisas antes de ampliar o uso de IA: plataformas internas de desenvolvimento e sistemas robustos de validação.

Não escolheram uma ferramenta de IA melhor. Tinham os trilhos prontos antes de acelerar.

Isso me lembra o que escrevi sobre agentes autônomos: a corrida para criar mais agentes sem construir antes os trilhos que sustentam escala segura é o padrão que separa quem está pilotando de quem está realmente operando. A mesma lógica vale aqui. A ferramenta só amplifica o que já existe no sistema ao redor dela.

E o dado de review time deixa isso concreto. Na pesquisa da Plandek, o quartil inferior leva mais de 35 horas para fazer merge de um PR. Os times de alta performance fazem em menos de 21 horas. Essa diferença de 14 horas não é um problema de qual modelo de IA cada um usa. É um problema de processo, de cultura de review, de como o trabalho flui dentro do time.

O próximo campo de batalha competitivo

A Jellyfish ouviu mais de 600 líderes de engenharia em 2026 e identificou uma mudança no eixo de atenção do setor. 2025 foi o ano da adoção. 2026 está sendo o ano da cobrança. Apenas 46% dos times rastreiam métricas específicas de IA. Os custos com tokens emergiram como o principal desafio à medida que a adoção escala.

A conclusão que a Jellyfish chegou parece óbvia mas não é: a próxima vantagem competitiva não está em ter acesso a modelos melhores. Todos vão ter acesso. Está em conseguir traduzir esse uso em resultados mensuráveis.

A pergunta que importa agora não é qual ferramenta de IA estamos usando. É o que estamos entregando com ela e como sabemos.

Essa mudança de pergunta é exatamente o que o V-Bounce previu quando o paradigma 70/30 entrou em cena. Quando a execução comprime, o valor migra. Não para "ter IA", mas para conseguir capturar e validar o que a IA gera. Os 5% da CircleCI fizeram essa aposta antes dos outros. E o gap está crescendo.

A conta que fecha do lado certo

O dado da CircleCI é claro: menos de um em vinte times está do lado bom da equação. E a diferença não está em ferramentas.

Os times que entregam investiram nos 70% que ficam antes e depois da geração de código. Clareza de intenção, arquitetura, especificação e, principalmente, validação e integração com qualidade. Isso não é teoria. É o que os dados de 28 milhões de workflows mostram.

Mais código não entrega mais produto. Entregar mais produto exige um sistema que consiga absorver, validar e estabilizar o volume que a IA está gerando. Quem investiu nesse sistema está acelerando. Quem não investiu está produzindo mais código e entregando a mesma coisa de antes.

Referências

Ron Powell e Jacob Schmitt – 5 key takeaways from the 2026 State of Software Delivery: Why AI isn't shipping faster. CircleCI, 18/02/2026.
Charlie Ponsonby – AI Helps Low-Performing Engineering Teams 4x More Than High-Performing Ones, New Benchmarks Show. Plandek / GlobeNewswire, 05/03/2026.
Matt Saunders – New DORA Report Claims Strong Engineering Foundations Drive AI Return on Investment. InfoQ, 11/05/2026.
Rickey Zachary – The delivery gap is the strategy gap. Thoughtworks, 16/03/2026.
Jellyfish – In 2026 Engineering Leaders Are Shifting from AI Adoption to AI Accountability. Jellyfish, 11/06/2026.
Cory Hymel – The AI-Native Software Development Lifecycle (modelo V-Bounce). arXiv 2408.03416, 2024.