A crise global de memória que a IA criou e o que isso muda para todo mundo

H
Hugo EmmanoellEngenheiro de Software
7 min de leitura

Na última quinta-feira, durante a chamada de resultados do segundo trimestre fiscal da Apple, Tim Cook disse algo que o mercado já sabia mas ainda não queria ouvir de forma tão direta: "Acreditamos que os custos de memória terão um impacto crescente nos nossos negócios." Ele acrescentou que a Apple está "avaliando uma série de opções" para lidar com a situação, sem especificar quais. Wall Street entendeu o recado.

O problema não é exclusivo da Apple. É uma crise global de memória que a explosão da inteligência artificial criou, e cujos efeitos já se sentem em preços, prazos de entrega e nas decisões de produto das maiores empresas de tecnologia do mundo.

O que aconteceu com a memória

A demanda por chips de memória sempre foi cíclica. Preços sobem, fabricantes expandem capacidade, oferta ultrapassa demanda, preços caem. Esse ciclo se repetiu por décadas. O que está acontecendo agora é diferente porque a IA quebrou a lógica desse ciclo de uma forma que ninguém havia previsto na escala em que ocorreu.

Cada nova geração de chip da Nvidia, a processadora central do boom de IA, incorpora mais memória de alta velocidade do tipo HBM, pressionando a produção de memória para o topo da cadeia. Data centers de IA precisam de quantidades massivas de memória para treinar e rodar modelos. Isso consumiu boa parte da capacidade global de produção que antes abastecia computadores, smartphones e outros dispositivos de consumo.

O resultado é que a memória para dispositivos convencionais ficou escassa e cara. A Samsung, uma das três maiores fabricantes de memória do mundo, alertou que "escassez significativa" em seus produtos de memória deve persistir pelo menos até 2027. A SK Hynix, outra das três, foi ainda mais direta: o impacto pode se estender até 2030. A Micron, terceira do grupo, ainda não emitiu um aviso formal, mas os analistas não esperam que ela fique de fora por muito tempo.

O que a Apple está enfrentando

A Apple chegou a esta crise em um momento particularmente delicado. O Mac mini e o Mac Studio, duas das máquinas mais procuradas por desenvolvedores que trabalham com IA local, estão com prazo de entrega estendido por meses. O MacBook Neo, o laptop de entrada que Cook descreveu como tendo demanda "fora dos gráficos", enfrenta o mesmo problema.

A causa imediata não é falta de memória RAM no sentido mais direto, mas sim escassez dos componentes de sistema em chip, os SoCs de nó avançado que a Apple usa nos seus processadores da série M. Cook foi específico nesse ponto durante a chamada de resultados: "A principal restrição no trimestre de março e no trimestre de junho é a disponibilidade de nós avançados nos quais nossos SoCs são produzidos, não a memória."

Mas o problema de custo de memória é real e separado da questão de suprimento de SoCs. As margens brutas da Apple caíram dois pontos percentuais no último trimestre, parcialmente por conta dos custos mais altos de memória. A empresa conseguiu amortecer parte do impacto usando estoque de memória comprada anteriormente, quando os preços estavam mais baixos. Quando esse estoque acabar, a situação muda.

Os analistas do Bank of America foram diretos em nota publicada na sexta-feira: esperam que a Apple aumente o preço médio dos iPhones de alto padrão lançados neste outono, incluindo o modelo dobrável, o Pro Max e o Pro. A estimativa é que um aumento de US$ 100 no preço de venda absorveria a maior parte da pressão de margem relacionada à memória sem deslocar significativamente a demanda, dado que o iPhone é considerado um produto relativamente inelástico ao preço.

Por que a IA local está amplificando o problema

Há uma camada adicional nessa história que tem relevância direta para desenvolvedores: o crescimento acelerado do mercado de IA local, modelos rodando diretamente no dispositivo em vez de na nuvem.

Preocupações com privacidade, latência menor e custos crescentes de inferência em nuvem estão empurrando desenvolvedores e empresas em direção ao processamento de IA no dispositivo. No ecossistema Mac, isso significa que as máquinas com chips M4 e M4 Pro estão sendo compradas e usadas de formas que a Apple não havia previsto na velocidade em que aconteceu. A demanda por Mac mini e Mac Studio, que têm memória unificada com a CPU e a GPU no mesmo chip, acelerou de forma expressiva por conta dessa tendência.

Um laptop de última geração com capacidade de IA precisa de 16GB a 32GB de memória unificada, comparado a 8GB de modelos padrão anteriores. Isso representa o dobro ou quádruplo da demanda de memória por dispositivo, num mercado que foi dimensionado para volumes anteriores ao boom de IA. O impacto no suprimento é direto.

Quem mais está sendo afetado

A Apple não está sozinha. A Microsoft projetou US$ 190 bilhões em investimento de capital para 2026, um aumento de 61% em relação ao ano anterior. A CFO Amy Hood apontou explicitamente um impacto de US$ 25 bilhões proveniente de preços mais altos de componentes, incluindo memória. A Meta também revisou sua previsão de capex para cima, de US$ 135 bilhões para até US$ 145 bilhões, citando "expectativas de preços mais altos de componentes" como um dos fatores.

Do lado dos fornecedores, a Sandisk registrou um trimestre excepcional com receita de US$ 5,95 bilhões, bem acima das expectativas. A empresa anunciou um programa de recompra de ações de US$ 6 bilhões e afirmou que três de seus cinco contratos de longo prazo somam US$ 42 bilhões. Para quem está vendendo memória, este é um momento muito bom. Para quem está comprando, o oposto.

A KKR comprometeu mais de US$ 10 bilhões para lançar a Helix Digital Infrastructure, uma nova empresa dedicada a construir e operar infraestrutura especializada para IA, incluindo data centers, geração de energia e conectividade. O capital privado está apostando que a demanda por infraestrutura de IA, e por memória que a alimenta, é estrutural, não cíclica.

O que isso significa na prática para desenvolvedores e pequenas empresas

Para quem trabalha com desenvolvimento de software, há alguns impactos concretos que vale antecipar.

O primeiro é no hardware. Se você está planejando comprar um Mac com chip M para trabalhar com IA local, pode enfrentar prazo de entrega estendido nos próximos meses e provavelmente preços mais altos nas configurações lançadas no segundo semestre de 2026. Comprar antes do ciclo de alta dos preços de iPhone e Mac Pro pode fazer diferença.

O segundo é em infraestrutura de nuvem. A escassez de memória nos data centers não está afetando apenas os dispositivos de consumo. Os preços de instâncias de computação intensiva em memória também estão subindo, o que muda a análise de custo para quem usa infraestrutura em nuvem para inferência de modelos. A tendência de IA local, além de ser tecnicamente interessante, começa a fazer mais sentido financeiro em determinados casos de uso.

O terceiro é em perspectiva de prazo. A Samsung projeta escassez significativa até pelo menos 2027. A SK Hynix até 2030. Independentemente do grau de acurácia dessas projeções, o mercado de memória não vai se resolver em meses. Planejamentos de infraestrutura e orçamento de hardware precisam levar isso em conta.

O fim do pressuposto de que memória é commodity

Por décadas, a premissa fundamental de quem planeja infraestrutura de tecnologia era que memória ficaria mais barata com o tempo. Mais capacidade pelo mesmo preço, ano após ano. A Lei de Moore como pano de fundo de todas as decisões de investimento em hardware.

O que a IA está fazendo é inverter esse pressuposto pela primeira vez em uma geração. Não porque a produção de memória ficou menos eficiente, mas porque a demanda cresceu em velocidade e escala que a capacidade produtiva global não consegue acompanhar.

Cook capturou bem o sentido mais amplo do problema durante a chamada de resultados. A memória não é mais um insumo barato e abundante que pode ser adquirido a qualquer momento pelo preço de mercado. Tornou-se um recurso estratégico com oferta restrita, preços em alta e visibilidade limitada sobre quando o equilíbrio voltará.

Para a indústria de tecnologia como um todo, isso é uma mudança de contexto relevante. Para quem constrói produtos e infraestrutura de software, é uma variável nova no cálculo que precisa ser considerada agora.

Pronto para começar? Fale com a Bia IA para tirar suas dúvidas ou converse com um especialista.