O avanço acelerado da inteligência artificial, impulsionado principalmente por modelos generativos e sistemas de aprendizado profundo, está provocando uma mudança radical no perfil de consumo energético dos data centers. A adoção maciça de GPUs de alto desempenho, essenciais para o treinamento e inferência de modelos de IA, tem gerado picos de demanda elétrica tão intensos quanto breves, e potencialmente perigosos.
Dados do Departamento de Energia dos Estados Unidos mostram que, em 2023, os data centers consumiram cerca de 4,4% de toda a eletricidade do país, com projeções apontando para um salto de até 12% até 2028. O motivo? A IA está forçando o setor a escalar suas operações com clusters compostos por dezenas, ou centenas, de milhares de GPUs que podem consumir milhares de watts cada.
A tempestade em microssegundos: o comportamento imprevisível da IA
O fenômeno mais alarmante é a natureza intermitente das cargas de trabalho de IA. Segundo Ed Ansett, diretor da I3 Solutions, quando um modelo começa a ser treinado, as GPUs são acionadas em sincronia e, em menos de um segundo, o sistema pode atingir sua carga máxima, 50 MW ou mais. Essa explosão súbita de consumo é rápida demais para ser absorvida pela rede elétrica tradicional, que responde de forma mais lenta, levando a problemas de frequência e até à desconexão automática do data center da rede.
O desafio não se limita ao volume, mas à velocidade e à volatilidade. O Lawrence Berkeley National Laboratory identificou que as cargas de IA são marcadas por “harmônicos ruins”,— distorções energéticas comparáveis a ruídos em caixas de som no volume máximo. Esses picos e quedas abruptas não afetam apenas os operadores de data centers: estudos indicam impactos diretos em residências próximas a clusters de IA, com aumento no risco de incêndios e falhas elétricas.
Baterias, UPS e ultracapacitores: estratégias de contenção
Para mitigar os efeitos dessas oscilações, algumas operadoras vêm recorrendo a sistemas de armazenamento temporário, como baterias e no-breaks (UPS), que absorvem os picos antes de repassá-los à rede. No entanto, especialistas como Giovanni Zanei, da Vertiv, alertam que baterias tradicionais não foram projetadas para esse tipo de uso intensivo e repetitivo, chegando a enfrentar ciclos de carga e descarga centenas de vezes por dia. Isso pode reduzir significativamente sua vida útil e invalidar garantias de fabricantes.
Como alternativa, tecnologias como os ultracapacitores ganham atenção. Diferente das baterias, eles são ideais para lidar com picos de milissegundos e se recarregam rapidamente. A Schneider Electric, por sua vez, aposta na integração de recursos de suavização de carga diretamente em sua arquitetura de UPS, reduzindo a dependência de intervenções externas.
Os gigantes do consumo
A escala dos projetos em curso impressiona. A Tesla anunciou para 2025 um cluster com 300.000 GPUs Nvidia Blackwell B200, enquanto o xAI, de Elon Musk, trabalha para atingir um milhão de GPUs. Oracle, AWS, Meta e Microsoft seguem o mesmo caminho, ampliando suas infraestruturas para comportar redes neurais cada vez maiores.
O problema é que cada GPU Blackwell B200 pode consumir até 1.200 W, e as combinações com CPUs Grace, como na GB200, chegam a impressionantes 2.700 W por unidade. Esses volumes tornam a estabilidade energética uma questão crítica, tanto para os data centers quanto para os bairros em seu entorno.
Soluções no chip: uma luz no fim da GPU?
Diante da pressão, empresas como AWS e Annapurna Labs estão redesenhando seus chips. O Trainium2, acelerador de IA proprietário da AWS, foi projetado com vias de energia mais largas e reguladores de tensão posicionados sob o pacote do chip, permitindo reduzir quedas de tensão durante picos de consumo. Arquiteturas como matrizes sistólicas, mais eficientes para álgebra linear, também são alternativas às GPUs convencionais.
Mesmo assim, os principais fabricantes de GPU seguem em silêncio sobre alterações na arquitetura para suavizar os picos. O motivo é simples: GPUs, apesar de sua “espinhosidade” energética, ainda são a solução mais poderosa e versátil disponível para IA. E com a demanda por modelos maiores e mais capazes crescendo, os incentivos para uma reinvenção estrutural são limitados.
Impactos e o futuro: a era dos data centers resilientes
Para os operadores, o caminho imediato é a adaptação. Sem mudanças no design das GPUs ou na infraestrutura elétrica pública, data centers precisarão investir pesadamente em estratégias de mitigação, desde UPSs inteligentes até soluções de energia distribuída, para garantir que não se tornem uma ameaça à estabilidade da rede.
Falhas upstream são cada vez mais prováveis, alerta Mustafa Demirkol, VP da Schneider Electric. E com isso, você pode não apenas comprometer a operação do seu data center, mas também danificar suas próprias GPUs.
A corrida da IA não está apenas redesenhando o panorama tecnológico, ela está transformando, em tempo real, os fundamentos energéticos da infraestrutura digital global.
Siga o Itshow no LinkedIn e assine a nossa News para ficar por dentro de todas as notícias do setor de TI, Telecom e Cibersegurança!