A Microsoft enfrentou na última semana uma interrupção em seu data center na Austrália, afetando serviços como Azure, Microsoft 365 e Power Platform por um período que ultrapassou 24 horas. O motivo foi uma queda de energia na região leste do país, que levou ao desligamento de unidades de resfriamento essenciais.
O mau funcionamento dessas unidades resultou em um aumento de temperatura, ativando um desligamento automatizado para proteger a integridade dos dados e da infraestrutura. Embora as unidades de refrigeração pudessem ser reiniciadas manualmente, a equipe noturna, composta por apenas três membros, não conseguiu fazê-lo em tempo hábil devido à magnitude do campus do data center.
Como medida imediata, a Microsoft reforçou sua equipe noturna, aumentando de três para sete membros. Além disso, a empresa destacou que está empenhada em aprimorar a automação do data center para garantir uma recuperação mais eficaz após incidentes semelhantes no futuro. Estão sendo avaliadas estratégias para tornar o sistema mais resiliente a diferentes tipos de interrupções de energia e priorizar a reinicialização de servidores de alta carga.