"Haja luz!", Ou Como mudamos o sistema UPS no data center em meio a uma pandemia









- COVID-19 – , . , , -. 



, - . 









Delta Linxdatacenter





O sistema de alimentação ininterrupta (UPS) de nosso data center em São Petersburgo foi originalmente projetado de acordo com o modelo 2N. 



Isso significa que se um no-break falhar (ou for desligado para manutenção), o outro assume a carga total. Consequentemente, a energia realmente usada de uma fonte de alimentação ininterrupta (UPS) em um par não deve exceder 50% do máximo disponível. Isso garante a confiabilidade do sistema. 



Em operação normal, os UPSs fornecem a energia necessária de 100%, compartilhando a carga igualmente. 



No entanto, o crescimento das cargas no data center levou à necessidade de modernização: o nível de consumo de capacidade estava se aproximando do limite máximo permitido. 



Devido à grande demanda por recursos do site, decidimos em favor dos UPSs modulares como um formato que atenda de forma otimizada aos desafios de desenvolvimento de data center no momento atual e permita aumentar a capacidade no futuro. 



Ao mesmo tempo, revelou-se impossível implementar no-breaks modulares no no-break, baseados em soluções monobloco. Seria necessário desconectar alguns dos equipamentos, o que levaria à paralisação dos sistemas de TI dos clientes, então descartamos esse cenário imediatamente. 



Era necessário criar um no-break fundamentalmente novo, redistribuindo a carga entre os no-breaks monobloco existentes e os novos modulares. Ao mesmo tempo, era importante cumprir os requisitos do Uptime Institute em termos de monitoramento de cargas - até 50% do máximo por unidade UPS. 



Escolha a favor



A escolha recaiu sobre o equipamento da Delta Electronics: o UPS modelo Delta DPH 500 kVA necessário estava disponível em um depósito em São Petersburgo, e o integrador de soluções (Tempesto Group of Companies) também tinha o status de distribuidor de uma única marca do fornecedor na Rússia, o que desempenhou um grande papel para nós ao longo do caminho. projeto. 



O formato modular da UPS permite resolver muitos problemas relacionados com o fornecimento de energia do data center, o principal deles é aumentar a tolerância a falhas. 



O fato é que os UPSs monobloco falham totalmente, desencadeando um "efeito dominó" ao longo de toda a cadeia de cumprimento de SLA. Em contraste, UPSs modulares em caso de emergência "voam" modularmente, perdendo 50 kW cada, o que, com a configuração adequada da arquitetura de UPS, permite que você não sinta as consequências de tais falhas e, em alguns casos, o efeito de tal acidente tende a zero. 



Além disso, as soluções modulares permitem a substituição de módulos defeituosos "quentes", são facilmente escaláveis ​​para cargas flutuantes na sala de informática e são muito mais compactas (um UPS modular ocupa um rack contra 2,5 racks para um dispositivo monobloco). O fator econômico também é importante: as soluções modulares custam quase a metade do preço em comparação com os modelos monobloco líderes de mercado.  



Resumindo, foi uma escolha bem fácil. 



Trabalhar



A equipe do projeto era composta por 15 pessoas. A equipa era composta por dez instaladores, um engenheiro-chefe e seus suplentes em diversas áreas (automação, elétrica, etc.). 



As obras foram iniciadas em abril de 2020, com previsão de conclusão em junho. No entanto, não foi tão fácil seguir o plano: a tarefa foi complicada pela pandemia COVID-19, devido à qual um dos fornecedores não conseguiu entregar os disjuntores necessários para o equipamento do painel da Europa a tempo. 



A esta altura, todos os estudos de pré-projeto já foram concluídos e a documentação do projeto foi preparada, os UPS necessários e a maioria dos materiais foram adquiridos. Não foi possível esperar que a situação voltasse ao normal: as capacidades atualizadas dos servidores tiveram que ser colocadas em operação em um prazo pré-determinado nos termos do contrato com o novo cliente do data center. 



Portanto, optou-se por prosseguir com a instalação no local de forma a cumprir as etapas de trabalho previstas.









Matriz de baterias UPS no Data Center Linxdatacenter



Vencendo COVID-19: Flexibilidade de Planejamento, Equipes e o Fator de GUI



Em primeiro lugar, contamos com o trabalho bem coordenado da equipe, principalmente da equipe de “encarregados-montadores”. Desejo registrar a contribuição do contratante: Os especialistas da Tempesto puderam proporcionar a maior flexibilidade de interação conosco e entre eles em condições difíceis.



Por exemplo, quando era necessário trocar a energia de uma fonte de eletricidade para outra, os clientes estavam longe de estar sempre prontos para este procedimento, apesar das notificações. Muitas vezes não permitiam que seus equipamentos fossem desligados, porque não tinham tempo para se preparar adequadamente - não faziam backup, não transferiam os sistemas para um site de backup, etc. 



Apesar disso, o tempo de inatividade foi quase totalmente evitado. O “Plano B” estava sempre pronto para tais casos, do que para manter os instaladores ocupados nas tarefas atuais. 



Para concluir o projeto no prazo, as obras eram realizadas diariamente, sem interrupções nos finais de semana. Os funcionários tiveram que trabalhar em condições bastante inusitadas: com uso constante de EPI e mantendo distância devido à pandemia. 









Painel de distribuição de energia no data center Linxdatacenter O



gerenciamento de tempo competente da equipe e uma compreensão clara da arquitetura da solução futura ajudaram a evitar perdas de tempo significativas, e a instalação de cabeamento, equipamento do painel e UPS foi concluída no prazo.



O status de distribuidor oficial da contratada para os produtos do fornecedor também ajudou. Quando descobriu-se que um dos no-breaks foi danificado após a desembalagem, graças ao contato direto com o fornecedor, a substituição veio em 1 semana. Se o fornecedor do equipamento fosse um, e o instalador fosse outro, só neste problema perderíamos 2 a 4 semanas. 



resultados



Como resultado da atualização, que incluiu 4 UPSs Delta DHP série 500kVA adicionais, a energia foi parcialmente redistribuída para o novo equipamento e a carga máxima por unidade UPS acabou diminuindo de 49% para 43%.



No geral, a tolerância a falhas do data center já era satisfatória, mas a atualização a melhorou. Anteriormente, se a carga de um no-break ultrapassasse 50% do máximo, em caso de emergência, o desligamento seria inevitável. Por exemplo, quando um conjunto de capacitor falha em um UPS monobloco, todos os sistemas ligados a ele caem. Em um no-break modular, apenas um módulo falhará e o resto dos elementos continuarão funcionando. 



Mais importante: conclusões



Os membros da equipe do projeto adquiriram experiência importante no tratamento de tarefas complexas em face de crises imprevistas. 



A que conclusões chegamos:



  • Podem ocorrer problemas de abastecimento mesmo em condições normais. No contexto de uma pandemia e outras circunstâncias de força maior, é necessário se preparar para os cenários mais negativos para o desenvolvimento dos eventos: os prazos de entrega podem ser interrompidos com mais frequência e por períodos mais longos;
  • A obra deve ser executada de acordo com o cronograma-plano, no qual os riscos são calculados previamente. Atenção especial deve ser dada aos pontos nodais nos quais os estágios se cruzam;
  • Em caso de violação do prazo de entrega, é necessário fazer aquelas obras que podem ser realizadas independentemente da interrupção. Se você suspender todo o trabalho no projeto até que todos os componentes sejam recebidos, o trabalho corre o risco de ser atrasado ou se tornar um "assalto";
  • – ,   . . 



All Articles