
Em nosso data center, outro ciclo de atualização de hardware começou. Por que e como fizemos, e o mais importante - como exatamente o trabalho da plataforma de nuvem Linxdatacenter vai melhorar após a atualização em números específicos, - disse Oleg Fedorov, Gerente de Produtos e Soluções Linxdatacenter, no artigo de hoje.
A hora é agora
No ano passado, as solicitações dos clientes por processadores de alta frequência tornaram-se mais frequentes para a implantação de sistemas que exigem velocidade de cálculos e disponibilidade de recursos de CPU - um sinal claro do próximo ciclo de atualizações de hardware. Foi assim que nasceu nosso próprio projeto de atualização de infraestrutura em nuvem Linxdatacenter.
No decorrer de longos cálculos e negociações entre nossa equipe técnica e os fabricantes, foi decidido usar um design validado da Cisco VersaStack. Este projeto é usado em Cisco Fabric Interconnect, servidores UCS, sistemas de armazenamento da família IBM FlashSystem.
Decidimos elevar o desempenho da CPU da plataforma em nuvem a um novo nível: para isso, compramos novos servidores blade de alta frequência baseados no chassi Cisco B200 M5 Series UCS. Esta é a linha mais recente, com processadores de última geração com clock de 3,4 GHz, que só chegou ao mercado no primeiro trimestre de 2020.
Uma solução com esses "cérebros" em seu núcleo permite acelerar o trabalho de produtos que exigem desempenho. Em primeiro lugar, são as plataformas em nuvem 1C e SAP, soluções ERP, aplicativos que exigem o processamento de conjuntos de dados sérios, várias soluções para desenvolvimento e teste de software.
Outra atualização significativa é o novo sistema de armazenamento de backup. Para garantir o SLA do serviço BaaS, foi decidido instalar um Cisco S3260 em nosso data center - uma grande colheitadeira de 4 unidades, na qual 54 discos estão "presos". Este passo foi dado para unificar as plataformas em São Petersburgo e Moscou. Além disso, ao contrário do hardware antigo, isso nos permitirá usar a tecnologia Direct Storage Access.
O software Veeam é instalado no Cisco S3260 com a perspectiva de fornecer o modelo Direct Access por meio da integração com um novo sistema de armazenamento da IBM. Os instantâneos das versões mais recentes do sistema de armazenamento e a coleta de backups ocorrerão sem uma solicitação aos servidores de virtualização - portanto, nos livramos de um comando extra do VMware.
Esse esquema remove a carga excessiva dos servidores, melhora o desempenho e o desempenho.
Os sistemas de backup de VM tradicionais tiram um instantâneo antes da execução e, em seguida, copiam os dados da VM para si próprios e excluem o instantâneo. Para VMs grandes e de alta intensidade, o tamanho do instantâneo pode aumentar drasticamente durante o processo de backup e, quando o instantâneo é excluído, o disco principal da VM e o instantâneo se fundem. Neste ponto, a VM pode ficar indisponível por alguns segundos. Usar a tecnologia de instantâneo no nível de armazenamento evita esses problemas.
Um pouco mais de detalhe
Vamos dar uma olhada em como exatamente a plataforma de nuvem Linxdatacenter irá melhorar após a atualização.
O ponto principal é que somos um dos primeiros a tentar trazer ao mercado a tecnologia NVME ponta a ponta, que se distingue por IOPS alto e latência baixa (uma ordem de magnitude menor que SSD) (atraso antes da execução da solicitação). No entanto, essa tecnologia requer melhorias adicionais da infraestrutura e também afeta a parte da rede, cuja atualização também está planejada para nós.
Vamos passar para a CPU. Tradicionalmente, é a área de crescimento mais rápido em equipamentos de TI. Por exemplo, a partir do segundo trimestre de 2019, o processador no mercado com uma frequência de clock de 3,3 GHz fornecia apenas 8 núcleos.
Nossos novos processadores Intel 6246R têm clock de 3,4 GHz com 16 núcleos. Em pouco mais de um ano, tanto a frequência quanto o número de núcleos disponíveis aumentaram significativamente. Em termos de virtualização, a atualização fornecerá a mais clientes um sistema de TI de melhor desempenho.
Quanto aos sistemas de armazenamento, esse elemento sempre foi a área de desenvolvimento mais lento de todos os sistemas de informação. Na verdade, a RAM, como um elemento de qualquer sistema de TI - usuário ou profissional, surgiu como uma ferramenta para contornar o baixo desempenho de armazenamento.
Mas hoje existe uma oportunidade tecnológica de equiparar a velocidade do sistema de armazenamento com a velocidade da RAM, o que tornará possível executar transações e tirar seus resultados de sistemas de armazenamento de dados dezenas de vezes mais rápido.
Suponha que se uma operação - por exemplo, o processamento de uma solicitação para um banco de dados de alta carga - fosse realizada em 1 minuto, em sistemas de armazenamento modernos levaria apenas alguns segundos.
Por último, mas não menos importante, o IBM FlashSystem teoricamente permite que você reduza a latência máxima do disco para menos de 1 milissegundo, ou seja, literalmente - nem mesmo 0,1, mas 0,01 milissegundos. Agora demos mais um passo em direção a esses indicadores: eles estarão disponíveis em nossa nuvem após a próxima etapa do upgrade.
Na alimentação de cavalos, no crescimento dos negócios
Para descrever com precisão o efeito de um upgrade de ferro em uma nuvem, é apropriado usar essa analogia.
Imagine que você está escrevendo um texto no editor do Word. Você digitou no teclado, olhou para cima, e o programa da frase digitada conseguiu exibir apenas a primeira palavra na tela. Você pensou, formulou, digitou com os dedos no teclado, já está aí, já foi para o computador, mas ainda não apareceu na tela.
Após a atualização da infraestrutura com uma abordagem integrada, essa lacuna desaparece e se torna impossível até mesmo em um nível teórico.
É claro que todos esses elementos "bombeados" devem ser devidamente montados em uma solução final que forneça um alto nível de eficiência econômica e benefícios comerciais.
Para o negócio dos nossos clientes na Rússia, novas oportunidades permitirão, em primeiro lugar, acelerar significativamente o trabalho do software 1C.
Se 1C for necessário apenas para 10-15 usuários, funcionará bem mesmo “em uma calculadora”, ou seja, terá recursos de TI modestos ou padrão suficientes. No entanto, assim que uma empresa começa a fornecer serviços em tempo real com base em 1C, ou a empresa tem operações em larga escala e muitas melhorias diferentes - tudo isso “consome” o tempo e a energia do processador.
Da mesma forma, quanto mais melhorias, quanto maior a escala de operações em 1C, maiores serão os requisitos para o recurso de CPU. A arquitetura do software 1C é construída desta forma. E então acontece o seguinte: quanto mais alta a frequência do processador, menos núcleos ele pode fornecer. E seu preço sobe ao mesmo tempo.
Portanto, se você estiver usando aplicativos de negócios de nível médio ou alto, não poderá ficar sem processadores de alto desempenho no centro de uma solução de TI moderna.
Do ponto de vista empresarial, seu uso significa que um contador que apertou um botão em 1C para receber, digamos, um relatório anual, em um sistema de alto desempenho, receberá o resultado não em 2 minutos, mas instantaneamente. Assim, ele pode concluir o resultado final da soma de orçamentos, totais e encerramento do exercício financeiro em toda a empresa não em três dias, como agora, mas claramente a partir do último dia do período coberto pelo relatório.
Quanto às tarefas de backup, deve-se entender que qualquer instantâneo "congela" a máquina virtual por pelo menos uma fração de segundo, e às vezes até mais. Quando a versão anterior é removida, ela também pode congelar a VM por mais alguns segundos. Este é um efeito padrão.
Transferir o procedimento para o nível de armazenamento usando a tecnologia Direct Storage Access elimina completamente esses atrasos, mesmo que mínimos.
Suponha que uma empresa execute tarefas de backup em uma plataforma hiperconvergente usando um cluster Ceph distribuído (um sistema de armazenamento de arquivos para várias máquinas virtuais). Com essa abordagem, quaisquer atrasos de VM são inaceitáveis.
Ou considere este cenário: a execução de uma transação no banco de dados do banco, que dura, digamos, 30 segundos, coincide no tempo com o "congelamento" da VM envolvida nessa transação durante a criação do instantâneo.
Como resultado, o cliente depositou dinheiro no caixa eletrônico, mas o dinheiro não foi creditado na conta. O cliente está insatisfeito e passa boca a boca a sua opinião negativa sobre o banco. O resultado é uma perda de reputação para a empresa.
Primeiros usuários
Já existem empresas em nosso data center que estão interessadas nas capacidades da plataforma atualizada e estão testando-a gratuitamente para ver quais resultados práticos serão obtidos.
Até o momento, estamos registrando o interesse do segmento de serviços financeiros, construção, bem como de empresas que usam aplicativos de negócios essenciais para qualquer tempo de inatividade, mesmo o mínimo. Quanto menor for o tempo de inatividade, maior será a disponibilidade do serviço e menor será o custo de manutenção do aplicativo - e melhor será o desempenho do serviço que o usuário final recebe.
Provavelmente, todos os participantes desses testes estarão interessados na plataforma atualizada - porque a escolha econômica entre comprar um servidor de alto desempenho sem desenvolvimento adicional e alugá-lo por um mês é virtualmente óbvia tanto quando se concentra em projetos de curto prazo e na perspectiva de desenvolvimento de negócios de longo prazo com base em TI avançada soluções.