Huawei ADN: a primeira rede autogerenciada de camada 3 da indústria

O que é uma rede gerenciada de forma autônoma e como ela é diferente de SDN? A Huawei trabalhou com a empresa de consultoria IDC para examinar os critérios de avaliação da infraestrutura de rede em termos de sua capacidade de suportar sua própria operação sem a ajuda de um administrador.







Como os clientes desejam sua infraestrutura de rede de data center? Deve, obviamente, ser eficiente, confiável e fácil de manter. Seria maravilhoso se a rede se estabelecesse e se mantivesse. Os controladores SDN modernos podem fazer mais e mais, mas como avaliar o nível de sua automação? Como classificar essa autonomia?



Para responder a essas questões, recorremos à consultoria IDC e solicitamos-lhe que realizasse um estudo, de acordo com os resultados do qual seria possível compreender como caracterizar a autonomia de gestão de uma determinada rede e como avaliar a eficácia de tal implementação. Colegas do IDC responderam à nossa proposta e chegaram a conclusões interessantes.







Vale a pena começar pelo contexto, nomeadamente com a digitalização total, cujas ondas estão a varrer o mundo. Requer modernização da infraestrutura e dos fluxos de trabalho. E a força motriz por trás dessa transformação é a computação em nuvem.



Nesse ínterim, você não deve pensar na nuvem apenas como um lugar para executar suas cargas de trabalho. É também uma abordagem especial para o trabalho, implicando um alto nível de automação. De acordo com analistas da IDC, estamos entrando em uma "era de inúmeras inovações". As empresas estão investindo em tecnologias como inteligência artificial, Internet das coisas, blockchain e interfaces naturais. Mas o objetivo final é precisamente a autonomia dos sistemas e infraestruturas. É neste contexto que devem ser avaliadas as perspetivas de desenvolvimento de redes de centros de dados.







O diagrama mostra o processo de automação da rede, que é dividido em vários estágios sequenciais. Ele começa com uma interface de linha de comando e scripts. A próxima etapa é apresentar fábricas de rede para melhorar a velocidade e o desempenho. Em seguida, chega a hora de controladores SDN e ferramentas de virtualização. Nesta fase, ferramentas de orquestração e automação de redes de data centers também estão sendo implementadas.



A mudança para a rede baseada em intenção é uma nova dimensão. Mas o objetivo desse progresso é criar uma rede totalmente autônoma controlada por inteligência artificial. Todos os participantes do mercado consideram esse problema de uma forma ou de outra.



O que é autonomia de rede e como avaliá-la? A IDC propôs um modelo de seis camadas que permite atribuir com precisão uma solução específica a um determinado nível de autonomia.



  • Nível 0. Nesta fase, a gestão da rede é efectuada apenas por processos manuais ao longo de todo o ciclo de vida da rede. A rede não é automatizada.
  • Nível 1. O gerenciamento de rede ainda é em grande parte manual durante todo o ciclo de vida da rede.
  • Nível 2. Em alguns cenários, a automação parcial aparece combinada com a análise padrão e ferramentas de gerenciamento de política.
  • Nível 3. "Automação condicional". O sistema já é capaz de emitir recomendações e instruções, aceitas ou rejeitadas pelo operador.
  • Level 4. . . .
  • Level 5. . , .








Quais são os principais desafios que um inovador de data center enfrenta? Os dados da IDC, compilados a partir de entrevistas com especialistas em TI, classificados em primeiro e segundo lugar por alinhar a automação de rede com computação e automação de armazenamento e flexibilidade, que é a capacidade da rede de suportar cargas de trabalho e ambientes mistos.



Em terceiro lugar está o problema de automatizar a infraestrutura de rede, que, como acontece com mais frequência, é montada a partir de produtos de vários fornecedores. Isso requer uma ferramenta de gestão que reúna todo o zoológico de soluções e faça com que funcione de acordo com o nível de autonomia exigido. Ao mesmo tempo, 90% dos pesquisados ​​concordam que alcançar a autonomia da rede é o objetivo de suas organizações.



A pesquisa da IDC mostra que o gerenciamento autônomo de rede é uma tendência em alta, na qual até metade de todas as empresas que desenvolvem sua infraestrutura de TI estão envolvidas de uma forma ou de outra.







Vamos pegar uma empresa do setor financeiro como exemplo de transformação digital. No ano passado, as vendas off-line diminuíram drasticamente e as instituições financeiras foram as primeiras a responder a isso.



As empresas traduziram rapidamente grande parte de suas atividades em aplicativos, organizando as vendas digitais neles. Com isso, foi possível compensar a queda do canal off-line em pouco tempo e economizar receita. Ao mesmo tempo, a automação permitiu minimizar o nível de erros cometidos pelos colaboradores da empresa e agilizar significativamente parte significativa dos processos de negócios.







Ao mesmo tempo, a inovação no atendimento ao cliente levou a um aumento na complexidade da infraestrutura de TI e um aumento na frequência das alterações feitas nela. Até 50% dos problemas complexos atualmente registrados em data centers são, em um grau ou outro, causados ​​pela limitação tanto dos próprios recursos de rede quanto dos recursos da equipe de administradores.



Na maioria das vezes, os funcionários estão envolvidos na execução de operações rotineiras, embora a carga associada à introdução de novos serviços esteja em constante crescimento. Eles exigem testes, verificação de influência mútua com outros serviços, etc. Qualquer implementação acarreta o risco de destruir o que já está funcionando. Como resultado, a equipe fica sobrecarregada.



Talvez isso explique a seguinte figura: até 40% dos problemas complexos do data center são causados ​​por erro humano. Quaisquer mudanças na rede, como o lançamento de novos aplicativos, implantação de serviços, etc., requerem muita atenção e inúmeras verificações, para as quais nem sempre há tempo de trabalho suficiente. O resultado pode ser um acidente grave no data center.



Quanto tempo é gasto para resolver este ou aquele problema? Nossos dados sugerem que, em média, leva quase 80 minutos para detectar uma falha sozinho. E esses defeitos nem sempre estão associados a dispositivos físicos. Eles podem ocorrer no nível do protocolo, disponibilidade do serviço, etc.



Como resultado, o suporte à rede funciona dia e noite, mas ainda se torna alvo de inúmeras reclamações. Para muitos deles, não haveria razão se a rede do data center adquirisse alguma autonomia.







Voltemos à classificação dos níveis de autonomia proposta pelo IDC. Aqui está uma lista dos recursos que a rede deve demonstrar em cada um desses níveis. Solução A Huawei Autonomous Driving Network atende a todos os requisitos do terceiro nível. É capaz de manter o seu funcionamento em modo totalmente automático, incluindo arranque e paragem de processos, configuração de equipamentos, etc. Além disso, o nosso ADN cumpre integralmente o critério de sensibilização, recebendo informação em tempo real sobre o estado dos dispositivos, processos, aplicativos e serviços.



No modo semiautomático, o ADN consegue analisar o que se passa na rede, identificando as causas dos eventos e sugerindo recomendações para a sua eliminação. Em 2023, planejamos adicionar um recurso de feedback aos recursos do ADN.



O sistema de controle aprenderá a lidar com problemas de rede usando práticas que se mostraram eficazes em outras infraestruturas semelhantes, incluindo aquelas pertencentes a outras empresas.



De acordo com nosso roteiro, em 2028 teremos um sistema totalmente correspondente ao quinto nível de autonomia.







Qual será o efeito da introdução do gerenciamento de rede autônomo? Vamos começar projetando a rede. Com a Huawei Autonomous Driving Network, o cliente não precisa criar manualmente a arquitetura, projetar ou configurar os dispositivos. O sistema só pede para indicar quantos dispositivos e links de uma determinada largura de banda devem ser usados. Em seguida, ele monta automaticamente a infraestrutura de rede e a oferece como uma solução pronta para uso. O cliente recebe imediatamente uma fábrica de data center totalmente operacional.



Mas obter a infraestrutura de rede não é suficiente. Deve garantir a operabilidade das máquinas virtuais, aplicativos e outros processos, cada um dos quais com seus próprios requisitos para a largura de banda de determinados canais. Uma rede autônoma pode analisar a carga e dar recomendações para a organização ideal dos fluxos de informação.



Durante a operação, o ADN verifica constantemente a passagem do tráfego, entre outras coisas, identificando a influência mútua de vários serviços entre si. Isso permite melhorar a qualidade da rede em tempo real, eliminando gargalos emergentes.



A otimização é realizada continuamente. Se o sistema detectar uma deterioração do serviço, ele informa imediatamente o operador sobre isso, que só precisa tomar uma decisão preparada. Se, por exemplo, ADN perceber a degradação do módulo óptico, ele contará o número de processos afetados pelo problema e se oferecerá para usar o canal de backup.



Todos os recursos acima permitem que o ADN desempenhe um papel extremamente importante - economizando o tempo gasto no suporte à rede de pessoal técnico, liberando-o para executar tarefas de nível superior.







O ponto forte do Huawei Autonomous Driving Network é que não é apenas o software que pode ser instalado e operado. O sistema implementa um modelo de três camadas, cujo nível básico já está localizado no nível dos processadores dos dispositivos finais de comutação e roteamento. Esses elementos de hardware e software executam tarefas de coleta e análise de dados, bem como troca de fluxos e frames. O switch equipado com tal processador transmite informações em tempo real para a plataforma de software, que no nosso caso é o iMaster NCE .



É a arquitetura do nosso ADN que o diferencia de outros produtos comparáveis. A integração com elementos de hardware permite uma análise aprofundada única, possibilitando a implementação dos processos de configuração automática de desenho de rede, instalação de dispositivos de rede, etc. Pode, por exemplo, criar um "gêmeo virtual" da aplicação e verificar o serviço na infraestrutura existente. O resultado será um relatório detalhado que inclui uma lista de locais com problemas em potencial.



Resta notar que o ADN é uma solução orientada a serviços que faz uso extensivo dos recursos das tecnologias de nuvem. Já mencionamos acima que no quinto nível de autonomia, a rede deve ser capaz de usar algoritmos para lidar com falhas, formados com base na experiência de outros clientes e especialistas do setor. É da nuvem que o ADN aprenderá em breve a obter soluções para determinados problemas de rede identificados com base em assinaturas.



As abordagens utilizadas para criar o ADN permitem-nos recordar mais uma vez o nosso princípio 1-3-5: qualquer problema na rede deve ser identificado num minuto, localizado em três minutos e corrigido em cinco minutos.







Resumir. Obviamente, o ADN é o sucessor das soluções SDN. Essa era uma etapa necessária no desenvolvimento da tecnologia, mas tinha algumas desvantagens. Primeiro, o uso de redes definidas por software implicava a configuração inicial manual dos dispositivos. Em segundo lugar, a identificação de erros também recaiu sobre os ombros dos especialistas de suporte de rede. Em terceiro lugar, no caso do SDN, é claro, não se falou sobre a aplicação automática de scripts de recuperação obtidos da base de conhecimento baseada em nuvem. Com sua solução ADN, a Huawei teve como objetivo libertar nossos clientes dessas tarefas, concentrando-se no que realmente precisa de atenção.



All Articles