As principais tecnologias de redes ADN corporativas realizadas pela Huawei: o início

Em 2021, a Huawei aposta no desenvolvimento de redes corporativas de ADN. O que é essa besta, vamos delinear brevemente neste artigo com base nos resultados do relatório do fórum on-line Worldwide IP Club realizado no final de 2020 - uma comunidade que criamos para discutir inovações e networking em telecomunicações.







Para entender o Huawei Enterprise ADN , é útil primeiro fazer um rápido tour pelos desafios que as redes corporativas enfrentam hoje.







Não há dúvida de que a transformação digital não contornará nenhuma grande organização. E esse processo é impensável sem um suporte de infraestrutura digno. Para atender às demandas de digitalização, a rede corporativa deve ser confiável, flexível e escalonável.



Essa rede tem duas partes principais - uma rede de acesso e uma rede central. No diagrama acima, à esquerda da localização do equipamento regional está apenas a mesma rede de acesso projetada para fornecer conexão a campi corporativos, filiais, estruturas externas, ambientes de IoT, etc. À direita, conexões inter-regionais e "inter-nuvens" são exibidas.



Embora a arquitetura seja fundamentalmente a mais simples, na prática, via de regra, você tem que lidar com uma enorme rede heterogênea baseada em equipamentos de diferentes fornecedores. Seus custos de operação e manutenção às vezes são significativamente mais altos do que comprá-lo. Aqui estão quatro fatores agravantes principais que tornam a vida difícil para os designers e administradores de redes de corpus modernas.



I. Silos de rede, que desconectam serviços da infraestrutura de rede, criam confusão com muitas tarefas de rede, a própria configuração da rede se torna excessivamente complicada e o O&M perde eficiência.



II. Um alto grau de heterogeneidade de rede, com seu parque diversificado de

equipamentos. Isso leva a muitas dificuldades, incluindo a dependência da operação bem-sucedida da infraestrutura da experiência de especialistas individuais, longos ciclos de solução de problemas, verificações ineficazes e erros causados ​​pela necessidade de realizar uma grande parte das operações manualmente.



III. Separação de serviços de nível comercial e infraestrutura de rede.Como resultado, é impossível operar totalmente o NaaS (Rede como serviço) em uma zona separada ou entre zonas de rede. Em meio a uma enxurrada de incontáveis ​​métricas de atividade de rede, alertas e registros, o administrador não pode garantir que os serviços funcionarão perfeitamente em um determinado momento.



IV. Falta de visualização de rede ponta a ponta e ferramentas para sua análise abrangente. É o verdadeiro flagelo de quem constrói e opera redes. De forma deprimente, os defeitos são revelados diretamente durante a operação dos serviços, os usuários têm tempo para encontrá-los, já que não podem ser detectados e eliminados rapidamente.







Para enfrentar esses desafios, a Huawei criou uma solução de rede de direção autônoma (ADN) chamada iMaster NCE. Ele contém a funcionalidade de um "gêmeo digital", análise ponta a ponta de intenções (já escrevemos sobre o conceito de rede dirigida por intenções com mais detalhes em Habré ), bem como a tecnologia de tomada de decisão inteligente.



  • O princípio dirigido pela intenção. Ao longo da vida de uma rede, aqueles que a gerenciam podem usar ferramentas WYSIWYG simples para manter a rede sob controle.
  • Tomada de decisão inteligente. O sistema torna mais fácil para uma pessoa escolher as soluções ideais. Por exemplo, na fase de implantação do serviço, ele é capaz de "solicitar" ajustes e configurações de rede adequados e, ao analisar problemas, torna possível encontrar rapidamente a causa raiz do problema e ele próprio sugere medidas para eliminá-lo.
  • " Gêmeo digital ". O iMaster NCE inclui uma infraestrutura KPI de modelagem e gerenciamento multicamadas com base em big data que opera com “instantâneos virtuais” de quaisquer dispositivos físicos na rede. Nesse caso, a solução realiza o mapeamento bidirecional entre a rede e sua “gêmea”.


Com a ajuda do ADN, cinco transformações importantes são possíveis.



  1. «», , , , , . iMaster NCE .
  2. , , , . , O&M- .
  3. . , , , .
  4. «» . — , , — .
  5. Substituir o trabalho baseado no fator humano, principalmente na experiência de especialistas, por um modelo onde prevaleça a tomada de decisões com o auxílio de tecnologias inteligentes, inclusive no projeto de redes, monitoramento, análise e otimização de interações de rede






O principal fator no modelo de análise orientado por intenção é a transferência das solicitações de negócios do usuário para a camada de rede. O processo tem três componentes significativos.



  1. Formação de um modelo abstrato de intenções (abstração de intenções). Em redes corporativas, a maior parte da intenção está relacionada às interações entre usuários, dispositivos finais e aplicativos. Como consequência, é necessário um modelo que generalize seus requisitos ao longo de todo o ciclo de vida da rede e garanta sua customização com base em uma abordagem de cenário.
  2. (intent conversion). - . .

    • «» , , , , ., «», (solver), .
    • - « ». , «» , .
  3. . . :

    • ;
    • - ;
    • (SDN, OVS .);
    • , .






Vamos passar a modelar o que está acontecendo na rede, para quais cenários ela foi projetada e por que, usando-a, fica muito mais fácil construir redes com a manutenção de um nível de serviço garantido (SLA).



Em essência, simulamos a configuração da rede, recursos e sistema de encaminhamento para criar uma rede virtual que irá refletir as características e especificidades da operação da rede real original.



Ao trabalhar com uma rede virtual, usamos a prova formal - um método matemático que nos permite verificar se a rede atende aos critérios de SLA, como conectividade de rede estável, roteamento contínuo, encaminhamento configurado corretamente, consistência de política, latência e níveis aceitáveis ​​de perda de pacotes, etc. etc.



Vamos dar uma olhada rápida nos cenários básicos para usar o método.



  • A modelagem de intenção ponta a ponta abrangente valida proativamente a solução para garantir que as novas intenções não interrompam os processos que já estão ocorrendo na rede.
  • Após a implementação da intenção na rede corporativa, é verificado se está funcionando conforme o esperado, e os riscos de todo tipo de excessos são monitorados - antes que haja tempo de afetar a operação dos serviços.
  • O comportamento da rede virtual é verificado em cenários que envolvem uma zona, em interzona, em híbrido (usando recursos de nuvem, etc.), e novamente pode ser completamente isolada da rede corporativa principal em modo automático.


Resumindo, a análise da rede é executada nesta sequência.



  • Com base na topologia de rede existente e nas informações sobre os elementos da rede, é construído um modelo de controle da rede virtual.
  • Uma configuração de simulação é usada para gerar um sistema de encaminhamento de rede virtual.
  • Um método de prova formal é usado para modelar o comportamento da rede em todos os aspectos, tais como: configuração, alocação de recursos, roteamento.
  • A plataforma sugere algoritmicamente recomendações para fazer alterações na rede.






Após todas essas etapas serem executadas, a tecnologia de monitoramento ativo inteligente mencionada anteriormente entra em ação. Está desenhado para digitalizar toda a infraestrutura da rede de forma a possibilitar a gestão integrada da sua operação, suporte, otimização e posterior desenho.



Alguns exemplos de como isso funciona. Digamos que venha de alguma unidade de negócios da empresa um sinal de que eles perderam o acesso ao aplicativo. A plataforma iMaster NCE, principalmente por meio de modelagem de topologia de rede dinâmica, facilita a consulta e a visualização de todas as métricas relacionadas a um aplicativo. Além disso, graças ao navegador de roteamento, é conveniente rastrear em todos os níveis da rede por onde e para onde o tráfego estava indo, de acordo com o princípio ponta a ponta - até um dispositivo físico específico, como um smartphone (ele verifica o alcance de seções e elementos de rede, loops e buracos negros de roteamento etc.). Por sua vez, graças à visualização complexa do trabalho das ferramentas analíticas, você pode verificar rapidamente se as entradas para dispositivos específicos nas tabelas de roteamento estão em ordem,bem como monitorar notificações, logs e registros de alterações de configuração. E com a ajuda de uma solução recomendada pelo serviço RunBook (claro que o administrador é livre para escolher fazer o que quiser), se necessário, a operabilidade dos componentes e serviços da rede é rapidamente restaurada e o mau funcionamento da mesma é eliminado.



Outro cenário é verificar o status da rede. Para isso, é utilizado um modelo com cinco níveis de controle, cada um rastreando sua própria fatia da infraestrutura:



  • O equipamento está funcionando de maneira estável - são as placas, ventiladores, fontes de alimentação, processadores, memória, etc .;
  • se existem problemas nas conexões entre os dispositivos físicos que entram na rede, incluindo se os status das portas e o tráfego são normais, o comprimento das filas e o coeficiente de atenuação óptica, se a porcentagem de pacotes "quebrados" é muito alta, etc.;
  • se agregação M-LAG, roteamento via OSPF, BGP, etc funcionam;
  • está tudo bem com a infraestrutura de rede imposta, incluindo os status atuais de BD, VNI, VRF, EVPN e SRV6;
  • se o redirecionamento é executado regularmente no nível de serviço e, em particular, quais são as configurações para a conexão TCP.


Existem duas tecnologias no centro de um serviço de monitoramento inteligente. O primeiro é o sistema "gêmeo digital" mencionado anteriormente, que se baseia na modelagem virtual da situação da rede em tempo real usando big data, que permite rastrear facilmente as relações de causa e efeito e encontrar fontes de dificuldade. O ponto crítico para a implementação dessa mecânica é ter um modelo único para replicar o ciclo de vida da rede corporativa.



O segundo é um conjunto de soluções front-end e back-end usadas para construir um mapa de alta precisão da atividade de rede, que é construído com base no conceito de “gêmeo digital”. A parte do front-end inclui pesquisa inteligente, detalhamento de vários níveis de relatórios analíticos, navegação de roteamento, um sistema integrado de visualização de dados, etc. O back-end é principalmente um mecanismo para reproduzir dinamicamente a topologia de rede e um sistema para importação flexível de modelos de rede de terceiros.







O trabalho de monitoramento inteligente é apoiado pelo uso de um método de análise de rede inteligente baseado em gráficos de conhecimento.



Por meio da modelagem, descrições abstratas de elementos de rede podem ser traduzidas em consultas concretas no plano do modelo de objeto.



Usando telemetria, KPIs de rede, fluxos de tráfego no nível de serviço, informações de configuração e logs de eventos de rede são monitorados - e com base nessas informações, algoritmos de aprendizado de máquina capturam desvios da norma em tempo real e os correlacionam com os dados do modelo de objeto.



Além disso, a plataforma iMaster NCE fornece um ambiente para trabalhar com segurança as consequências potenciais de todos os tipos de falhas: problemas que ocorreram em outras redes da vida real são "testados" na simulação dessa rede específica. Assim, recorrendo à experiência combinada de especialistas que anteriormente conseguiram lidar com certas situações anormais de rede, treinamos modelos de ML para que ajudem ainda mais eficazmente a superar excessos - incluindo a identificação de padrões de novos problemas e, assim, multiplicando o geral conhecimento disponível para todas as empresas que utilizam o iMaster NCE.







As tecnologias listadas anteriormente permitem que o administrador da rede detecte problemas rapidamente. No entanto, a análise intelectual não é suficiente - é importante ajudar uma pessoa a tomar as decisões mais eficazes para superá-las, que é a própria essência do ADN: agora essas decisões são desenvolvidas e implementadas com a ajuda direta da IA.



Coletar intenções e analisar dados sobre o que está acontecendo na rede em tempo real, tomando decisões, implementando-as e analisando as consequências de sua adoção formam um ciclo fechado que torna possível a tomada de decisões inteligentes. Quatro fatores são fundamentais para a eficácia desse modelo de trabalho.



  1. , : , on-premise cloud- ML-, iMaster NCE.
  2. . .
  3. . , , .
  4. . .


***



Os engenheiros da Huawei continuam a aprimorar as soluções ADN para aumentar o grau de "autossuficiência" da infraestrutura de rede e sua capacidade de "autocura", e certamente escreveremos sobre novos desenvolvimentos nessa direção. E você pode se familiarizar com a solução do iMaster NCE-Fabric ao vivo em nossa nuvem de demonstração com a ajuda dos engenheiros de pré-venda da Huawei.



All Articles