Huawei DCN: cinco cenários para a construção de uma rede de data center

Hoje, nosso foco não está apenas na linha de produtos de rede da Huawei, mas também em como criar soluções avançadas de ponta a ponta com base nelas. Vamos começar com os cenários, passar para as funções específicas suportadas pelo equipamento e terminar com uma visão geral de dispositivos específicos que podem formar a base de data centers modernos com o mais alto nível de automação dos processos de rede.







Não importa quão impressionantes sejam as características do equipamento de rede, os recursos das soluções arquiteturais aplicadas baseadas nele são determinados pela eficácia da integração mútua de hardware, software, virtual e outras tecnologias associadas a ele. Tentando acompanhar os tempos, tentamos oferecer prontamente aos nossos clientes oportunidades modernas e promissoras, que muitas vezes superam as idéias mais ousadas de outros fornecedores.







As soluções do Cloud Fabric incluem uma rede de datacenter, controlador SDN e outros componentes necessários para um projeto específico, incluindo os de outros fabricantes.



O primeiro e mais simples cenário envolve o uso de um número mínimo de componentes: a rede é construída com hardware da Huawei e ferramentas de terceiros para automatizar os processos de gerenciamento e monitoramento de rede. Por exemplo, como Ansible ou Microsoft Azure.



O segundo cenário supõe que o cliente já esteja usando virtualização e SDN para data centers, digamos NSX, e queira usar o equipamento Huawei como um VTEP de hardware (Vitual Tunnel End Point) na solução VMware existente. O site desta empresa contém uma lista deEquipamento Huawei que foi testado e pode ser usado como um VTEP. Afinal, não é segredo para ninguém que, por mais bem-sucedidas as soluções de software VXLAN (LAN virtual extensível) em comutadores virtuais, as implementações de hardware são mais eficientes em termos de desempenho.



O terceiro cenário é a construção de sistemas de classe de hospedagem e computação que incluem um controlador, mas são privados de qualquer plataforma de nível superior com a qual integrar. Uma das opções para implementar esse cenário pressupõe um controlador Agile Controller-DCN SDN separado. Os administradores de sistema podem usar essa arquitetura para executar operações diárias de gerenciamento de rede. Uma versão mais avançada do terceiro cenário é baseada na interação do Agile Controller-DCN com o VMware vCenter, unido por um determinado processo de negócios, mas novamente sem um sistema de administração de nível superior.



O quarto cenário é notável - integração com uma plataforma upstream baseada no OpenStack ou em nosso produto de virtualização FusionSphere. Registramos muitas solicitações de soluções arquiteturais semelhantes, entre as quais o OpenStack é o mais popular (CentOS, Red Hat etc.). Tudo depende de qual plataforma de gerenciamento de recursos de orquestração e computação é usada no data center.



O quinto cenário é completamente novo. Além dos comutadores de hardware conhecidos, ele inclui um comutador virtual distribuído CloudEngine 1800V (CE1800V), que só pode ser operado com uma KVM (Máquina Virtual Baseada em Kernel). Essa arquitetura envolve a combinação do Agile Controller-DCN com a plataforma de contêiner Kubernetes usando o plug-in CNI. Assim, a Huawei está se movendo junto com o mundo inteiroda virtualização do host à virtualização do sistema operacional .







Mais sobre contêiner



Mencionamos anteriormente o comutador virtual CE1800V implantado usando o Agile Controller-DCN. Em combinação com os switches de hardware da Huawei, eles formam uma espécie de "sobreposição híbrida". Em um futuro próximo, os scripts de contêiner da Huawei receberão suporte para funções de balanceamento de carga e NAT.



Uma limitação da arquitetura é que o CE1800V não pode ser usado separadamente do Agile Controller-DCN. Também deve-se ter em mente que um PoD da plataforma Kubernetes pode conter não mais de 4 milhões de contêineres.



A conexão com a rede VXLAN do data center ocorre via VLAN (Rede Local Virtual), no entanto, existe uma opção na qual o CE1800V atua como um VTEP com o processo BGP (Border Gateway Protocol). Isso permite que as rotas BGP sejam trocadas com o backbone sem a necessidade de switches de hardware separados.







Redes orientadas a intenção: redes de análise de intenção



A Huawei introduziu o conceito Intent-Driven Network (IDN) em 2018. Desde então, a empresa continua trabalhando em redes que permitem que a computação em nuvem, big data e inteligência artificial analisem os objetivos e intenções dos usuários.



Basicamente, estamos falando de passar da automação para a autonomia. A intenção expressa pelo usuário é retornada na forma de recomendações dos produtos da web sobre como implementar essa intenção. Essa funcionalidade é baseada nos recursos do Agile Controller-DCN que serão adicionados ao produto para garantir que a ideologia do IDN seja incorporada.



No futuro, com a introdução do IDN, será possível implantar serviços de rede em um clique, o que implica o mais alto grau de automação. A arquitetura modular das funções de rede e a capacidade de combinar essas funções permitirão ao administrador simplesmente especificar quais serviços devem ser disponibilizados em um segmento de rede específico.



Para atingir esse nível de controlabilidade, o processo ZTP (Zero Touch Provisioning) é essencial. A Huawei fez avanços significativos nisso, oferecendo a capacidade de implantar totalmente a rede imediatamente.



O processo adicional de instalação e implantação inclui necessariamente um procedimento para verificar a conectividade entre recursos (conectividade de rede) e avaliar as alterações no desempenho da rede, dependendo de seus modos operacionais. Esta etapa envolve a realização de uma simulação antes de iniciar a operação real.



A próxima etapa é o provisionamento e a verificação de serviços executados pelas ferramentas internas da Huawei. Resta apenas controlar o resultado.



Toda a jornada agora está completa com um único mecanismo de ponta a ponta alimentado pelo iMaster NCE, que contém o Agile Controller-DCN e o eSight Element Management System (EMS).







No momento, o Agile Controller-DCN é capaz de verificar a disponibilidade de recursos e a presença de conexões, além de responder proativamente (após a aprovação do administrador) a problemas na rede. A adição dos serviços necessários agora é feita manualmente, mas no futuro a Huawei pretende automatizar esta e outras operações, como implantação de servidores, configuração de redes para sistemas de armazenamento, etc.







Cadeias de serviços e microssegmentação



O Agile Controller-DCN é capaz de lidar com NSH (Net Service Headers) contidos em pacotes VXLAN. Isso é útil para criar cadeias de serviço. Por exemplo, você pretende enviar um certo tipo de pacotes ao longo de uma rota diferente daquela oferecida pelo protocolo de roteamento padrão. Antes de sair da rede, eles devem passar por algum tipo de dispositivo (firewall, etc.). Para fazer isso, basta configurar a cadeia de serviços que contém as regras necessárias. Devido a esse mecanismo, é possível, por exemplo, configurar políticas de segurança, mas outras áreas de sua aplicação também são possíveis.







O diagrama mostra claramente a operação de cadeias de serviço compatíveis com RFC com base no NSH, bem como uma lista de comutadores de hardware que os suportam.







Os recursos das soluções de cadeia de serviços da Huawei são complementados por ferramentas de microssegmentação, um método de segurança de rede que isola os segmentos de segurança em elementos de carga de trabalho individuais. Ignorando o gargalo da lista de controle de acesso (ACL), não há necessidade de configurar manualmente um grande número de ACLs.







Operação inteligente



Passando para a questão da operação de rede, não se pode deixar de mencionar outro componente da marca abrangente iMaster NCE - o analisador de rede inteligente FabricInsight. Ele fornece amplos recursos para coletar telemetria e informações sobre fluxos de dados na rede. A telemetria é coletada usando o gRPC e acumula dados passados, atrasados ​​no buffer e pacotes perdidos. A segunda grande variedade de informações é agregada por meio do ERSPAN (Analisador de porta de switch remoto encapsulado) e fornece uma idéia dos fluxos de dados no data center. Basicamente, estamos falando sobre a coleta de cabeçalhos TCP e a quantidade de informações transmitidas durante cada sessão TCP. Isso pode ser feito usando vários dispositivos Huawei - uma lista deles é apresentada no diagrama.



O SNMP e o NetStream também não são esquecidos; portanto, a Huawei está usando mecanismos antigos e novos para passar da rede caixa preta para a rede sobre a qual sabemos literalmente tudo.







AI Fabric: Redes inteligentes sem perdas



Os recursos do AI Fabric suportados pelo nosso hardware foram projetados para transformar a Ethernet em uma rede de alto desempenho, baixa latência e sem perda de pacotes. Isso é necessário para implementar os principais cenários de implantação de aplicativos em uma rede de datacenter.







No diagrama acima, vemos os problemas que existe o risco de encontrar ao operar a rede:



  • perda de pacotes;
  • estouro de buffer;
  • o problema da carga ideal da rede ao usar links paralelos.




O equipamento Huawei implementa mecanismos para resolver todos esses problemas. Por exemplo, no nível do chip, a tecnologia de filas de entrada virtuais foi implementada, o que ao mesmo tempo não permite o bloqueio na entrada (bloqueio de HOL).



No nível do protocolo, existe um mecanismo Dynamic ECN - alteração dinâmica do tamanho do buffer e Fast CNP - envio rápido de pacotes de mensagens sobre um problema de rede para a origem.



A igualdade de direitos dos fluxos Elephant e Mice ajuda a suportar a tecnologia DPP (Dynamic Packet Prioritization), que consiste em colocar pequenos pedaços de dados de diferentes fluxos em uma fila separada de alta prioridade. Assim, pacotes curtos "sobrevivem" melhor no ambiente de fluxos longos e pesados.



Esclareçamos que, para que os mecanismos acima funcionem efetivamente, eles devem ser suportados diretamente pelo equipamento.







Todas essas funções são aplicadas em um dos três casos de uso para equipamentos Huawei:



  • ao construir sistemas de inteligência artificial baseados em aplicativos distribuídos;
  • ao criar sistemas de armazenamento de dados distribuídos;
  • ao criar sistemas para computação de alto desempenho (HPC).








Ideias incorporadas no "hardware"



Depois de discutir os casos de uso típicos das soluções Huawei e listar seus principais recursos, vamos diretamente ao equipamento.



O CloudEngine 16800 é uma plataforma que fornece trabalho em interfaces de 400 Gbps. Sua característica é a presença, junto com a CPU, de seu próprio chip de encaminhamento e de um processador de inteligência artificial, necessário para implementar os recursos do AI Fabric.







A plataforma é feita de acordo com a arquitetura ortogonal clássica, com um sistema de fluxo de ar da frente para trás e vem com um dos três tipos de chassi - 4 (10U), 8 (16U) ou 16 (32U) slots de chassi.







Vários tipos de placas de linha podem ser usados ​​no CloudEngine 16800. Entre eles estão os tradicionais 10-gigabit e 40-, bem como 100-gigabit, incluindo completamente novos. Cartões com interfaces de 25 e 400 Gbit / s estão planejados para lançamento.







Quanto aos comutadores ToR (parte superior do rack), seus modelos atuais são indicados na linha do tempo acima. De grande interesse são os novos modelos de 25 gigabit, comutadores de 100 gigabit com uplinks de 400 gigabit e comutadores de 100 gigabit de alta densidade com 96 portas.







O principal switch Huawei com uma configuração fixa no momento é o CloudEngine 8850. Ele deve ser substituído pelo modelo 8851 por 32 interfaces de 100 Gb / se oito interfaces de 400 Gb / s, além da possibilidade de dividi-los em 50, 100 ou 200 Gb / s. ...







Outro switch de configuração fixa, CloudEngine 6865, permanece na atual linha de produtos da Huawei. É uma força de trabalho comprovada, com acesso a 10/25 Gbps e oito uplinks de 100 Gbps. Além disso, ele também suporta o AI Fabric.











O diagrama mostra as características de todos os novos modelos de switch, cuja aparência esperamos nos próximos meses ou até semanas. Algum atraso na sua liberação é devido à situação em torno do coronavírus. Além disso, embora as questões de pressão das sanções sobre a Huawei permaneçam relevantes, no entanto, todos esses eventos podem afetar apenas o momento do primeiro-ministro.



É fácil obter mais informações sobre as soluções da Huawei e seus casos de uso inscrevendo-se em nossos seminários on-line ou entrando em contato diretamente com a Huawei.



***



Lembramos que nossos especialistas realizam regularmente seminários on-line sobre produtos Huawei e as tecnologias que eles usam. Uma lista de webinars para as próximas semanas está disponível aqui .



All Articles