

O que determina quais tecnologias são necessárias para soluções de rede
Os requisitos para os equipamentos de rede mais recentes são agora orientados por quatro tendências principais:
- a proliferação da banda larga móvel 5G;
- o crescimento das cargas de nuvem em data centers privados e públicos;
- a expansão do mundo IoT;
- crescente demanda por inteligência artificial.
Durante a pandemia, outra tendência geral surgiu: os cenários com uma presença física reduzida tanto quanto possível em favor de uma virtual estão se tornando mais atraentes. Incluem, entre outros, serviços e soluções virtuais e de realidade aumentada baseadas em redes Wi-Fi 6. Todas estas aplicações requerem um canal de alta qualidade. O NetEngine 8000 se destina a fornecê-lo.

Família NetEngine 8000
Os dispositivos da família NetEngine 8000 são divididos em três séries principais. Marcados com a letra X estão os modelos principais de alto desempenho para operadoras de telecomunicações ou para centros de dados de alta carga. A série M foi projetada para a implementação de vários cenários de metrô. E os dispositivos com o índice F destinam-se principalmente à implementação de cenários DCI comuns (Data Center Interconnect). A maioria dos modelos de 8K pode fazer parte de túneis ponta a ponta com largura de banda de 400 Gbps e manter um nível de serviço garantido (Service Level Agreement - SLA).

Fato: hoje apenas a Huawei fabrica uma linha completa de equipamentos para organizar redes da classe 400GE. A ilustração acima mostra um cenário de construção de uma rede para um grande cliente empresarial ou grande operadora. No último caso, são usados roteadores de núcleo NetEngine 9000 de alto desempenho, bem como novos roteadores NetEngine 8000 F2A capazes de agregar um grande número de conexões de 100, 200 ou 400 Gb / s.
As fábricas do Metro são baseadas em dispositivos da série M. Tais soluções permitem se adaptar ao crescimento de dez vezes no volume de tráfego, que é esperado para a próxima década, sem alterar a plataforma.

A Huawei fabrica módulos ópticos de forma independente com largura de banda de 400 Gbps. As soluções construídas neles são 10-15% mais baratas do que outras semelhantes em capacidade, mas usam canais de 100 gigabit. Os testes dos módulos foram iniciados em 2017, e já em 2019 ocorreu a primeira implantação dos equipamentos baseados neles; A operadora de telecomunicações africana Safaricom está atualmente comercializando esse sistema.

A enorme largura de banda do NetEngine 8000, que pode parecer excessiva em 2020, será definitivamente necessária em um futuro não muito distante. Além disso, o roteador é adequado para uso como um grande ponto de troca, o que certamente será útil tanto para operadoras de segunda linha quanto para grandes estruturas empresariais em fase de rápido crescimento e criadoras de soluções de governo eletrônico.

A Huawei também promove a proliferação de uma série de novas tecnologias, incluindo o protocolo de roteamento SRv6, que simplifica muito a entrega do tráfego VPN da operadora. A tecnologia FlexE (Ethernet flexível) fornece largura de banda garantida no segundo nível do modelo OSI, e iFIT (In-situ Flow Information Telemetry) permite rastrear com precisão os parâmetros de atendimento às condições de SLA.

Do ponto de vista de um provedor, o SRv6 pode ser aplicado da camada de contêiner em um data center construído em NFV (Network Functions Virtualization) para, por exemplo, um ambiente de banda larga sem fio. Os clientes corporativos precisarão do uso ponta a ponta do novo protocolo ao construir redes de backbone (backbone). A tecnologia, destacamos, não é proprietária e é utilizada por diferentes fornecedores, o que elimina os riscos de incompatibilidade.

É assim que se parece o cronograma para comercializar a tecnologia SRv6 para oferecer suporte a soluções 5G. Caso prático: a empresa árabe Zain Group, em processo de transição para o uso de 5G, modernizou sua rede, aumentando a capacidade dos canais de backbone, e também melhorou a gerenciabilidade da infraestrutura com a introdução do SRv6.

Como aplicar essas tecnologias
Três produtos diferentes foram usados anteriormente como o “guarda-chuva da tecnologia” cobrindo as soluções acima. U2000 foi usado como NMS para domínio de transmissão e domínio IP. Além disso, os sistemas SDN usavam sistemas uTraffic e o muito mais famoso Agile Controller. No entanto, essa combinação acabou não sendo muito conveniente para roteadores de nível de operadora, então agora esses produtos são combinados na ferramenta CloudSoP .

Em primeiro lugar, permite gerir na íntegra o ciclo de vida da infraestrutura, desde a construção de uma rede - óptica ou IP. Também é responsável pela gestão de recursos, tanto padrão (MPLS) como novos (SRv6). Finalmente, o CloudSoP torna possível atender totalmente a todos os serviços com um alto nível de granularidade.

Vamos examinar mais de perto a abordagem clássica de gerenciamento. Nesse caso, isso pode ser feito usando L3VPN ou SR-TE, que oferece opções adicionais para a criação de túneis. Para alocar recursos para várias tarefas de serviço, mais de uma centena de parâmetros e roteamento de segmento são usados.

Como é a implantação de tal serviço? Primeiro, você precisa definir a política primária para um nível específico (plano). No diagrama acima, foi selecionada a tecnologia SRv6, com a qual se configura a entrega do tráfego do ponto A ao ponto E. O sistema calculará os caminhos possíveis levando em consideração a largura de banda e os atrasos, e também criará parâmetros para posterior controle.

Após a configuração, estamos começando a criar e lançar serviços VPN adicionais. Uma vantagem séria da solução da Huawei é que, ao contrário da Engenharia de Tráfego MPLS padrão, ela permite sincronizar caminhos de túneis sem quaisquer add-ons adicionais.

O diagrama acima mostra o processo geral de captura de informações. O SNMP é freqüentemente usado para isso, o que leva muito tempo e fornece um resultado médio. No entanto, a telemetria, que antes usávamos em centros de dados e soluções de campus, chegou ao mundo das redes de operadoras. Ele adiciona uma carga, mas permite que você entenda o que está acontecendo na rede não a cada minuto, mas no nível inferior a um segundo.

Obviamente, o volume de tráfego recebido deve ser “digerido” de alguma forma. Para isso, é usada tecnologia de aprendizado de máquina adicional. Com base em padrões pré-carregados das falhas de rede mais comuns, o sistema de monitoramento é capaz de prever a probabilidade de excessos. Por exemplo, uma quebra de um módulo SFP (Small Form-factor Pluggable) ou uma explosão repentina de tráfego na rede.

E é assim que se parece um sistema de controle de scale-out baseado nos servidores ARM TaiShan e banco de dados GaussDB. Os nós individuais do sistema analítico têm o conceito de "funções", que permite expandir granularmente os serviços de diagnóstico com um aumento no tráfego ou um aumento no número de nós da rede.
Em outras palavras, tudo que era bom no mundo do armazenamento está gradualmente entrando na área de gerenciamento de rede.

Um exemplo notável da introdução de nossas novas tecnologias é o Banco Industrial e Comercial da China (ICBC). Ele implantou uma rede de backbone de roteadores de alto desempenho com funções específicas atribuídas. De acordo com o NDA, podemos apenas dar uma ideia geral da estrutura da rede no diagrama. Inclui três grandes data centers conectados por túneis de ponta a ponta e 35 sites adicionais (data centers de segunda camada). Ambas as conexões padrão e SR-TE são usadas.

Arquitetura inteligente de 3 camadas de IP WAN
As soluções da Huawei são baseadas em uma arquitetura de três camadas, sendo que no nível inferior existem equipamentos de diferentes desempenhos. No segundo nível, há um ambiente de gerenciamento de equipamentos e serviços adicionais que estendem a funcionalidade de análise e controle de rede. A camada superior, relativamente falando, é aplicada. Os cenários de aplicação mais comuns envolvem a organização de redes de operadoras de telecomunicações, instituições financeiras, empresas de energia e agências governamentais.
Aqui está um pequeno vídeo que descreve os recursos do NetEngine 8000 e as soluções técnicas usadas nele:
Obviamente, o equipamento deve ser projetado para acomodar o crescimento do tráfego e a expansão da infraestrutura, levando em consideração o fornecimento de energia e o resfriamento adequados. Quando o modelo de roteador carro-chefe é equipado com 20 PSUs de 3 kW cada, o uso de nanotubos de carbono no sistema de remoção de calor não parece mais redundante.

Para que serve tudo isso? Parece uma fantasia, mas agora para nós 14,4 Tbit / s por slot é bastante viável. E essa largura de banda incompreensível está em alta. Em particular, todas as mesmas empresas financeiras e de energia, muitas das quais hoje possuem redes de backbone criadas com a tecnologia DWDM (Dense Wavelength Division Multiplexing). Eventualmente, o número de aplicativos que exigem velocidades cada vez maiores também está crescendo.
Um de nossos cenários para construir redes de aprendizado de máquina entre dois clusters Atlas 900 também requer largura de banda de classe terabit. E há muitas tarefas semelhantes. Estes incluem, em particular, computação nuclear, cálculos meteorológicos, etc.


Base de hardware e seus requisitos
Os diagramas mostram os módulos do roteador LPUI atualmente disponíveis com placas integradas e suas características.

E é assim que o roadmap se parece com novas opções de módulos que estarão disponíveis nos próximos dois anos. Ao desenvolver soluções baseadas neles, é importante considerar o consumo de energia. Agora, os data centers padrão são construídos a uma taxa de 7-10 kW por rack, enquanto o uso de roteadores da classe terabit implica em um consumo de energia várias vezes maior (até 30-40 kW no pico). Isso acarreta a necessidade de projetar um site especializado ou criar uma zona separada de alta carga no data center existente.

Uma visão geral do chassi revela que as fábricas estão escondidas atrás da montagem do ventilador do meio. Existe a possibilidade de sua substituição "quente", realizada graças à redundância segundo o esquema 2N ou N + 1. Em essência, esta é uma arquitetura ortogonal padrão de alta confiabilidade.

Não apenas carros-chefe
Não importa o quão impressionantes sejam os modelos principais, a maioria das instalações cai nas soluções de caixa das séries M e F.
Os roteadores de serviço mais populares agora são os modelos M8 e M14. Eles permitem trabalhar com interfaces de baixa velocidade, como E1, e de alta velocidade (100 Gb / s agora e 400 Gb / s no futuro próximo) dentro de uma plataforma.

O desempenho do M14 é suficiente para satisfazer todas as necessidades dos clientes empresariais comuns. Pode ser usado para construir soluções L3VPN padrão para comunicação com fornecedores, também é bom como uma ferramenta adicional, por exemplo, para coletar telemetria ou usar SRv6.

Um grande número de cartões está disponível para o modelo. Não há fábricas separadas e supervisores são usados para garantir a conectividade. Assim, consegue-se a distribuição do desempenho pelas portas indicadas no diagrama.

Futuramente, o supervisor poderá ser substituído por um novo, o que dará novo desempenho nas mesmas portas.

O modelo M8 é um pouco menor que o M14, o desempenho também é inferior ao modelo mais antigo, mas seus casos de uso são muito semelhantes.

Um conjunto de cartões físicos compatíveis com M8 permite, por exemplo, configurar uma conexão para dispositivos P através de uma interface de 100 Gbps, usar a tecnologia FlexE e criptografar tudo isso.

De modo geral, é com o M6 que você pode começar a trabalhar com seu ambiente de operador. É pequeno e não adequado para provedores, mas é facilmente aplicável como um ponto de agregação de tráfego para conectar centros de dados regionais, por exemplo, em um banco. Além disso, o conjunto de software aqui é o mesmo dos modelos mais antigos.

As placas disponíveis para o M6 são menores e o desempenho máximo é de 50 Gb / s, que, no entanto, é visivelmente maior do que as soluções padrão de 40 Gb / s do setor.

O modelo mais jovem, o M1A, merece uma menção separada. Esta é uma solução pequena, que pode ser útil quando uma faixa de temperatura operacional estendida é esperada (-40 ... +65 ° C).

Algumas palavras sobre a linha F. O modelo NetEngine 8000 F1A tornou-se um dos produtos mais populares da Huawei em 2019, inclusive por ser equipado com portas com largura de banda de 1 a 100 Gbps (até 1,2 Tbps no total )

Mais sobre SRv6
Por que exatamente agora precisamos incluir suporte para a tecnologia SRv6 em nossos produtos?
Atualmente, o número de protocolos necessários para organizar túneis VPN pode ser 10+, o que causa sérios problemas de gerenciamento e sugere a necessidade de simplificar radicalmente o processo.

A resposta da indústria a este desafio foi a criação da tecnologia SRv6, no surgimento da qual Huawei e Cisco tiveram uma participação.

Uma das limitações que precisava ser removida era a necessidade de usar o comportamento por salto (PHB) para o roteamento de pacotes padrão. É muito difícil estabelecer interação "entre operadoras" por meio do Inter-AS MP-BGP com serviços adicionais (VPNv4), portanto, há muito poucas soluções desse tipo. SRv6 permite que você roteie inicialmente um pacote através de todo o segmento sem escrever túneis especiais. E a programação dos próprios processos é simplificada, o que torna as grandes implantações muito mais fáceis.

O diagrama mostra um caso de implementação do SRv6. As duas WANs foram vinculadas por vários protocolos diferentes. Para receber serviço de qualquer servidor virtual ou de hardware, um grande número de handovers foi necessário entre VXLAN, VLAN, L3VPN, etc.
Após a implementação do SRv6, a operadora tinha um túnel ponta a ponta nem mesmo para o servidor de hardware, mas para o contêiner Docker.

Saiba mais sobre a tecnologia FlexE
O segundo nível do modelo OSI é ruim porque não fornece os serviços necessários e o nível de SLA de que os provedores precisam. Eles, por sua vez, gostariam de obter algum análogo do TDM (multiplexação por divisão de tempo), mas em Ethernet. Muitas abordagens foram usadas para resolver o problema, com resultados muito limitados.

O Flex Ethernet serve justamente para garantir a qualidade da camada SDH (Synchronous Digital Hierarchy) e TDM em redes IP. Isso se tornou possível graças ao trabalho com o forwarding plane, quando modificamos o ambiente L2 desta forma para que se torne o mais eficiente possível.

Como funciona qualquer porta física padrão? Há um certo número de filas e um anel tx. Um pacote no buffer está aguardando seu processamento, o que nem sempre é conveniente, especialmente se houver fluxos de elefantes e ratos.
Inserções adicionais e outra camada de abstração ajudam a fornecer largura de banda garantida no nível do ambiente físico.

Uma camada MAC adicional é alocada no nível de transferência de informações, o que permite que você crie filas físicas rígidas que podem receber SLAs específicos.

É assim que parece no nível de implementação. A camada adicional realmente implementa o enquadramento TDM. Com essa meta-inserção, é possível enfileirar e moldar serviços TDM de maneira granular pela Ethernet.

Um dos casos de uso do FlexE envolve uma aderência muito estrita ao SLA, criando intervalos de tempo para equalizar a largura de banda ou fornecer recursos para serviços críticos.

Outro cenário permite trabalhar com defeitos. Em vez de simplesmente hash na transmissão de informações, formamos canais separados praticamente no nível físico, em contraste com os virtuais criados por QoS (Quality of Service).

Saiba mais sobre o iFIT
Assim como o FlexE, o iFIT é uma tecnologia licenciada da Huawei. Ele permite revisões de SLA muito granulares. Ao contrário dos mecanismos IP SLA e NQA padrão, o iFIT opera não com tráfego sintético, mas com tráfego “ativo”.

O IFIT está disponível em todos os dispositivos que oferecem suporte à telemetria. Para isso, um campo adicional é usado que não é ocupado pelos dados de opção padrão. Lá são gravadas informações que permitem entender o que está acontecendo no canal.
***
Resumindo o que foi dito, enfatizamos que a funcionalidade do NetEngine 8000 e as tecnologias incorporadas ao "oitavo milésimo" tornam esses dispositivos uma escolha razoável e justificada na criação e desenvolvimento de redes de classe de operadora, redes de backbone de empresas de energia e financeiras, bem como sistemas do nível de "governo eletrônico".