Por muitos anos no mercado de processadores e chipsets para servidores, a Intel governou incondicionalmente com seus xeons, mas em 2017 a AMD finalmente competiu com eles com o lançamento da primeira linha de seus novos processadores para servidores EPYC. Desde então, sua posição apenas se fortaleceu, e a programação foi renovada com uma nova versão de "épicos". A AMD fornece seus processadores modernos para muitas empresas conhecidas, incluindo Dropbox, Hetzner, Linode, CERN, OVHcloud, Scaleway, várias universidades e organizações menores, incluindo data centers. Todos elogiam as plataformas do EPYC e as recomenda para organizar e dimensionar um cluster de servidores de alto desempenho.
Quando começou a chegar a notícia de que a AMD começou a fazer processadores que ultrapassavam
os processadores Intel em termos de desempenho e relação preço / qualidade, começamos a pensar em um serviço separado para esta plataforma. A escolha recaiu sobre o Supermicro A + Server 2124BT-HNTR . O servidor é composto por 4 nós, cada nó possui a seguinte especificação:
- Processadores: 2 processadores AMD EPYC 7742 de 64 núcleos de 2,25 GHz;
- Memória: 16x64 GB de RAM 3200 MT / s;
- Discos NVMe para o cluster: 4x INTEL SSDPE2KE076T8;
- Disco do sistema: 1x INTEL SSDSC2KB240G8;
- Controlador de rede: AOC-MH25G-m2S2T.
Todas as características
Não existia tal servidor em Moscou e na Rússia, tivemos que encomendá-lo diretamente do
fabricante. Depois de uma espera, que foi complementada por alguns problemas logísticos associados ao COVID-19, o servidor acabou conosco no início de junho.
Montagem
À primeira vista, parecia-nos que não havia nada de particularmente épico no servidor, já que temos experiência em trabalhar com plataformas de 12 nós para o serviço de servidores Hi-CPU . A mesma plataforma representa apenas quatro nós independentes, mas ainda não entendemos quanta potência eles fornecem no agregado.
Testes
Depois da montagem, claro, queríamos carregar o servidor, estamos lidando com um monstro, no
total, que tem 1024 núcleos, 4TB de RAM em 4 nós: Imagem clicável Os resultados do teste de desempenho nos impressionaram. A qualidade de construção dos engenheiros da Supermicro também é agradável.
Instalação
Nós o
montamos em um rack e começamos a montar o cluster: O cluster é montado nesses 4 nós. No futuro, o cluster pode ser dimensionado em
equipamentos semelhantes ou em equipamentos semelhantes de outros fornecedores. A rede pública do cluster está localizada nas
interfaces 25Gbps (SFP28), a rede privada também é de 25Gbps (SFP28).
Revisão de software
Os fundamentos e princípios estabelecidos no software de gestão de atendimento ao cliente permitiram finalizar rapidamente o código da nova arquitetura, sendo lançado em meados de junho o serviço Epic Servers .
Benefícios para nós e clientes
O AMD EPYC permite criar tarifas de até EPIC 128 x 3,4 GHz CPU / 512 GB RAM / 4000 GB NVMe, que ninguém pode oferecer em uma plataforma com processadores Intel. Além disso, usamos apenas NVMe NAS com replicação tripla de dados.
Durante 2 meses de trabalho com esta plataforma, sentimos todos os seus encantos - os clientes podem ter os mesmos recursos que no caso da Intel, mas por menos dinheiro. Um nó com 2 CPUs da AMD substitui 10 nós por 2 CPUs Intel escalável Silver.

Uma colher de alcatrão
Esse servidor é muito caro - o custo é de cerca de US $ 150.000 e, claro, foi comprado com pré-pagamento integral, na verdade, estávamos comprando um porco em uma pica, já que nunca havíamos trabalhado com servidores AMD antes.
O segundo ponto, QEMU-KVM não permite a migração ininterrupta de máquinas virtuais de AMD para Intel e vice-versa, mas usando nossa funcionalidade de backup , você pode alternar de um tipo de servidor para outro a qualquer momento sem perda de dados.
O cluster nos mostrou indicadores de desempenho até então desconhecidos, que naturalmente
começaram a afetar a temperatura dos processadores. Mesmo com uma carga de processador de 30% em um nó, a temperatura estava se aproximando de 95 graus. Otimizamos um pouco o resfriamento em
rack, mas não deu nenhum resultado significativo. Em seguida, em forma de teste, a tampa do gabinete do servidor foi removida:
O salto de temperatura foi de mais de 10 graus e não passou de 80 graus, mesmo com uma
carga de mais de 70%, o que mais que nos satisfaz. Também há planos para colocar resfriamento adicional no rack.
Resultado
Como resultado, o servidor mais do que atendeu às nossas expectativas, o processador AMD EPYC 7742 nos parece inquebrável sob carga. O esquema baseado em tais soluções continuará a
crescer, com o tempo planejamos lançar este serviço na Holanda. Gostamos de trabalhar com o EPYC e esperamos que você goste também!
