Temos o prazer de anunciar o lançamento de uma prévia pública de uma imagem de máquina virtual (VM) baseada em CentOS 7 otimizada para computação de alto desempenho (HPC). Ele foi projetado principalmente para cargas de trabalho de interface de passagem de mensagem (MPI) fortemente acopladas. Este artigo detalha a imagem VM específica para HPC e seus benefícios. Para começar a criar instâncias a partir desta imagem, leia a documentação e o guia de início rápido.
Em 2020, falamos sobre uma série de funções e configurações para otimizar a interface MPI na plataforma Google Cloud. Eles reduzem o atraso nas mensagens para alguns microssegundos. e fornecer entrega de pequenas mensagens MPI em 10 microssegundos ou menos. A otimização de MPI melhora o dimensionamento do aplicativo e aumenta o número de tarefas que podem ser executadas na plataforma Google Cloud. No entanto, para criar uma imagem de VM com essas técnicas em mente, você precisa de um conhecimento profundo dos sistemas e plataforma do Google Cloud. Portanto, é mais lógico começar a trabalhar com uma imagem originalmente calculada e preparada para computação de alto desempenho. Ele permite que você implante facilmente uma instância de VM ajustada para CPU e desempenho de rede ideais para o Google Cloud. A imagem HPC VM está disponível no Google Cloud Marketplace sem custo adicional.
Benefícios da imagem HPC VM em relação às imagens VM tradicionais
Ao escolher uma imagem HPC VM, você obtém uma configuração pronta para uso, manutenção regular e os seguintes benefícios de HPC no Google Cloud:
- Crie facilmente máquinas virtuais personalizadas para cargas de trabalho fortemente acopladas . Crie facilmente uma VM HPC e atualize sua configuração regularmente com as configurações mais recentes.
- Otimizando redes para sistemas fortemente acoplados. Reduza a latência para pequenas mensagens e acelere os aplicativos que exigem comunicação ponto a ponto ou compartilhada.
- Computação mais eficiente. Melhore o desempenho em nós individuais reduzindo as vibrações do sistema.
- Desempenho estável e reproduzível de vários nós. Aplique configurações que se mostraram eficazes em uma variedade de tarefas de HPC.
A imagem HPC VM substitui facilmente a imagem padrão baseada no CentOS 7.
Exemplo do mundo real: Dimensionamento do programa de equação SDPB com CloudyCluster e HPC VM Image
Walter Londry do Caltech Particle Theory Group desenvolve software de pesquisa para o projeto internacional de Colaboração Bootstrap . O projeto usa um programa semi-definido para resolver equações (SDPB) . Com sua ajuda, as teorias quânticas de campo são investigadas em relação a uma ampla gama de problemas na física teórica, como a expansão do Universo primitivo, supercondutores, o efeito Hall quântico e as transições de fase.
Para expandir o poder de computação do projeto, Londri decidiu dimensionar o programa SDPB na plataforma Google Cloud. Usando Omnibond CloudyCluster e uma imagem VM para HPC, ele conseguiu trazer o projeto a níveis de desempenho e escalabilidade comparáveis a um cluster local em Yale, baseado em computadores com processadores Intel Xeon Gold 6240 e tecnologia Infiniband FDR.
A instância C2-Standard-60 para Google Cloud usa processadores escalonáveis Intel Xeon de segunda geração. As instâncias C2 oferecem suporte a regras de posicionamento que reduzem a latência de comunicação entre os nós, portanto, são ótimas para cargas de trabalho MPI fortemente acopladas. O CloudyCluster contém nativamente a imagem HPC VM e as regras de posicionamento para a família C2, de modo que os pesquisadores não precisam fazer nada extra. Os testes mostraram que o Google Cloud pode dimensionar cargas de trabalho de baixa latência em várias instâncias.
Se você quiser ver por si mesmo, visite o Google Cloud MarketplaceUma versão atualizada do CloudyCluster da Omnibond está disponível com uma imagem HPC VM. Esta versão também inclui o aplicativo Open OnDemand, que é distribuído pelo Ohio State Supercomputing Center e financiado pela NSF. Ele permite que os administradores de sistema forneçam facilmente acesso pela Web aos recursos HPC.
Recursos de imagem VM de computação de alto desempenho
Configurações e otimização. A imagem HPC VM atual se concentra no ajuste de cargas de trabalho fortemente acopladas e usa os seguintes aprimoramentos de desempenho de MPI:
- Intel Hyper-Threading. Intel Hyper-Threading . .
- MPI. MPI MPI. MPI Intel, MPI.
- tcp_*mem. C2 32 / TCP Linux.
- busy polling. busy polling , , .
- . , () , , , .
- Desative os firewalls do Linux e a tecnologia SELinux. O mecanismo SELinux e o firewall, que são habilitados por padrão para imagens CentOS Linux no Google Cloud, não são usados na imagem HPC VM. Isso melhora o desempenho do MPI.
- Desative o utilitário CPUIdle. As máquinas virtuais C2 mantêm um estado ocioso da CPU e podem entrar em um modo de baixo consumo de energia. Ao desativar o utilitário CPUIdle, você pode trazer a latência para um nível consistentemente baixo.
A eficácia dessas configurações depende da aplicação específica. Recomendamos que você os teste na prática para encontrar a configuração mais poderosa e econômica.
Análise comparativa da eficácia das imagens
Comparamos o desempenho de uma imagem HPC VM e uma imagem padrão CentOS 7 usando Benchmarks Intel MPI e análise de elementos finitos do mundo real (ANSYS LS-DYNA), dinâmica de fluidos (ANSYS Fluent) e aplicativos de clima (WRF).
Nesta seção, as seguintes versões da imagem HPC VM e da imagem CentOS foram feitas para comparação:
- Imagem HPC VM : hpc-centos-7-v20210119 (configurações --nomitigation e mpitune aplicadas conforme recomendado na documentação )
- Imagem CentOS : centos-7-v20200811
Intel MPI Benchmark (IMB) Ping-Pong - usado para medir a latência de uma mensagem de tamanho fixo entre duas classificações em um par de máquinas virtuais. Descobriu-se que ao usar uma imagem de VM para HPC, a latência é em média 50% menor em comparação com a imagem padrão do CentOS 7.
Configuração de teste:
- 2 VM C2-standard-60 com regras de colocação compactas
- Biblioteca MPI : Biblioteca Intel MPI 2018, atualização 4
- Comando de inicialização : mpirun -genv I_MPI_PIN = 1 -genv I_MPI_PIN_PROCESSOR_LIST = 0 -hostfile <hostfile> -np 2 -ppn 1 IMB-MPI1 Pingpong -iter 50000
Resultados
O teste AllReduce do Intel MPI Benchmark (IMB) é usado para medir a latência coletiva ao transferir dados entre várias classificações por meio de uma VM. Ele reduz um vetor de comprimento fixo usando a operação MPI_SUM. Os resultados são mostrados para um PPN (processo por nó), onde há 1 classificação MPI por nó e 30 threads por classificação, e os resultados para 30 PPNs, quando há 30 classificações MPI por nó e 1 thread por classificação. Em comparação com a imagem CentOS 7 padrão, a imagem HPC VM reduziu a latência AllReduce para 240 classificações MPI em 8 nós (30 processos por nó) em até 40%.
Configuração de teste:
- 8 VM C2-standard-60 com regras de colocação compactas
- Biblioteca MPI : Biblioteca Intel MPI 2018, atualização 4
- a : mpirun -tune -genv I_MPI_PIN=1 -genv I_MPI_FABRICS ‘shm:tcp’ -hostfile <hostfile> -np <#vm*ppn> -ppn <ppn> IMB-MPI1 AllReduce -iter 50000 -npmin <#vm*ppn>
Resultados
Testes de aplicações HPC: LS-DYNA, Fluent e WRF. Usando uma imagem HPC VM na camada de aplicativo, até 25% de ganhos de desempenho foram observados na simulação de colisão de 3 carros na análise ANSYS LS-DYNA (usando classificações de 240 MPI em 8 instâncias C2 baseadas no processador Intel Xeon) ... Como parte da análise ANSYS Fluent e WRF, a imagem HPC VM forneceu uma melhoria de desempenho de 6% em relação à imagem CentOS padrão.
Configuração de teste:
- ANSYS LS-DYNA (modelo “3 carros”) : 8 VM C2-standard-60 com regras de colocação compactas, usando código binário LS-DYNA MPP compilado com AVX-2
- ANSYS Fluent ( “aircraft_wing_14m”): 12 C2-standard-60
- WRF V3 Parallel Benchmark (12 KM CONUS): 16 C2-standard-60
- MPI: Intel MPI Library 2018 ( 4)
? SchedMD Slurm Linux
Estaremos expandindo a lista de soluções de parceiros que usam a imagem HPC VM padrão. A partir do próximo mês, todos os clientes Slurm poderão executar clusters usando a imagem HPC VM padrão (visualização disponível aqui ).
Boas notícias para quem procura uma versão empresarial do Linux para computação de alto desempenho! A SUSE está trabalhando com o Google para desenvolver uma imagem SUSE Enterprise HPC VM otimizada para o Google Cloud. Se desejar mais informações ou solicitar outras integrações e distribuições Linux, entre em contato conosco...
Comece hoje!
Uma prévia da imagem HPC VM agora está disponível para todos os usuários no Google Cloud Marketplace . Para obter informações sobre como instanciar usando uma imagem HPC VM, consulte a documentação e o guia de início rápido. Também lembramos você de que, ao se registrar pela primeira vez no Google Cloud: bônus no valor de $ 300 estão disponíveis para você e mais de 20 produtos gratuitos estão sempre disponíveis. Você pode experimentar o GCP no link dedicado .
Agradecimentos especiais aos colegas Jiu Xiao Liu, Tanner Love, Yang Jian, Hong Bo Lu e Pallawi Feng por sua ajuda na preparação do material.