Erros VDDK com rosto humano



A beleza e o horror dos erros do VDDK é que, por um lado, é absolutamente claro onde ele quebrou e, por outro lado, é completamente incompreensível por que e como consertá-lo agora. É como se a função de chamada RPC tivesse falhado no mundo do Windows.



Embora nem tudo seja tão terrível, é claro. Alguns erros têm causas e tratamentos muito específicos. E alguns - uma lista há muito conhecida das causas e opções mais comuns para sua correção.



Nosso suporte técnico da Veeam, é claro, acumula esse conhecimento, e hoje vamos dar uma olhada em suas inscrições. Portanto, é com grande prazer que apresento a você os principais erros do VDDK e métodos para eliminá-los.

 

Erros VDDK. O que é e como são obtidos?



 Como você pode imaginar pelo nome, esses são alguns tipos de problemas no nível do VDDK Api (Kit de desenvolvimento de disco virtual) - a melhor maneira de interagir com a infraestrutura do vSphere. Não importa se é um host ESXi separado ou um vCenter em expansão, mas se precisarmos escrever ou ler algo de nossa infraestrutura, a melhor maneira de fazer isso é o VDDK gratuito.



Para simplificar o máximo possível, essa interação se parece com isto: o servidor Veeam quer, por exemplo, ler algo do host (ou escrever) e enviar uma solicitação. Uma chamada de leitura é criada indicando de qual disco, quanto você deseja ler, de qual deslocamento e para qual buffer na memória. Ou escreva, da mesma forma, a partir do buffer especificado. É simples.



Mas este é um mundo perfeito. 



Na vida real, às vezes ocorrem erros ao longo do caminho desse algoritmo simples, devido ao qual é impossível concluir a solicitação. E em vez da resposta esperada, chega-nos um número de erro, que é cuidadosamente registrado nos logs.



 Hoje vamos falar sobre os erros mais comuns.

 

Aviso importante!

 

Não tenho certeza - não! Não pressione e não toque em nada! Ligar ou escrever para o suporte da Veeam é sempre melhor do que experimentar o seu produto. Felizmente, nosso suporte é em russo e extremamente técnico.



Na menor dúvida, ligue e pergunte: "Estou com esse problema, encontrei essa solução na rede, ela vai me ajudar a resolver?" - normal e correto. O que não é normal e não está certo é, não tendo certeza de suas ações, fazer um monte de coisas, e depois pedir para restaurar tudo das ruínas em cinco minutos, para que nada se perca.



Sim, nós, claro, vamos ajudar neste caso, mas a melhor batalha é aquela que não existia. Portanto, sempre tente avaliar criticamente suas ações e todo o grande tempo de atividade.

 

Erro VDDK 1: erro desconhecido



Na verdade, temos todo um artigo de HF sobre esse erro . E, como diz, na maioria das vezes esse erro ocorre se você tiver muitos contadores de desempenho instalados - e baixe um patch da VMware que vai consertar tudo para você.



Por um lado, não há nem mesmo o que comentar. Aqui está o problema, aqui está uma descrição (mesmo que não seja muito clara) e, o mais importante, aqui está um link para o medicamento. No entanto, nem tudo é tão simples. De acordo com nossas observações, esse erro pode ocorrer não apenas por causa de um problema enfadonho com contadores, mas também por causa de:



  1. VMDK . , , . — — . , . , , .

  2. datastore. . , .

  3. HBA . , . . ? 

  4. , : ESXi vCenter.



 Bem, bem, eu pego isso, você diz. E depois? Como entender que é hora de correr urgentemente para novos discos - ou basta colocar um adesivo e exalar?



E eu vou te responder - mantenha um conjunto de testes simples que o ajudarão a tomar a decisão certa se algo acontecer.



  • Iniciamos o Storage vMotion ou simplesmente clonamos a máquina suspeita em outro armazenamento de dados e, em seguida, tentamos iniciar o backup. Se a clonagem falhar, definitivamente há um problema em algum lugar do subsistema de disco. Modo de paranóia ao máximo - e verifique tudo, desde discos a controladores.



    Se foi clonado e salvo com sucesso, significa que o VMDK foi danificado, pois durante a clonagem o VMware recria seu conteúdo e agora definitivamente não há erros.   

  • , . , . « — » .

  • , , , — VMware.

  • , . , . 



VDDK error 2: Value: 0x0000000000000002 



Quase sempre anda de mãos dadas com o erro 1 do VDDK. De acordo com nossas estatísticas, o aparecimento de um erro geralmente está associado a certas versões do pacote vCenter / ESXi, então o melhor conselho aqui é atualizar pelo menos a versão 6.7. E melhor e 7.0.



Se não ajudar, vá para o plano B. 



O próprio erro aparece quando o host ESXi fica sem memória alocada para o buffer de leitura NFC. Por padrão, a Veeam opera em modo de leitura NBD / NFC assíncrono, o que em condições normais pode exigir a expansão deste buffer. Mas nem sempre isso acontece. Portanto, para desabilitar este modo, existe uma chave especial:



Name: VMwareDisableAsyncIo
Path: HKEY_LOCAL_MACHINE\SOFTWARE\Veeam\Veeam Backup and Replication
Type: REG_DWORD
Value: 1


Depois de criá-lo, você precisa reiniciar o Veeam Backup Service e estar preparado para o desempenho que caiu cerca de 10%.



Outra opção é fazer login do lado do host e reiniciar os agentes de gerenciamento:



/etc/init.d/hostd restart
/etc/init.d/vpxa restart


O procedimento é descrito em detalhes na KB da VMware , portanto, não iremos reescrevê-lo.



E um conjunto padrão de opções que não serão supérfluas para classificar durante o processo de diagnóstico:



  • Migre máquinas com erros para outro host.
  • Experimente outro modo de transporte - HotAdd com proxy virtual ou DirectSAN.


Erro 3 do VDDK: um dos parâmetros é inválido



 Um erro que quase sempre acontece ao usar o modo Virtual Appliance (também conhecido como modo HotAdd).



Não há nada de especial para contar aqui, vou apenas dar links para nossas duas KBs, onde muitas opções são descritas, e mesmo se você vier imediatamente para oferecer suporte, será solicitado que você faça tudo o que está escrito lá.



KB1218 - Descrição geral de possíveis problemas e métodos de sua eliminação.



KB1332 - Se o seu servidor Veeam funcionar como proxy para o modo HotAdd

 

Erro 13 do VDDK: Você não tem direitos de acesso a este arquivo



E para este caso temos o KB2008 . Sim, existem muitas opções para eliminar esse problema, mas esse erro. É quase impossível dizer de forma inequívoca o que exatamente aconteceu no seu caso, então você precisa pegar e repetir a lista inteira. 



O que eu gostaria de dizer adicionalmente. Tenha muito cuidado com a seção Solução de problemas adicionais. Sim, existem escritos, talvez óbvios demais para muitas coisas. Mas mesmo esses chavões iludem os profissionais mais profissionais. Muitas vezes há casos em que, após uma semana, tentando resolver tudo por conta própria, eles vêm ao suporte apenas para descobrir que não leram a lista de requisitos técnicos com atenção, ou algo parecido. E é uma pena e uma pena pelo tempo despendido.



E duas dicas para todos os tempos:



  • Veeam proxy , UUID . - , . , , . 
  • ( — ), , VDDK .
 

 VDDK error 18000: Cannot connect to the host 



Na maioria dos casos, a falha desse erro está em um bug no próprio VDDK. Especificamente, a biblioteca gvmomi.dll é a culpada. E ele se mostra apenas sob carga pesada. Por exemplo, quando o backup de várias máquinas é feito em paralelo, uma das funções torna-se 0 e a biblioteca pode entrar em colapso. E então tudo mais cai.



Essa é a triste história. 



Mas o pior nesta história é que é impossível reproduzir com precisão as condições do bug. Isso é o que os testadores chamam de bugs flutuantes. Portanto, é impossível dizer exatamente quantas máquinas paralelas estão causando o travamento.



No entanto, de acordo com as notas de lançamento oficiaiseste bug foi completamente corrigido. Portanto, a maneira certa é atualizar seu host. Mas se por algum motivo for impossível fazer isso, a única maneira de ajudarmos é aconselhando você a reduzir o número de máquinas processadas simultaneamente.



Não há outro jeito.



 

Erro VDDK 14008: O servidor especificado não pôde ser contatado



 Portanto, se esse problema se abateu sobre você, a primeira coisa a fazer é verificar a rede. Provavelmente, a comunicação entre o vCenter e o proxy da Veeam caiu. Verifique se todas as portas estão abertas e acessíveis, se todos os nomes DNS estão resolvidos corretamente para os endereços IP esperados. Além disso, você precisa verificar o proxy específico envolvido no trabalho com falha, e não aquele que está próximo a ele (há casos).

95% dos casos com este erro são fechados com a marca “Problema com DNS / portas na infraestrutura do cliente”.



Portanto, mais uma vez, peço que você verifique com muito cuidado se o servidor DNS correto está indicado em todos os lugares, se há portas fechadas e em qual IP os nomes FQDN são resolvidos.



 Em versões mais antigas do VDDK, ocorria um erro semelhante ao usar uma porta não padrão para trabalhar com o vCenter, o que representava os 5% restantes, mas agora a VMware ocultou o KB com sua descrição, o que provavelmente significa que o KB não é mais relevante. Mas você pode procurá-lo nos arquivos da Internet em 2108658 (o backup falha quando uma porta não padrão é especificada para o VMware vCenter Server).

 

Erro 14009 do VDDK: o servidor recusou a conexão



 E o último erro no topo do nosso hoje é O servidor recusou a conexão. Tudo é absolutamente banal aqui: algo impede a conexão entre o host e o proxy. Na maioria dos casos, o firewall é o culpado. Mas - o ponto sutil - não por causa dos portos fechados, mas por causa dos atrasos introduzidos. Portanto, em primeiro lugar, verificamos a abertura da porta 443 e, em seguida, examinamos os tempos limite.

Se as duas opções não deram nada, vá para o suporte. Teremos que verificar o próprio host. Talvez ele esteja simplesmente muito ocupado e não tenha tempo para responder a tempo, e talvez outra coisa.

 

E, finalmente, alguns links úteis:






All Articles