Estrutura do sistema de arquivos ReFS e algoritmo de recuperação de dados

"ReFS" (Resilient File System) é um novo sistema de arquivos da Microsoft que foi criado para substituir o "NTFS". Ele tem várias vantagens sólidas, a saber, os desenvolvedores corrigiram todos os bugs do NTFS. Ele é muito mais protegido contra corrupção de informações, pode suportar melhor o aumento da carga e também pode ser escalado com muito mais facilidade.



imagem



Principais funções do Resilient File System
, .

— Integrity streams ( ).

«allocate on write» — .

, , , .

, .

«data sriping» — , RAID .

— «disk scrubbing», .

.

, , , .

«NTFS».

.

«ReFS» , .

«Storage Spaces» — .

«NTFS»: «BitLocker», «USN» , «ACL» , «mount points»… , «ReFS», «API».


Recursos do "ReFS"







As somas de verificação agora são usadas para metadados por padrão e também são aplicadas a dados em arquivos individuais. Assim, no processo de leitura / escrita, a verificação é realizada "on the fly". Quando o sistema de arquivos detecta a corrupção do arquivo, ele apaga instantaneamente as entradas sem reiniciar o computador. Ou seja, "ReFS" agora se corrige sozinho quando aparecem erros.



"ReFS" fornece uma maior confiabilidade de armazenamento de informações, em comparação com o antigo FS. Árvores B + são usadas para armazenar arquivos e metadados. Tamanhos, número de partições e arquivos agora são limitados ao valor máximo de 64 bits. O espaço em branco é armazenado em três tabelas diferentes, divididas por tamanho do bloco (pequeno, médio, grande). Os nomes e caminhos dos arquivos são escritos em "Unicode", não devem ultrapassar 32 kilobytes, ou seja, o nome do arquivo pode ser especificado em 30 mil caracteres.



Proteção contra queda de energia. Digamos que você esteja escrevendo um novo nome de arquivo (ou outro metadado), a eletricidade acabou e você não teve tempo de salvá-los. Em "NTFS" - o arquivo será danificado porque você altera os metadados diretamente. Mas o "ReFS" apenas faz uma cópia dos metadados, e não altera os principais até que ocorra o salvamento, peculiaridade da função "Copiar na gravação".



Espaços de armazenamento é um recurso de virtualização de mídia. Ele permite que você crie um único espaço de vários discos físicos em um PC ou vários em uma rede local. Também é possível configurar o "espelhamento" como matrizes RAID.



Diferenças de NTFS



O ReFS foi originalmente projetado para oferecer suporte a grandes volumes de partições, arquivos, diretórios e seus nomes. O novo FS pode conter até duzentos e sessenta e dois mil exabytes de informações e "NTFS" - apenas dezesseis exabytes.



Ele também carece de criptografia, compactação, desduplicação, cotas de disco, links físicos e atributos estendidos. Alguns deles foram substituídos por novos, por exemplo, "ReFS" oferece suporte total à criptografia BitLocker.



Agora, no sistema de arquivos "ReFS", você só pode formatar o pool de discos (espaço de armazenamento), onde o novo FS se mostrará em toda sua glória. Mas o Windows 10 não permite que você formate mídia regular para "ReFS". Os desenvolvedores enfatizam a importância do "ReFS" especificamente para servidores, ele está disponível em SO de servidor ou na versão "LTSC".



O Windows Server 2016 permitirá a formatação de volumes regulares para "ReFS", mas não permitirá a formatação do disco de inicialização, pois o setor de inicialização deve estar em uma partição "NTFS".



Arquitetura do sistema de arquivos



As estruturas do ReFS são significativamente diferentes de todos os outros sistemas de arquivos do Windows. Os principais blocos de construção são árvores B +. Eles são de nível único (como folhas) e de vários níveis (como árvores). Isso fornece um bom dimensionamento para cada elemento incluído na estrutura FS. Este esquema, assim como o endereçamento de 64 bits de cada elemento, impossibilita problemas com seu posterior aumento.



imagem



Como registro raiz da árvore B +, o restante dos registros tem o mesmo tamanho, 16 kb, para o bloco de metadados. Tamanho 60 bytes - alocado para nós intermediários (endereço). Portanto, um pequeno número de camadas será necessário para descrever adequadamente as estruturas de armazenamento em grande escala. Isso permitiu aumentar o desempenho do FS, em comparação com outros.



Estrutura do sistema de arquivos ReFS



"ReFS" pode ser identificado por uma assinatura específica localizada no início da seção:



imagem



0x4000 bytes - o comprimento de todas as páginas ReFS.



imagem



O número da primeira página é 0x1e, ou seja, 0x78000 bytes imediatamente após a partição de inicialização. Este é um mapeamento padrão da Microsoft que informa que os primeiros metadados devem ser pesquisados ​​após um deslocamento fixo.



Algoritmo de pesquisa de dados excluídos









Os utilitários de recuperação de dados realizarão uma varredura completa do espaço em disco formatado como "ReFS" usando um algoritmo de análise baseado em assinatura. Ao verificar o disco bloco a bloco, eles encontrarão sequências de dados prontas, identificá-las-ão e imprimirão os resultados. Como as APIs para trabalhar com discos para "ReFS" e "NTFS" são as mesmas, os processos de recuperação de dados são extremamente semelhantes.



Primeiro, o "Cabeçalho do Volume" é determinado, ele contém o número de setores por cluster e quanto de um setor. A versão principal encontra-se no setor zero, e a cópia está localizada no último. A seguir, lê-se o "Superbloco", que se localiza no 30º bloco e também há 2 cópias no segundo e terceiro blocos no final. A partir dele, são extraídos os links para o "checkpoint" e sua cópia, sua última versão atual é determinada pelo "Virtual Allocated Clock".



O ponto de verificação contém informações sobre as tabelas principais, a seguir são lidos os cabeçalhos "Cabeçalho da página" e blocos com ponteiros (Ponteiros) para a lista completa de tabelas. Em seguida, procura-se a "Tabela Container" para obter os endereços físicos dos virtuais e faz-se uma busca na "Tabela de ID de Objetos" - todas as tabelas são encontradas.



Os utilitários descem até o nível zero - ou seja, folhas de árvore b - e leem os dados do arquivo. Uma vez que a pesquisa é realizada página a página, se houver falhas, esses elementos são simplesmente excluídos da análise e o próprio processo de digitalização prossegue. Assim, os utilitários de recuperação de dados encontram todas as informações que é possível "obter" do disco.



Veja a fonte do artigo completo com todos os tutoriais em vídeo adicionais .



All Articles