Reformador - Transformador Eficaz



Compreender dados organizados sequencialmente - seja linguagem, mĂșsica ou vĂ­deo - Ă© difĂ­cil, especialmente quando Ă© altamente dependente do contexto que os cerca. Por exemplo, se uma pessoa ou qualquer objeto desaparece do campo de visĂŁo do vĂ­deo e reaparece apĂłs um perĂ­odo de tempo significativo, muitos modelos esquecerĂŁo sua aparĂȘncia. No reino do processamento de linguagem, as redes neurais de memĂłria de curto prazo longa (LSTM ) fornecem contexto suficiente para traduzir com sucesso frase por frase . Nesse caso, a janela de contexto (ou seja, a cobertura dos dados que o modelo leva em consideração ao traduzir) pode conter de dez a cem palavras. Modelo de Transformer mais recentenĂŁo apenas melhorou a qualidade da tradução consecutiva, mas pode ser usado para gerar artigos inteiros da Wikipedia resumindo vĂĄrios documentos. Isso Ă© possĂ­vel devido ao fato de que o Transformer ampliou a janela de contexto para mil palavras. AlĂ©m disso, um contexto considerado tĂŁo vasto permite utilizar o Transformer para processar nĂŁo sĂł texto, mas tambĂ©m pixels ou notas musicais, a partir das quais podem ser geradas imagens ou mĂșsica .



. , . , 100 , 100 100 , 10 , . . , , ( – ). , , , .



Reformer – , 1 16 . Reformer , : (locality-sensitive-hashing, LSH), , (reversible residual layers) .





, – ? LSH : , , -, . , , ( ), . , . , , , , – (chunks), . ( ) , .



imagem3



: Reformer , ( , ), . LSH , . .





LSH , . GPU, , , . , . , .



, Reformer', : , , . , , . , . , , . , , ; . , , , .



imagem 4



: (a) . (b) , . () , .



Reformer'



Reformer' , 1 16 . , Reformer , . , Reformer' .



, – . Colab- Reformer' . , , Reformer (. ).



imagem 5



: , Reformer'. : «» . Imagenet64.



Reformer' , . Reformer . , Colab- « ». , , , Reformer, .





, Reformer , . , , Reformer', . , . , Reformer'. Colab– , .





  • — Nikita Kitaev, Ɓukasz Kaiser
  • —
  • —



All Articles