Compreender dados organizados sequencialmente - seja linguagem, mĂșsica ou vĂdeo - Ă© difĂcil, especialmente quando Ă© altamente dependente do contexto que os cerca. Por exemplo, se uma pessoa ou qualquer objeto desaparece do campo de visĂŁo do vĂdeo e reaparece apĂłs um perĂodo de tempo significativo, muitos modelos esquecerĂŁo sua aparĂȘncia. No reino do processamento de linguagem, as redes neurais de memĂłria de curto prazo longa (LSTM ) fornecem contexto suficiente para traduzir com sucesso frase por frase . Nesse caso, a janela de contexto (ou seja, a cobertura dos dados que o modelo leva em consideração ao traduzir) pode conter de dez a cem palavras. Modelo de Transformer mais recentenĂŁo apenas melhorou a qualidade da tradução consecutiva, mas pode ser usado para gerar artigos inteiros da Wikipedia resumindo vĂĄrios documentos. Isso Ă© possĂvel devido ao fato de que o Transformer ampliou a janela de contexto para mil palavras. AlĂ©m disso, um contexto considerado tĂŁo vasto permite utilizar o Transformer para processar nĂŁo sĂł texto, mas tambĂ©m pixels ou notas musicais, a partir das quais podem ser geradas imagens ou mĂșsica .
. , . , 100 , 100 100 , 10 , . . , , ( â ). , , , .
Reformer â , 1 16 . Reformer , : (locality-sensitive-hashing, LSH), , (reversible residual layers) .
, â ? LSH : , , -, . , , ( ), . , . , , , , â (chunks), . ( ) , .
: Reformer , ( , ), . LSH , . .
LSH , . GPU, , , . , . , .
, Reformer', : , , . , , . , . , , . , , ; . , , , .
: (a) . (b) , . () , .
Reformer'
Reformer' , 1 16 . , Reformer , . , Reformer' .
, â . Colab- Reformer' . , , Reformer (. ).
: , Reformer'. : «» . Imagenet64.
Reformer' , . Reformer . , Colab- « ». , , , Reformer, .
, Reformer , . , , Reformer', . , . , Reformer'. Colabâ , .
- â Nikita Kitaev, Ćukasz Kaiser
- â
- â