A poética da mutação: a inteligência artificial pode ajudar no estudo de vírus que escapam

Os



bioinformatistas de origem usaram um algoritmo projetado para simular a linguagem humana para prever como os vírus podem evoluir para se defender contra o sistema imunológico.



A cópia está incorreta



Os vírus levam uma existência cíclica bastante primitiva. Eles penetram na célula, realizam uma espécie de hackeamento de seus mecanismos reprodutivos, criando uma copiadora para sua própria espécie. As réplicas de vírus se espalham pelo corpo com o mesmo propósito: capturar e subjugar. E assim por diante, ad infinitum.



Muitas vezes, na sequência deste copiar e colar, algo sai errado - falhas durante a cópia dão origem a mutações. Às vezes, uma mutação diz respeito à ausência de uma proteína ou aminoácido importante - esse vírus infeliz é enviado para a lixeira da história evolutiva. Às vezes, uma mutação não afeta absolutamente nada: quando os termos são reorganizados na sequência de proteínas, a soma não muda.



Mas de vez em quando, a mutação chega às mãos do vírus. As mudanças ocorridas não apenas não impedem que o vírus continue a capturar células saudáveis, mas também o ajudam a fazê-lo com maior eficiência. As mutações podem tornar o vírus irreconhecível para a defesa imunológica de uma pessoa. Esse invasor consegue escapar dos anticorpos desenvolvidos em pessoas que estiveram doentes ou vacinadas, ou "escapar".



Os cientistas estão sempre à procura de possíveis tentativas de fuga do vírus. Isso também é verdadeiro para o SARS-CoV-2: novas cepas aparecem e os cientistas estão investigando o quão críticas essas mudanças são para a vacina existente (PS: até agora, tudo está em ordem). O mais difícil é para os pesquisadores do vírus da gripe e do HIV, que melhor de tudo "iludem" as defesas imunológicas de nosso corpo.



Os virologistas estão tentando estar à frente da curva, então eles criam seus próprios mutantes em laboratório e vêem se conseguem escapar dos anticorpos retirados de ex-pacientes e vacinados. Mas esse trabalho é semelhante a procurar uma agulha no palheiro: as variações das mutações são tão diversas que não é possível verificar tudo. Esses estudos são conduzidos antes para não perder o controle relativo sobre a situação.



Ortografia viral



No inverno passado, Brian Hee, um bioinformatista do MIT e um grande fã da poesia de John Donne , ponderou esse problema e apresentou uma analogia interessante. E se virmos as sequências virais da mesma forma que vemos a linguagem escrita? Segundo o cientista, cada sequência viral tem uma espécie de gramática - um conjunto de regras que deve seguir para ser esse vírus em particular.



Se a mutação provocar um "erro gramatical", o vírus entra em um beco sem saída evolutivo. Assim como a linguagem, a sequência viral tem um tipo de semântica que o sistema imunológico pode ler ou não. Se ela ler, o sistema imunológico será capaz de entender o vírus e pará-lo usando anticorpos ou outros meios de proteção. Continuando a analogia, a "fuga" viral pode ser vista como uma mudança que segue as regras da gramática, mas muda sua semântica para uma que a imunidade não lê.



A analogia não era apenas bonita, mas também deu a Brian Hee a ideia de sua aplicação prática. Nos últimos anos, a inteligência artificial tem feito grandes avanços no campo da linguística, modelando corretamente os princípios da gramática e da semântica da linguagem humana. As redes neurais são treinadas em conjuntos de dados que consistem em bilhões de palavras e ordenados por frases e parágrafos, dos quais o sistema deduz padrões. Como resultado do treinamento, os algoritmos de IA "entendem" como construir frases corretamente e onde colocar vírgulas. Pode-se dizer também que ele "entende" o significado de certas sequências de palavras e frases e ainda leva em consideração o contexto - tudo isso com base em coeficientes corretamente selecionados das camadas da rede neural.



A arquitetura de padrões para a escolha de uma palavra específica é em larga escala e está sendo prescrita com cada vez mais detalhes. Por exemplo, os algoritmos de processamento de linguagem natural mais avançados, como o GPT-3 do OpenAI, aprendem a criar textos gramaticais ideais enquanto mantêm o estilo.



Tanto na literatura quanto na biologia



A principal vantagem dos algoritmos de inteligência artificial é sua escalabilidade para diferentes áreas da ciência. Para um modelo de aprendizado de máquina, uma sequência é uma sequência, não importa onde esteja nos sonetos líricos ou nos aminoácidos.



De acordo com Jeremy Howard, pesquisador de inteligência artificial da Universidade de San Francisco e especialista em algoritmos de processamento de linguagem natural, o uso de algoritmos de IA em pesquisas biológicas pode ser benéfico.



Tendo uma quantidade suficiente de dados, por exemplo, das sequências genéticas de vírus infecciosos conhecidos pela ciência, o modelo pode detectar padrões e padrões em sua estrutura.



"Será um modelo extremamente complexo."Diz Jeremy Howard. Brian Hee também sabia disso. Seu conselheiro científico, matemático e programador Bonnie Berger, já fez um trabalho semelhante com colegas de laboratório, usando IA para prever padrões de dobramento de proteínas.



Modelos de linguagem para influenza, HIV e coronavírus



Nesta primavera, o laboratório de Berger deu vida à ideia de Brian Hee. Os resultados da pesquisa são publicados na revista Science . Inicialmente, a equipe estava interessada no vírus da gripe e HIV, que são notórios por sua evasão magistral de vacinas. Mas quando eles começaram o estudo em março de 2020, o genoma do novo coronavírus ficou disponível, então eles decidiram adicionar isso ao estudo também.



Para todos os três vírus, os cientistas se concentraram nas sequências de proteínas que usam para entrar nas células e se replicar, explica Brian Bryson, bioengenheiro, professor do MIT e coautor do estudo. Essas mesmas sequências são o principal alvo de uma resposta imune e a chave para a criação de uma vacina eficaz. Aqui, os anticorpos se agarram ao vírus, impedindo-o de entrar na célula e condenando à destruição (para SARS-CoV-2, esta é a proteína S-spike). Para cada vírus, a equipe do MIT treinou um modelo de linguagem usando dados de sequência genética em vez dos parágrafos e frases usuais.



Depois de um tempo, os cientistas verificaram o resultado do treinamento do modelo. Segundo a hipótese dos cientistas, sequências que possuem semântica semelhante deveriam infectar os mesmos "hospedeiros". Assim, a "linguagem" genética da gripe suína deve ser semanticamente semelhante a outra gripe suína e diferente de outro subtipo de gripe, por exemplo, a gripe aviária. A hipótese dos cientistas foi confirmada. Além disso, eles descobriram que as cepas de influenza disseminadas ao longo do tempo (por exemplo, a influenza aviária de 1918 e 2009) foram julgadas pela IA como semanticamente semelhantes.



Então eles se voltaram para a gramática. Quão correlacionada é a pontuação do vírus para a "gramática" da sequência e sua viabilidade na vida real? Os cientistas coletaram dados de estudos anteriores que avaliaram a adaptabilidade dos vírus mutantes (quão bem eles atacaram as células e se replicaram) para todos os três vírus. Eles então avaliaram o grau de correção gramatical dessas sequências de acordo com o modelo. Os pesquisadores presumiram que uma pontuação alta para este parâmetro significava uma alta adaptabilidade do vírus.



Bryson e Hee também queriam saber se a IA poderia prever o surgimento de um vírus de "fuga". Em seguida, eles compararam as previsões de seu modelo com os casos conhecidos de "fuga" real do vírus. O modelo do vírus influenza foi considerado o mais preditivo. Não surpreendentemente, o conjunto de dados que eles usaram para treinar este modelo era o mais completo - incluía sequências de gripe acumuladas ao longo de vários anos, incluindo mutações sobreviventes.



Quanto ao SARS-CoV-2, os cientistas testaram suas hipóteses em mutantes criados artificialmente. O vírus existente foi repetidamente passado através do soro com anticorpos até que o vírus sofreu uma mutação para um estágio tolerante a eles (realmente não temos nada com que nos preocupar ainda). A taxa de sucesso foi menor aqui. O modelo destacou a maioria dos verdadeiros fugitivos, mas às vezes estava errado.





No entanto, os resultados obtidos são um bom ponto de partida para pesquisas futuras por virologistas que desejam entender como funciona o mecanismo de mutação natural. “Esta é uma ótima maneira de restringir o universo de vírus mutantes em potencial ”, comenta Benhour Lee, microbiologista da Icahn School of Medicine no Monte Sinai.



O cientista acrescentou que as previsões são tão boas quanto os dados nos quais o modelo é treinado. Também deve-se ter em mente que o modelo de IA perde algumas nuances, porque a propriedade de escape nem sempre é consequência de mutação. O HIV é a prova disso. Às vezes, a sequência desse vírus não muda e suas proteínas são até reconhecidas por anticorpos, mas são bem protegidas por um polissacarídeo chamado glicano.



Benhour Lee observou que as previsões de IA ajudam principalmente os pesquisadores a confirmar o conhecimento existente. Assim, o modelo identificou corretamente duas partes da proteína spike SARS-CoV-2, que, como foi descoberto anteriormente, são mais suscetíveis a mutações, e uma região da sequência do vírus que é estável, o que significa que é um bom alvo para anticorpos.



O tempo dirá a quais outras descobertas as previsões do modelo de IA levarão. Até agora, os cientistas depositaram esperanças especiais nisso em termos de identificação das chamadas mutações combinativas, que incluem muitas mudanças sobrepostas umas às outras.



O próximo passo, que a equipe de Bryson dará, será criar em laboratório alguns dos mutantes previstos do SARS-CoV-2 e monitorar sua resposta a anticorpos retirados de pessoas doentes e vacinadas. Eles também vão testar várias sequências coletadas em tentativas de sequenciar amostras de vírus de pacientes com Covid-19, que o modelo acredita serem mais propensas a escapar, disse Bryson.



Os cientistas também querem testar se sua analogia se aplica a outras situações. Um modelo semelhante poderia prever se o sistema imunológico se tornará intolerante a um determinado tratamento contra o câncer ou se as células cancerosas podem sofrer mutação e parar de responder ao tratamento? Com dados suficientes em mãos, o laboratório de Bryson quer testar isso também.






All Articles