Sim, tal declaração pode surpreendê-lo. A vacina é um líquido que é injetado na mão de uma pessoa. O que algum código-fonte tem a ver com isso?
Boa pergunta. Começaremos com uma pequena porção do mesmo código-fonte da vacina BioNTech / Pfizer, também conhecida como BNT162b2 , também conhecida como Tozinameran, também conhecida como Comirnaty .
Primeiros 500 caracteres do mRNA de BNT162b2.
No coração da vacina está este código digital. Tem 4.284 caracteres, então pode caber em alguns tweets. Bem no início do processo de produção da vacina, alguém carregou esse código em uma impressora de DNA (aha), que, por sua vez, transformou os bytes do dispositivo de armazenamento em moléculas de DNA reais.
Impressora de DNA Codex DNA BioXp 3200
Essa máquina produz uma pequena quantidade de DNA, que, após processamento biológico e químico de longo prazo, se transforma em RNA em um frasco com uma vacina. Uma dose de 30 μg realmente contém 30 μg de RNA. Ele também tem um sistema inteligente de empacotamento de lipídios (gordurosos) que entrega mRNA às nossas células.
O RNA é uma versão volátil do DNA, visto que foi armazenado na "memória de trabalho". O DNA é como um pen drive para a biologia. O DNA é confiável, robusto e redundante internamente. Mas os computadores também não executam código diretamente de uma unidade flash - antes de tudo começar, o código é copiado em um sistema mais rápido e flexível, mas também mais frágil.
Em computadores, isso é RAM, e em biologia, é RNA. A semelhança é chocante. Ao contrário da memória flash, a RAM se degrada rapidamente se não for tratada com cuidado. O motivo pelo qual a vacina de RNA da Pfizer / BioNTech precisa ser armazenada em temperaturas muito baixas é o mesmo: o RNA é uma flor delicada.
Cada símbolo de RNA pesa na ordem de 0,53 × 10 -21 gramas, ou seja, uma dose de 30 μg de vacina contém 6 × 10 16 símbolos. Em bytes, isso resultará em cerca de 25 PB, embora na verdade a vacina consista em 2.000 bilhões de repetições dos mesmos 4.284 caracteres. O conteúdo real da vacina é pouco mais de um kilobyte. O próprio SARS-CoV-2 tem um volume de cerca de 7,5 KB.
Referência rápida
DNA é um código digital. Mas, ao contrário dos computadores que usam 0 e 1, ele usa os caracteres A, C, G e U / T (“nucleotídeos”, “nucleosídeos” ou “bases”).
Em computadores, 0 e 1 são armazenados na forma de presença / ausência de carga, ou corrente, ou junção magnética, ou voltagem, ou modulação de sinal, ou mudanças na reflexividade. Em suma, 0s e 1s não são abstrações, eles vivem na forma de elétrons e muitas outras encarnações físicas.
Na natureza, A, C, G e U / T são moléculas armazenadas em DNA (ou RNA) em cadeias.
Em computadores, 8 bits são agrupados em bytes e os dados geralmente são processados byte a byte.
A natureza agrupa três nucleotídeos em códons, que são as unidades típicas de processamento de informações genéticas. O códon contém 6 bits de informação (2 bits por símbolo de DNA, 3 caracteres = 6 bits). Isso significa que o códon pode assumir 2 6 = 64 valores diferentes.
Até agora, tudo é bastante digital. Os duvidosos podem consultar o documento da OMS que contém o código digital.
Então, o que esse código faz?
A ideia por trás de uma vacina é ensinar nosso sistema imunológico a combater um patógeno sem realmente ficar doente. Historicamente, para isso, um vírus enfraquecido ou inoperante era introduzido no corpo, completo com um agente auxiliar, a fim de fortalecer o sistema imunológico de maneira adequada, obrigando-o a agir. Era principalmente tecnologia analógica, usando bilhões de ovos (ou insetos). Ela também exigia muita sorte e muito tempo. Às vezes, um vírus completamente diferente era usado para isso.
O mRNA atinge o mesmo resultado (treinamento do sistema imunológico), mas muito mais inteligente, como se estivesse usando uma mira a laser. Em todos os sentidos - um impacto estreito, mas poderoso.
É assim que funciona. A preparação contém material genético instável que descreve a famosa proteína “pico” SARS-CoV-2. Por meio de reações químicas inteligentes, a vacina entrega esse material genético a algumas de nossas células.
Essas, então, começam obedientemente a produzir as proteínas SARS-CoV-2, cuja quantidade é grande o suficiente para iniciar nosso sistema imunológico. Quando confrontado com as proteínas do pico e os sinais característicos de infecção celular, desenvolve uma resposta poderosa às várias propriedades da proteína do pico e ao processo de sua reprodução.
É assim que a vacina funciona com 95% de eficácia.
Fonte!
Vamos começar do melhor lugar - desde o início. O documento da OMS tem a seguinte imagem útil:
É o tipo de conteúdo. Vamos começar com o item "boné", que é desenhado na forma de um chapéu [eng. boné - boné, boné, chapéu].
Assim como em um computador, você não pode simplesmente escrever opcodes em um arquivo e executá-lo, um sistema operacional biológico requer cabeçalhos, linkers e algo como regras de nomenclatura de variáveis.
O código da vacina começa com os dois nucleotídeos a seguir:
GA
Comparável a qualquer executável DOS e Windows começando com caracteres "MZ" ou scripts UNIX começando com "#!". Tanto na vida quanto nos sistemas operacionais, esses dois personagens não são executados. Mas eles devem estar lá, caso contrário, nada funcionará.
O cabeçalho do mRNA tem várias funções. Ela observa, por exemplo, que o código vem do kernel. No nosso caso, não é esse o caso - o código vem naturalmente da vacina. Mas a célula não precisa saber disso. O chapéu dá credibilidade ao código, protegendo-o da destruição.
Além disso, os dois nucleotídeos GA originais são quimicamente ligeiramente diferentes do resto do RNA. Nesse sentido, um tipo de sinalização fora de banda é embutido no GA.
Região não traduzida de cinco barras
Um pouco de jargão. As moléculas de RNA são lidas em apenas uma direção. Um pouco confuso é que a leitura começa na parte chamada 5 ' . E termina na parte 3 '.
A vida é feita de proteínas (e tudo o que é feito delas). Essas proteínas são descritas no RNA. A transformação do RNA em proteína é chamada de tradução .
Em seguida, darei uma região não traduzida (UTR; região não traduzida, UTR) 5 '- ou seja, esta parte não passa para a proteína:
GAAΨAAACΨAGΨAΨΨCΨΨCΨGGΨCCCCACAGACΨCAGAGAGAACCCGCCACC
Aqui estamos nós para a primeira surpresa. Os símbolos usuais para o RNA são A, C, G e U. No DNA, U também é conhecido como T. Mas então aparece algum tipo de Ψ - o que acontece?
Esta é uma das propriedades extremamente complicadas da vacina. Nosso corpo possui um poderoso sistema antivírus. Graças a ela, as células são extremamente céticas em relação a RNAs estranhos e se esforçam para destruí-los antes que façam alguma coisa.
Este é um problema para uma vacina - ela precisa passar pelo nosso sistema imunológico. Ao longo de muitos anos de experimentos, descobriu-se que se o U no RNA for substituído por uma molécula ligeiramente alterada, nosso sistema imunológico perde o interesse nela. Em absoluto.
Portanto, na vacina BioNTech / Pfizer, cada U é substituído por 1-metil-3'-pseudouridina, que é denotado por Ψ. O truque aqui é que, embora tal substituição pacifique nosso sistema imunológico, as partes necessárias das células o percebem como um U comum.
Esse truque também é conhecido em segurança de computador. Às vezes é possível transmitir uma versão um pouco distorcida da mensagem, confundindo firewalls e sistemas de segurança, mas aceita por servidores backend. E então eles podem ser hackeados.
Hoje estamos colhendo os frutos da pesquisa científica fundamental do passado. As pessoas que descobriram essa tecnologia Ψ tiveram que lutar para encontrar financiamento e obter reconhecimento. Devemos ser gratos a eles por isso e tenho certeza de que o Prêmio Nobel acabará por encontrá- los .
, Ψ-, ? , . , 1--3'-. , , . , Ψ .
Vamos voltar ao nosso 5 'NTO. O que esses 51 símbolos fazem? Como quase tudo na natureza, eles não têm uma única função clara.
Quando as células precisam traduzir RNA em proteínas, uma máquina chamada ribossomo liga. O ribossomo é como uma impressora 3D para proteínas. Ele absorve um pedaço de RNA e, com base nisso, libera uma cadeia de aminoácidos, que é então dobrada em proteína .
Este processo é mostrado no vídeo. A faixa escura abaixo é RNA. A faixa no fundo verde é a proteína formadora. Dispositivos de entrada e saída são aminoácidos e adaptadores que permitem que eles se encaixem no RNA.
Para o ribossomo funcionar, ele precisa ficar fisicamente em um pedaço de RNA. Depois disso, ele pode começar a formar proteínas com base nas informações provenientes de outros segmentos de RNA. Ou seja, ele não consegue ler as partes nas quais primeiro precisa pousar. "Orientação" é fornecida pelo NTO.
Além disso, o NTO contém metadados: quando a transmissão deve ocorrer? Quanto? Para a vacina, os cientistas encontraram um NTO, no qual o comando de transmissão era gravado o mais cedo possível. Ela vem de gene alfa globina . Este gene é conhecido pela produção confiável de grandes quantidades de proteínas. No passado, os cientistas já encontraram uma oportunidade de otimizar ainda mais esta UTR, então algo melhor foi usado para a vacina, não uma UTR da alfa globina.
Sequência de sinal da glicoproteína S
Conforme observado, o objetivo da vacina é fazer com que a célula produza a proteína spike SARS-CoV-2 em escala industrial. Até agora, lidamos principalmente com metadados e convenções de nomenclatura no código-fonte. E agora estamos entrando no território da proteína viral.
No entanto, primeiro precisamos passar por outra camada de metadados. Depois que o ribossomo (da grande animação acima) faz uma proteína, ele ainda precisa chegar a algum lugar. Este é codificado na sequência de sinal (péptido) da glicoproteína S (na sequência líder estendida ).
No início da proteína está algo como um rótulo de endereço, codificado da mesma forma que a proteína inteira. Nesse caso, a sequência sinalizadora diz que a proteína deve sair da célula do retículo endoplasmático . Mesmo Star Trek não tinha um jargão tão legal!
A sequência de sinal não é muito longa, mas o exemplo de código mostra a diferença entre o RNA do vírus e a vacina. Para facilidade de comparação, substituí Ψ pelo U usual de RNA:
3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3
Vírus: AUG UUU GUU UUU CUU GUU UUA UUG CCA CUA GUC UCU AGU CAG UGU GUU
Vacina: AUG UUC GUG UUC CUG GUG CUG CUG CCU CUG GUG UCC AGC CAG UGU GUU
! ! ! ! ! ! ! ! ! ! ! ! !
Não estou agrupando acidentalmente o RNA por três símbolos. Esses símbolos formam códons. E cada códon codifica um aminoácido específico. A sequência de sinal da vacina consiste exatamente nos mesmos aminoácidos do próprio vírus.
Por que o RNA é diferente?
Pode haver 4 3 = 64 códons , já que o RNA tem 4 símbolos, três dos quais constituem um códon. Ao mesmo tempo, existem apenas 20 aminoácidos diferentes. Acontece que vários códons codificam o mesmo aminoácido.
A Life usa a seguinte tabela quase universal para mapear códons de RNA em aminoácidos:
A tabela mostra que as modificações da vacina (UUU -> UUC) são sinônimos. O código de RNA da vacina é diferente, mas a saída são os mesmos aminoácidos e proteínas.
Um exame atento mostra que a maioria das mudanças está contida no terceiro códon, marcado com o número 3. Ao verificar a tabela de códons universais, podemos ver que esta terceira posição freqüentemente não afeta qual aminoácido é obtido no final.
Mas se as mudanças são sinônimos, por que são necessárias? Se você olhar de perto, todas as mudanças, exceto uma, aumentam o número de C e G.
Por que isso é necessário? Como já observamos, nosso sistema imunológico é muito cético em relação ao RNA "externo" - isto é, ao código que veio de fora da célula. Para evitar a detecção, já substituímos U por Ψ.
Acontece, entretanto, que o RNA com muito G e C é mais frequentemente e mais eficientemente convertido em proteínas. Para este fim, muitos símbolos na vacina de RNA foram substituídos por G e C sempre que possível.
Verdadeiro esquilo espinho
Os próximos 3777 caracteres de RNA da vacina também são "códons otimizados" com o objetivo de adicionar mais C e G. Não vou dar todo o código aqui, mas estudaremos um fragmento especial dele. É graças a ele que a vacina funciona - é esta parte que nos ajuda a voltar à vida normal:
* *
LDKVEAEVQIDRLITG
Vírus: CUU GAC AAA GUU GAG GCU GAA GUG CAA AUU GAU AGG UUG AUC ACA GGC
Vacina: CUG GAC CCU CCU GAG GCC GAG GUG CAG AUC GAC AGA CUG AUC ACA GGC
LDPPEAEVQIDRLITG
! !!! !! ! ! ! ! ! ! !
Aqui, novamente, as alterações usuais de RNA sinônimo são visíveis. Por exemplo, no primeiro códon, CUU foi substituído por CUG. Isso adiciona outro G à vacina, o que ajuda a aumentar a produção de proteínas. CUU e CUG codificam para o aminoácido L, ou leucina, então nada muda na proteína.
Ao comparar a proteína do pico com a vacina, podemos ver que todas as alterações são semelhantes - exceto duas. Ambos são visíveis neste fragmento.
O terceiro e o quarto códons contêm mudanças reais. Os aminoácidos K e V são substituídos por P, ou prolina. No caso de K, três alterações foram necessárias ('!!!'), e no caso de V, duas ('!!'). Acontece que essas duas mudanças aumentam a vacina de forma incrível.
Então, o que está acontecendo aqui? Se você olhar para uma partícula de vírus real, verá que a proteína do pico é um monte de espinhos: os
espinhos estão presos ao corpo do vírus ("proteína do nucleocapsídeo"). Mas nossa vacina só gera esses espinhos, e não os prendemos a nenhum corpo viral.
Acontece que as proteínas de pico existentes separadamente colapsam em uma estrutura completamente diferente. Se tivessem sido introduzidos como parte de uma vacina, nossos corpos teriam desenvolvido imunidade a eles - mas apenas à espécie em colapso. O verdadeiro coronavírus exibe pontas retas. Dessa forma, a vacina dificilmente funcionaria.
Então, o que estamos fazendo? Em 2017 foi descritocomo a dupla substituição da prolina no lugar certo faz com que as proteínas SARS-CoV-1 e MERS S tomem sua forma "original", mesmo sem ligação com o vírus. Tudo graças à força da prolina. Esse aminoácido funciona como uma tala, estabilizando a proteína no estado em que precisamos apresentá-la ao sistema imunológico. As pessoas que
descobriram isso agora precisam constantemente dar tapinhas nos ombros e sorrir constantemente. E tudo isso será bem merecido. Depois que o primeiro rascunho do artigo foi publicado, conversei com pessoas do laboratório de McLeillan, e eles disseram que até agora as palmas foram suspensas devido à pandemia, mas estão orgulhosos de sua contribuição para a vacina. E enfatize a importância de outros grupos e voluntários trabalhando nisso.
Fim do esquilo e próximas etapas
Se você rolar o código-fonte até o final, veremos pequenas mudanças no final da proteína de pico:
VLKGVKLHYT s
Vírus: GUG CUC AAA GGA GUC AAA UUA CAU UAC ACA UAA
Vacina: GUG CUG AAG GGC GUG AAA CUG CAC UAC ACA UGA UGA
VLKGVKLHYT ss
! ! ! ! ! ! ! !
No final da proteína existe um códon de "parada", marcado com a letra s. Esta é uma forma educada de indicar o fim da proteína. O próprio vírus usa o códon UAA como parada, e a vacina usa dois códons UGA. Talvez apenas no caso.
Área não traduzida 3 '
Assim como no final de 5 'encontramos a 5'-UTR necessária para a orientação do ribossomo, no final da proteína encontramos uma construção semelhante, a 3'-UTR.
Há muitas palavras para escrever sobre ela, mas prefiro citar a Wikipedia. “3'-UTR desempenha um papel crítico na expressão gênica, influenciando a localização, estabilidade, exportação e eficiência de tradução do mRNA. Apesar de todo nosso conhecimento atual sobre 3'-NTOs, seu trabalho ainda é bastante misterioso. "
Sabemos, no entanto, que certas 3'-UTRs são muito bem-sucedidas na mediação da expressão de proteínas. De acordo com um documento da OMS, o 3'-UTR contido na vacina BioNTech / Pfizer é derivado do "amplificador do terminal amino de mRNA clivado (AES) e RNA ribossômico 12S codificado mitocondrial para garantir a estabilidade do RNA e alta expressão de proteína total". O que posso dizer - muito bem.
E no final de tudo, AAAAAAAAAAAAAAAAAAAAAA
O final do mRNA é poliadenilado . Essa é uma maneira floreada de dizer que termina com um monte de sequências AAAAAAAAAAAAAAAAAA. Aparentemente, 2020 até tirou mRNA.
O mRNA pode ser reutilizado muitas vezes, mas perde alguns “A's” em seu final. Assim que o "A" acabar, o mRNA irá parar de funcionar e será descartado. Nesse sentido, a cauda poli-A protege-o da degradação. Estudos especiais foram realizados para determinar a quantidade ideal de "A" no final das vacinas de mRNA. Em fontes abertas, li que chegaram a cerca de 120 peças.
A vacina BNT162b2 termina em
****** **** UAGCAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAGCAUAU GACUAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAA
30 "A", então "nucleotide linker-10" (GCAUAUGACU), seguido por outro 70 "A".
Suspeito que a otimização patenteada esteja novamente sendo usada para melhorar a expressão de proteínas.
Resultado
Agora sabemos o conteúdo exato da vacina BNT162b2 e, na maior parte, entendemos por que ela funciona desta forma:
- CAP tampa que faz o RNA parecer um mRNA normal.
- Bem conhecido, testado com sucesso e otimizado 5'-NTO.
- Sequência de sinal com códons otimizados que envia a proteína spike para o lugar certo (copiada do próprio vírus).
- Uma variante da proteína spike original com códons otimizados, com duas substituições de prolina para garantir a forma correta da espinha.
- 3'-NTO bem conhecido, testado com sucesso e otimizado.
- Uma cauda um pouco misteriosa de poli-A com algum tipo de "linker".
A otimização de códons adiciona muitos Gs e Cs ao mRNA. Usar Ψ (1-metil-3'-pseudouridina) em vez de U ajuda a enganar o sistema imunológico. Graças a ele, o mRNA existe por tempo suficiente para ter tempo de treinar nosso sistema imunológico.