Detecção rápida de supernovas com redes neurais

Olá, Habr! Gostaria de apresentar a vocês uma tradução (ligeiramente adaptada) do excelente artigo "Detecção Rápida de Supernovas usando Redes Neurais" de Rodrigo Carrasco-Davis do Instituto de Astrofísica do Chile.



Um pouco de fundo



Astronomia é o estudo de objetos celestes: estrelas, galáxias ou buracos negros. Este estudo de objetos celestes se assemelha ao trabalho em laboratório de "física natural". Os processos naturais mais incríveis e extremos ocorrem nele, que em sua maioria não podem ser repetidos na Terra. Observar esses processos nos permite ter um conhecimento mais profundo do mundo, verificar os conhecimentos existentes sobre a física, comparando as ideias estabelecidas com o que observamos no Universo.



Existe um tipo especial de evento que é de grande interesse para os astrônomos. Acontece no final da vida de estrelas massivas. Eles são compostos de hidrogênio, que é puxado em direção ao centro pela gravidade. E quando a densidade fica alta o suficiente, os átomos de hidrogênio começam a se fundir. Isso leva ao aparecimento de um brilho e ao aparecimento de novos elementos químicos: hélio, carbono, oxigênio, néon, etc. O processo de fusão ocorre sob pressão interna, enquanto a gravidade exerce pressão externa, mantendo assim a estabilidade da estrela enquanto ela se queima. Quanto mais massiva a estrela, mais altas temperaturas atingem seu núcleo e mais rápido ela queima combustível nuclear.



Gradualmente, o processo de síntese passa para elementos mais pesados: para magnésio, silício, enxofre, eventualmente chegando ao ferro, cobalto e níquel. A síntese de outros elementos exigiria mais energia do que a liberada durante a reação, então o núcleo entra em colapso e ocorre uma explosão de supernova.





Nebulosa do Caranguejo , Remanescente de Supernova



Este processo é muito importante para os astrônomos. Devido às condições extremas durante a explosão, os astrônomos podem observar a síntese de elementos pesados, verificar o comportamento da matéria sob intensa pressão e temperatura e observar o produto da explosão, que pode ser uma estrela de nêutrons ou um buraco negro.



As supernovas também podem ser usadas como velas padrão. Um problema comum na astronomia: medir distâncias a objetos celestes. Como as estrelas estão muito distantes da Terra, é difícil determinar se uma estrela está fraca e próxima de nós ou se está muito distante e brilhante. A maioria das explosões de supernovas no Universo acontece da mesma forma, por isso os astrônomos usam supernovas para medir distâncias, o que é importante quando se estuda, por exemplo, a expansão do Universo e a energia escura .



Apesar de as explosões de supernovas serem muito brilhantes, são difíceis de notar devido à sua distância da Terra, devido à sua baixa frequência de ocorrência (cerca de uma supernova por galáxia por século) e à natureza de curto prazo da explosão, que pode durar de vários dias a alguns semanas. Além disso, para obter informações úteis de uma supernova, é necessário preparar um espectrógrafo (usado para medir a energia emitida durante uma explosão em várias frequências). Também seria bom começar a observar a estrela com antecedência, já que muitos processos físicos interessantes ocorrem horas após a explosão. Agora pergunte a si mesmo: como podemos encontrar rapidamente essas explosões de supernova entre todos os outros objetos astronômicos observáveis ​​no universo?



Astronomia hoje



Várias décadas atrás, um astrônomo teve que selecionar um objeto específico e apontar um telescópio para obter as informações de que precisava. Telescópios modernos como o Zwicky Transient Facility (ZTF) ou o Observatório Vera Rubin capturam imagens do céu de alta qualidade em uma velocidade muito alta, coletando dados no céu visível a cada três dias. O telescópio ZTF gera 1,4 TB de dados por noite, identificando e enviando informações sobre objetos em mudança interessantes no céu em tempo real.



Quando algo muda seu brilho, telescópios "inteligentes" notam e enviam um alerta de advertência. O aviso é realizado através do envio de um fluxo de dados no qual cada mensagem consiste em três imagens recortadas de 63 por 63 pixels. Essas três imagens são denominadas científicas, de referência e diferenciais.



Um arquivo de imagem científica é a observação mais recente de uma área específica. Com referência - o que estava no início das observações. Tudo o que mudou entre a primeira e a segunda imagem pode ser visto na terceira, diferença. O notório telescópio transmite até um milhão de avisos por noite, mas mais frequentemente vários milhares. Digamos que uma pessoa queira verificar cada alerta manualmente; levará cerca de 3,5 dias para visualizar todos os alertas em uma noite.





Imagens científicas, de referência e de diferença. Complementado com outros dados importantes, como condições de observação e informações sobre o objeto. A quarta imagem é uma versão colorida do PanSTARRS usando o Aladin Sky Atlas . Você pode ver a evolução completa do brilho da supernova ao longo do tempo na interface ALeRCE .



Visto que esses avisos comunicam tudo o que muda no céu, é importante ser capaz de detectar supernovas em todo o fluxo de informações gerado pelo telescópio. O problema é que outros objetos astronômicos também podem disparar um alerta. Por exemplo, estrelas variáveis ​​mudando seu brilho, núcleos galácticos ativos, asteróides. Também existem avisos falsos. Felizmente, as imagens científicas, de referência e de diferença têm várias características distintas que ajudam a determinar o que um alerta está falando sobre uma supernova ou outro objeto. E seria ótimo aprender como distinguir efetivamente entre as principais classes de alertas.





Cinco classes de objetos astronômicos



Assim, os núcleos galácticos ativos geralmente estão localizados no centro das galáxias. As supernovas geralmente se originam perto da galáxia hospedeira. Asteróides são observados perto do sistema solar e não são visíveis na imagem de referência. Estrelas variáveis ​​são encontradas em imagens preenchidas com outras estrelas, pois são encontradas principalmente na Via Láctea. Alertas falsos surgem por vários motivos: falta de pixels na câmera do telescópio, subtração pobre ao criar uma imagem diferencial, raios cósmicos, etc. Como eu disse antes, não é possível para um ser humano verificar manualmente todos os avisos. Portanto, uma forma automática de classificá-los era necessária para que os astrônomos pudessem encontrar os dados mais interessantes, que provavelmente continham informações sobre as supernovas.



Pesquise supernovas usando redes neurais



Uma vez que entendemos aproximadamente as diferenças entre as imagens das cinco classes mencionadas acima, podemos tentar calcular características específicas para classificá-las corretamente. No entanto, o trabalho manual é difícil e requer um longo período de tentativa e erro. Portanto, decidiu-se treinar uma rede neural convolucional (CNN) para resolver o problema de classificação e detectar rapidamente as supernovas.



A garantia da invariância da rede neural é obtida pela criação de cópias giradas de cada imagem no conjunto de treinamento em 90 °, após o que o valor médio de cada versão girada da imagem é carregado. O uso da invariância é importante porque não existe uma orientação específica em que as estruturas possam aparecer nas imagens enviadas em alertas.



Os cientistas também adicionaram alguns dos metadados contidos no aviso, como a posição nas coordenadas do céu, a distância a outros objetos conhecidos e métricas das condições atmosféricas. Depois de treinar o modelo usando entropia cruzada, a probabilidade de que o aviso contenha informações sobre uma supernova se concentra em torno dos valores 0 ou 1. É verdade que o classificador às vezes comete erros na classe prevista. Não é muito conveniente que o pesquisador tenha que filtrar adicionalmente os dados sobre possíveis supernovas após o computador ter feito uma previsão.



Para maximizar a entropia da previsão e distribuir os valores das probabilidades de saída, os cientistas adicionaram informações adicionais à rede neural. Isso possibilitou aprimorar o detalhamento ou a clareza das previsões, obtendo probabilidades em toda a faixa de 0 a 1, e não apenas os valores extremos desses indicadores. O resultado são previsões interpretáveis ​​de maneira muito mais conveniente, permitindo ao astrônomo escolher candidatos a supernovas.





Rede neural convolucional com invariância de rotação aumentada. Cópias giradas são criadas e passadas para a mesma arquitetura de rede neural para então aplicar o pool intermediário em uma camada densa antes de combinar com os metadados.



Os cientistas passaram pela rede neural cerca de 400.000 objetos, uniformemente distribuídos no espaço por toda a cobertura do telescópio ZTF, para verificar a exatidão das previsões do modelo. Descobriu-se que cada classe prevista pela rede neural é espacialmente distribuída. Isso faz sentido quando você considera a natureza de cada objeto astronômico. Por exemplo, núcleos galácticos ativos e supernovas estão localizados principalmente fora do plano da Via Láctea (objetos extragaláticos), pois é improvável que outros objetos possam ser vistos através do plano da Via Láctea devido à oclusão. O modelo prevê corretamente menos objetos próximos ao plano da Via Láctea (latitudes galácticas mais próximas de 0). Estrelas variáveis ​​são detectadas corretamente com uma densidade mais alta no plano galáctico. Os asteróides estão localizados perto do plano do sistema solar,também chamada de eclíptica (marcada com uma linha amarela). E falsos avisos acontecem em todos os lugares.



As informações nas imagens (científicas, de referência e diferença) são suficientes para obter uma boa classificação no conjunto de treinamento, mas a integração das informações dos metadados foi fundamental para obter a distribuição espacial correta das previsões. 





Distribuição espacial de um conjunto não marcado de objetos astronômicos. Cada gráfico é dado em coordenadas galácticas. A latitude galáctica está no centro da Via Láctea, então latitudes próximas a 0 também estão mais próximas do plano da Via Láctea. A longitude galáctica indica quanto do disco vemos no plano da Via Láctea. A linha amarela representa o plano do sistema solar (eclíptica).



Caçadores de supernova



A interface da web do projeto Supernova Hunter resultante permite que os astrônomos estudem objetos selecionados pela rede neural, confiantes de que são supernovas. Eles também podem relatar erros de classificação feitos pelo modelo, o que permite que novas informações sejam adicionadas ao conjunto de treinamento para melhorar o desempenho da rede neural posteriormente.





Supernova Hunter : Interface de usuário para pesquisar candidatos a supernova. Mostra uma lista de alertas com alta probabilidade de informações de supernova. Para cada um deles, imagens, posição do objeto e metadados são adicionados.



O classificador de rede neural e o Supernova Hunter confirmaram 394 supernovas e relataram 3.060 candidatos a supernovas no Transient Name ServerDe 26 de junho de 2019 a 21 de julho de 2020, uma média de 9,2 candidatos a supernova foram lançados por dia. Essa taxa de observação aumenta drasticamente o número de supernovas disponíveis que podem ser estudadas nos primeiros estágios de uma explosão.



Perspectivas



Os cientistas por trás do Supernova Hunter estão agora trabalhando para melhorar as características de classificação do modelo para que ele identifique com mais precisão os candidatos a supernova e exija menos atenção humana. Idealmente, este deve ser um sistema que pode relatar automaticamente todos os possíveis candidatos a supernova com um alto grau de confiança.



Outra área de trabalho dos cientistas é a busca por objetos raros usando métodos de detecção de outliers. Esta é uma tarefa desafiadora, mas realista, já que novos telescópios poderiam teoricamente descobrir novos tipos de objetos astronômicos devido à incrível taxa de amostragem e escala de cada observação.



Uma nova forma de analisar grandes quantidades de dados astronômicos será não apenas útil, mas também necessária, uma vez que organizar a classificação e redistribuição de dados é uma parte importante da ciência. O uso dos poderosos telescópios de hoje está mudando fundamentalmente a forma como os astrônomos estudam objetos celestes, e os cientistas devem estar preparados para trabalhar com novas tecnologias.



Obrigado pela atenção! Artigo original .



All Articles