Como a inteligência artificial foi ensinada para resolver a difusão

Hoje, na véspera do início de um novo fluxo do curso "Matemática e Aprendizado de Máquina para Ciência de Dados" , estamos compartilhando com vocês uma tradução útil de um artigo da MIT Technology Review sobre como os pesquisadores da Koltech ensinaram IA para resolver equações diferenciais parciais, porque é necessário e como pode mudar o mundo ... Todos os detalhes podem ser encontrados abaixo do corte.










A menos que você seja um físico ou engenheiro, não tem nenhuma razão particular para saber sobre equações diferenciais parciais. E depois de muitos anos na pós-graduação, quando estudei engenharia mecânica, desde então não os usei na vida real.



Mas tais equações (doravante para simplificar usamos a abreviatura PDE), têm sua própria magia. Esta é uma categoria de equações matemáticas que são realmente boas para descrever mudanças no espaço e no tempo e, portanto, muito conveniente para descrever fenômenos físicos em nosso universo. Eles podem ser usados ​​para modelar tudo, desde órbitas planetárias a placas tectônicas e turbulência do ar interferindo no voo, o que por sua vez nos permite fazer coisas úteis, como prever atividade sísmica e projetar aeronaves seguras.



O problema é que os PDEs são notoriamente difíceis de resolver. E aqui o significado da palavra "decisão" talvez seja melhor ilustrado. Por exemplo, você está tentando simular a turbulência do ar para testar um novo projeto de aeronave. Existe uma PDE bem conhecida chamada equação de Navier-Stokes, que é usada para descrever o movimento de qualquer fluido. Resolver a equação de Navier-Stokes permite que você tire um "instantâneo" do movimento do ar (condições do vento) a qualquer momento e simule como ele continuará a se mover ou como se moveu antes.



Esses cálculos são muito complexos e caros do ponto de vista computacional, portanto, disciplinas com muitos PDEs geralmente dependem de supercomputadores para realizar cálculos matemáticos. É por isso que os profissionais de IA têm um interesse especial por essas equações. Se pudéssemos usar o aprendizado profundo para acelerar a solução, isso poderia ser de grande benefício em pesquisa e desenvolvimento.



Pesquisadores da Koltech introduzem nova técnica de aprendizado profundopara resolver o PDE, que é significativamente mais preciso do que os métodos de aprendizado profundo desenvolvidos anteriormente. O método também é generalizado o suficiente para resolver famílias inteiras de PDE, como a equação de Navier-Stokes para qualquer tipo de fluido, sem a necessidade de novo treinamento. Finalmente, é 1.000 vezes mais rápido do que as fórmulas matemáticas tradicionais, reduzindo a dependência de supercomputadores e aumentando ainda mais o poder computacional da modelagem de problemas. E isso é bom. Dê dois!



Hammertime



[Aproximadamente. trad. - Subtítulo - um aceno para "U Can't Touch This" do rapper MC Hammer]



Antes de mergulharmos em como os pesquisadores fizeram isso, vamos primeiro avaliar os resultados. O gif abaixo mostra uma demonstração impressionante. A primeira coluna mostra dois instantâneos de movimento fluido; a segunda coluna mostra como o fluido realmente continuou a se mover; e a terceira coluna mostra a previsão da rede neural. Basicamente, ele parece idêntico ao segundo.







O artigo fez muito barulho no Twitter e até mesmo o rapper MC Hammer repostou.







Mas vamos voltar a como os cientistas conseguiram isso.



Quando a função se encaixa



A primeira coisa a entender é que as redes neurais são basicamente aproximadoras. Quando eles treinam em um conjunto de entradas e saídas, eles estão, na verdade, avaliando uma função ou uma série de operações matemáticas que traduzem um dado em outro. Considere um detector de gatos. Você treina a rede neural alimentando-a com muitas imagens de gatos e outras imagens, marcando os grupos como 1 e 0. Em seguida, a rede neural procura a melhor função que converte cada imagem do gato em 1 e as imagens de todo o resto em 0. Assim, a rede pode ver a imagem e diga se tem um gato nele. Ela usa a função encontrada para calcular sua resposta e, se o treinamento foi bem-sucedido, na maioria dos casos o reconhecimento será correto.



Convenientemente, a aproximação de função é exatamente o que precisamos ao resolver o PDE. Em última análise, você precisa encontrar uma função que melhor descreva, digamos, o movimento das partículas de ar no espaço e no tempo.



Essa é a essência do trabalho. As redes neurais são geralmente treinadas para aproximar funções entre entradas e saídas definidas no espaço euclidiano, este é um gráfico clássico com os eixos x, y e z. Mas desta vez os pesquisadores decidiram definir entradas e saídas no espaço de Fourier - um tipo especial de espaço para traçar frequências de ondas. O fato é que algo como o movimento do ar pode de fato ser descrito como uma combinação de ondas, diz Anima Anandkumar, professora da Universidade da Califórnia que, junto com seus colegas, os professores Andrew Stewart e Kaushik Bhattacharya, lideraram a pesquisa. A direção geral do vento no nível macro é semelhante à baixa frequência com ondas muito longas e lentas, enquanto os pequenos redemoinhos que se formam no nível micro são semelhantes às altas frequências com ondas muito curtas e rápidas.



Por que isso é tão importante? Porque é muito mais fácil aproximar uma função de Fourier no espaço de Fourier do que lidar com PDE no espaço euclidiano. Essa abordagem simplifica muito o trabalho da rede neural. É também uma garantia de melhorias significativas na precisão: além da grande vantagem de velocidade sobre os métodos tradicionais, o novo método reduz a taxa de erro na resolução de problemas de Navier-Stokes em 30% em comparação com métodos de aprendizado profundo anteriores.



Isso tudo é muito razoável e, além disso, o método tem a capacidade de generalizar. Os métodos anteriores de aprendizado profundo devem ser treinados separadamente para cada tipo de fluido, no caso desse método, um treinamento é suficiente para lidar com todos os fluidos, o que é confirmado pelos experimentos dos pesquisadores. Embora eles ainda não tenham tentado estender a abordagem a outras mídias, o método também deve ser capaz de trabalhar com a crosta terrestre ao resolver PDEs relacionados à sísmica ou com tipos de materiais ao resolver PDEs relacionados à condutividade térmica.



Supersimulação



O corpo docente e seus alunos de pós-graduação fizeram essa pesquisa mais do que apenas o prazer de teorias. Eles querem levar IA para novas disciplinas científicas. Foi graças a conversas com funcionários de diversos perfis que atuam nas áreas de climatologia, sismologia e ciência dos materiais que Anandkumar foi a primeira a resolver o problema do PDE junto com seus colegas e alunos. Eles agora estão trabalhando para colocar o método em prática com outros pesquisadores do Laboratório Nacional Coltech e Lawrence Berkeley.



Um dos tópicos de pesquisa de particular preocupação para Anandkumar são as mudanças climáticas. A equação de Navier-Stokes é adequada não apenas para modelar turbulência do ar; esta equação também é usada na modelagem meteorológica. “Previsões meteorológicas globais boas e precisas são desafiadoras”, diz ela, “e mesmo nos maiores supercomputadores, não podemos fazer previsões globais hoje.” Portanto, se pudermos usar um novo método para acelerar todo o trabalho, ele terá um grande impacto.



“Existem muitas, muitas outras aplicações do método”, acrescenta ela. “Nesse sentido, não há limite, pois temos uma forma comum de agilizar o trabalho com todos esses aplicativos”.



Agora que a inteligência artificial é capaz de resolver a difusão, o que vem a seguir? Talvez você seja um daqueles que o ensinará a resolver problemas ainda mais complexos.

E teremos o maior prazer em ajudá-lo com isso, apresentando um código promocional especial HABR , que adicionará 10% ao desconto no banner.



imagem




Mais cursos




Artigos recomendados






All Articles