O Kit de Ferramentas de Inteligência Artificial define a forma dos provadores automáticos de teoremas da próxima geração e, com ela, a relação entre matemática e máquinas.
Diz-se que em 1970 o agora falecido matemático Paul Cohen , o único vencedor da Medalha Fields por seu trabalho em lógica matemática , fez previsões infundadas que ainda continuam a deliciar ou irritar os matemáticos: "algum dia substituirá os futuros matemáticos computadores ". Cohen, conhecido por seus métodos ousados de trabalhar com a teoria dos conjuntos, previu que toda a matemática poderia ser automatizada, incluindo a escrita de provas.
A prova é um raciocínio lógico passo a passo que confirma a verdade de uma hipótese ou suposição matemática. Depois que uma prova aparece, uma hipótese se torna um teorema. Isso confirma a exatidão da afirmação e explica por que ela é verdadeira. Mas a prova é estranha. É abstrato e não está vinculado à experiência material. “Eles são o resultado do contato insano entre um mundo fictício e não físico e criaturas que surgiram como resultado da evolução biológica”, disse o cientista cognitivo Simon Dedeo, da Carnegie Mellon University, que estuda a certeza matemática por meio da análise de estruturas de evidências. "A evolução não nos preparou para isso."
Os computadores são bons para computação em massa, mas a prova requer algo diferente. As hipóteses surgem do raciocínio indutivo - uma intuição especial associada a um problema interessante - e as provas geralmente seguem uma lógica dedutiva passo a passo. Freqüentemente, eles exigem um pensamento criativo complexo e também o trabalho árduo de preencher os vazios, e as máquinas não conseguem lidar com essa combinação de habilidades.
Os provadores de teoremas computadorizados se enquadram em duas categorias. Os provadores de teoremas automatizados (ATPs) geralmente usam métodos de força bruta para moer grandes pilhas de números. Os provadores de teoremas interativos (ITP) servem como assistentes humanos e são capazes de verificar a exatidão dos argumentos, bem como procurar erros nas provas existentes. No entanto, mesmo se você combinar essas duas estratégias (como fazem os provadores mais modernos), um sistema de raciocínio automático não surgirá delas.
O cientista cognitivo Simon Dedeo, da Carnegie Mellon University, ajudou a demonstrar que humanos e máquinas criam provas matemáticas de maneira semelhante.
Além disso, essas ferramentas são bem-vindas a muito poucas pessoas, e a maioria dos matemáticos não as usa ou as aprova. “Este é um tema controverso para os matemáticos”, disse Dedeo. "A maioria deles não gosta da ideia."
Um dos problemas difíceis em aberto nessa área é a questão de quanto do processo de criação de prova pode ser automatizado. O sistema será capaz de gerar uma hipótese interessante e prová-la de uma forma que seja compreensível para as pessoas? Um conjunto de descobertas recentes feitas por laboratórios de todo o mundo oferecem formas de inteligência artificial (IA) para responder a essa pergunta. Joseph Urban, do Instituto Tcheco de Informática, Robótica e Cibernética em Praga, está explorando várias abordagens que usam o aprendizado de máquina para aumentar a eficácia dos provadores existentes. Em julho, seu grupomostrou um conjunto de hipóteses originais e evidências criadas e validadas por máquinas. Em junho, um grupo do Google Research liderado por Christian Szegedi publicou os resultados das tentativas de usar os pontos fortes dos sistemas de processamento de linguagem natural para tornar as evidências do computador mais semelhantes em estrutura e explicação às humanas.
Alguns matemáticos veem os provadores de teoremas como ferramentas que podem revolucionar a maneira como os alunos aprendem a escrever provas. Outros dizem que fazer com que os computadores escrevam provas para matemática avançada é desnecessário e provavelmente impossível. No entanto, um sistema que pode prever uma hipótese útil e provar um novo teorema pode alcançar algo novo - uma espécie de versão de máquina de compreensão, disse Szegedi. E isso sugere a possibilidade de raciocínio automático.
Máquinas úteis
Matemáticos, lógicos e filósofos há muito debatem que parte da produção de provas é de natureza humana, e o debate sobre a mecanização da matemática continua hoje - especialmente onde a ciência da computação se funde com a matemática pura.
Para cientistas da computação, os provadores de teoremas não são controversos. Eles fornecem uma maneira clara de provar que o programa está funcionando, e argumentos sobre intuição e criatividade são menos importantes do que encontrar maneiras eficazes de resolver problemas. Por exemplo, Adam Chlipala , um cientista da computação do Instituto de Tecnologia de Massachusetts, desenvolveu ferramentas de prova de teoremas que geramalgoritmos criptográficos que protegem as transações na Internet - apesar do fato de que normalmente as pessoas inventam esses algoritmos. Seu código de grupo já é usado na maioria das comunicações no navegador Google Chrome.
Emily Riel, da Universidade Johns Hopkins, usa provadores de teoremas para treinar alunos e assistentes de computador.
“Você pode pegar qualquer declaração matemática e codificá-la com uma ferramenta e, em seguida, combinar todos os argumentos e obter uma prova de segurança”, disse Chlipala.
Na matemática, os provadores de teoremas ajudaram a produzir provas complexas e computacionalmente pesadas que, de outra forma, teriam levado milhares de anos matemáticos. Um exemplo notável é a hipótese de Keplersobre o mais denso acondicionamento de bolas no espaço tridimensional (historicamente, eram laranjas ou balas de canhão). Em 1998, Thomas Hales e seu aluno, Sam Ferguson, completaram esta prova usando uma variedade de técnicas matemáticas computadorizadas. O resultado foi tão complicado - a prova levou 3 GB - que 12 matemáticos o analisaram por vários anos antes de anunciar que estavam 99% certos de sua verdade.
A hipótese de Kepler não é o único problema famoso resolvido por máquinas. Com o teorema das quatro cores, alegando que quatro cores são sempre suficientes para pintar qualquer mapa bidimensional no qual não há duas áreas se tocando da mesma cor, foi descoberto em 1977 usando um programa de computador que processou mapas de cinco cores e mostrou que todos eles podem ser transformados em quatro cores. Em 2016, três matemáticos usaram um programa de computador para provar o problema booleano de longa data dos trigêmeos pitagóricos , mas a primeira versão da prova era de 200 TB. Se você tiver uma conexão de Internet rápida o suficiente, poderá baixá-lo em três semanas.
Sentimentos misturados
Esses exemplos são frequentemente apresentados como sucessos, mas também adicionam seu próprio sabor à controvérsia. O código de computador que provou o teorema das quatro cores há mais de 40 anos não pôde ser verificado por humanos. "Desde então, os matemáticos têm debatido se isso é uma prova ou não", disse o matemático Michael Harris, da Universidade de Columbia.
Muitos matemáticos, junto com Michael Harris, da Universidade de Columbia, questionam a necessidade de criar provadores de teoremas computadorizados - e que o último tornaria os matemáticos desnecessários.
Outro descontentamento dos matemáticos está relacionado com o fato de que se eles querem usar provadores de teoremas, primeiro eles precisam aprender a programar e, em seguida, descobrir como expressar seu problema em uma linguagem compreensível por computador - e tudo isso os desvia de fazer matemática. “Quando eu reformular a questão de uma forma adequada para essa tecnologia, vou resolver o problema sozinho”, disse Harris.
Muitas pessoas simplesmente não veem a necessidade de solucionadores de teoremas. "Eles têm seu próprio sistema, lápis e papel, e funciona", disse Kevin Buzzard, um matemático do Imperial College London, que mudou a direção da pesquisa três anos atrás, de matemática pura para provadores de teoremas e provas formais. “Os computadores fazem cálculos incríveis para nós, mas eles nunca resolveram um problema difícil por conta própria”, disse ele. "E até que isso aconteça, os matemáticos não vão acreditar."
Mas Buzzard e outros acham que ainda precisam dar uma olhada na tecnologia. Por exemplo, “as evidências do computador podem não ser tão estrangeiras quanto pensamos”, disse Dedeo. Recentemente, junto com Scott Viteri, um cientista da computação na Universidade de Stanford, ele engenharia reversa várias provas canônicas famosos (incluindo alguns dos BeginningsEuclidiana) e dezenas de provas geradas pelo programa de computador para provar teoremas de Coq em busca de semelhanças. Eles descobriram que a estrutura de ramificação das provas de máquina era notavelmente semelhante à estrutura das provas feitas por humanos. Essa propriedade comum, disse ele, pode ajudar os pesquisadores a encontrar uma maneira fazer programas auxiliares explicar.
"máquina de provas não pode ser tão enigmática quanto parecem", disse Dedeo.
Outros dizem teorema provadores podem ser ferramentas úteis para ensinar a ciência da computação e matemática. Na Johns Hopkins University matemático Emily Rieldesenvolveu cursos nos quais os alunos escrevem provas usando provadores de teoremas. “Isso os torna muito organizados e pensam com clareza”, disse ela. "Os alunos que escrevem uma prova pela primeira vez podem não entender imediatamente o que é exigido deles ou compreender a estrutura lógica."
Riel também diz que tem usado provadores de teoremas com mais frequência em seu trabalho ultimamente. "Eles não precisam ser usados o tempo todo e nunca substituirão os rabiscos em um pedaço de papel", disse ela, "mas usar assistentes de computador para as provas mudou minha ideia de como escrever provas."
Os provadores de teoremas também oferecem uma maneira de manter a matemática honesta. Em 1999, matemático soviético, russo e americanoVladimir Alexandrovich Voevodsky , descobriu um erro em uma de suas provas. Daí até sua morte em 2017, ele promoveu ativamente o uso de computadores para verificar evidências. Hales disse que ele e Ferguson encontraram centenas de erros em suas provas originais, testando-as com computadores. Mesmo os primeiros teoremas em Elementos de Euclides não são ideais. Se uma máquina pode ajudar os matemáticos a evitar esses erros, por que não tirar proveito dela? Harris ofereceu uma objeção prática a essa proposta, no entanto, não se sabe o quão razoável: se os matemáticos têm que gastar tempo formalizando matemática para um computador entendê-la, eles não serão capazes de gastar esse tempo em novas matemáticas.
No entanto, Timati Gowers, um matemático e um matemático vencedor do Prêmio Cambridge Fields, quer ir ainda mais longe: ele imagina como os provadores de teoremas substituirão os revisores humanos nas principais revistas científicas no futuro. "Vejo como isso pode se tornar uma prática padrão - se você deseja que seu trabalho seja aceito, é necessário examiná-lo por meio de um revisor automatizado."
Conversa com computadores
Antes que os computadores possam testar ou desenvolver evidências, os pesquisadores precisam primeiro superar um obstáculo significativo: a barreira de comunicação entre as línguas dos humanos e dos computadores.
Os provadores de teoremas de hoje foram projetados sem levar em conta a facilidade de uso do matemático. O primeiro tipo, ATP, era comumente usado para testar a veracidade de uma declaração, geralmente testando todas as opções possíveis. Pergunte ao ATP se é possível viajar de Miami a Seattle, e ele provavelmente passará por todas as cidades às quais levam as estradas de Miami e, eventualmente, encontrará a cidade que leva a Seattle.
Timati Gowers, da Universidade de Cambridge, acredita que os provadores de teoremas algum dia substituirão os revisores humanos
Usando ATP, o programador pode codificar todas as regras, ou axiomas, e então perguntar se uma hipótese particular segue essas regras. E então o computador faz todo o trabalho. “Basta inserir a hipótese que deseja provar e esperar obter uma resposta”, disse Daniel Huang, um cientista da computação que recentemente deixou a UC Berkeley para iniciar uma startup.
Mas há um problema: o ATP não explica seu trabalho. Todos os cálculos ocorrem dentro de uma máquina e, para uma pessoa, parecem uma longa sequência de zeros e uns. Huang disse que era impossível olhar para a prova e testar o raciocínio, já que tudo parecia um monte de dados aleatórios. “Ninguém pode olhar para essas evidências e dizer: tudo está claro”, disse ele.
A segunda categoria, o ITP, tem enormes conjuntos de dados contendo dezenas de milhares de teoremas e provas com as quais eles podem verificar a precisão de uma prova. Ao contrário dos ATPs, que funcionam dentro de uma caixa preta que simplesmente emite respostas, os ITPs exigem interação e, às vezes, orientação de uma pessoa, para que não sejam tão inacessíveis. “Uma pessoa pode sentar e descobrir quais técnicas estão sendo usadas para provar”, disse Huang. Essas evidências foram estudadas por Dedeo e Viteri.
Nos últimos anos, as ITPs têm se tornado cada vez mais populares. Em 2017, a trindade que provou o problema booleano dos triplos pitagóricos usou um ITP chamado Coq para criar e testar uma versão formal de sua prova. Em 2005, Georges Gontier, da Microsoft Research Cambridge, usou o Coq para formalizar o teorema das quatro cores. Hales também usou ITPs chamados HOL Light e Isabelle para provar formalmente a conjectura de Kepler (HOL significa lógica de ordem superior).
Hoje, a vanguarda desse campo está tentando combinar aprendizado com raciocínio. O ATP costuma ser combinado com o ITP para integrar o aprendizado de máquina e melhorar o desempenho de ambas as técnicas. Os especialistas acreditam que os programas ATP / ITP podem usar raciocínio dedutivo e até mesmo trocar ideias matemáticas da mesma maneira que os humanos, ou pelo menos de maneira semelhante.
Limites de raciocínio
Joseph Urban acredita que tal abordagem combinada pode casar raciocínio dedutivo e indutivo, que é necessário para obter evidências. Seu grupo criou provadores de teoremas movidos por aprendizado de máquina, permitindo que os computadores aprendessem com a experiência por conta própria. Nos últimos anos, eles têm explorado o poder das redes neurais - camadas de unidades de computação que ajudam as máquinas a processar informações de uma maneira que é mais ou menos semelhante a como funcionam os neurônios em nosso cérebro. Em julho, seu grupo relatou novas hipóteses geradas por uma rede neural treinada em prova de teoremas.
Em parte, Urban foi inspirado no trabalho de Andrei Karpaty, que há vários anos treinou uma rede neural para produzir um disparate matemático, que parecia convincente para não profissionais. Mas Urban não precisava de bobagens - ele e o grupo desenvolveram sua própria ferramenta de busca de provas, tendo treinado em milhões de teoremas. Eles usaram a rede para gerar novas hipóteses e testar sua validade com um programa ATP chamado E.
A rede emitiu mais de 50.000 novas fórmulas, embora dezenas de milhares delas tenham sido repetidas. “Parece que ainda não podemos provar hipóteses mais interessantes”, disse Urban.
Szegedi, do Google Research, vê o problema do raciocínio automático em evidências de computador como parte de um campo muito mais amplo: o processamento de linguagem natural, que inclui o reconhecimento de padrões no uso de palavras e frases. O reconhecimento de padrões também é uma ideia central da visão computacional, na qual Szegedi trabalhou anteriormente no Google. Como outros grupos, sua equipe deseja criar provadores de teoremas que possam encontrar provas úteis e explicá-las.
Inspirado pelo rápido desenvolvimento de ferramentas de IA como AlphaZero - o software da DeepMind que pode derrotar humanos no xadrez, go e shogi - o grupo Szegedi quer usar os avanços mais recentes em reconhecimento de linguagem para registrar evidências. Ele disse que os modelos de linguagem podem demonstrar raciocínio matemático surpreendentemente preciso.
Seu grupo no Google Research descreveu recentemente uma maneira de usar modelos de linguagem - que as redes neurais costumam usar - para gerar novas evidências. Depois de treinar o modelo para reconhecer a estrutura de árvore de teoremas comprovados, eles lançaram um experimento gratuito, simplesmente pedindo às redes neurais para gerar e provar teoremas sem supervisão. Das milhares de hipóteses geradas, 13% se revelaram prováveis e novas (não repetindo outros teoremas no banco de dados). Ele disse que tal experimento diz que as redes neurais podem aprender, em certo sentido, a entender como as evidências se parecem.
“As redes neurais são capazes de desenvolver uma aparência artificial de intuição”, disse Szegedi.
Claro, ainda não está claro se essas tentativas cumprirão a profecia de Cohen há 40 anos. Gowers disse acreditar que os computadores podem superar os matemáticos em raciocínio até 2099. No início, diz ele, os matemáticos vão desfrutar de uma idade de ouro, “quando eles fazem coisas interessantes e os computadores são chatos. Mas acho que não vai durar muito. "
Afinal, se as máquinas continuam se desenvolvendo cada vez mais e têm acesso a uma grande quantidade de dados, elas devem aprender a fazer coisas muito bem e interessantes. “Eles aprenderão a fazer seus próprios pedidos”, disse Gowers.
Harris discorda. Ele não acha que as provas de computador são necessárias, ou que vão acabar "tornando os matemáticos humanos desnecessários". Se os cientistas da computação, diz ele, algum dia conseguirem programar a intuição sintética, ela ainda não competirá com a intuição humana. "Mesmo que os computadores entendam, eles não entenderão no sentido humano."