
Um novo capítulo apareceu na história de máquinas derrotando humanos: a IA mais uma vez derrotou um piloto humano em combate aéreo virtual. A competição AlphaDogfight foi o teste final de algoritmos de rede neural desenvolvidos para os militares dos EUA. E a melhor demonstração das capacidades de agentes autônomos inteligentes, capazes de derrotar aeronaves inimigas em combate aéreo. Mais detalhes - no material Cloud4Y.
Esta não é a primeira vez que uma IA derrota um piloto humano. Testes em 2016 mostraram que um sistema de inteligência artificial pode vencer um experiente instrutor de voo de combate. Mas a simulação DARPA de quinta-feira foi indiscutivelmente mais significativa, pois opôs muitos algoritmos uns contra os outros e depois contra humanos em ambientes desafiadores. Além de integrar a IA aos veículos de combate para aumentar sua capacidade de combate, simulações como essas também podem ajudar a treinar pilotos humanos.
Começar

Em agosto passado, a Agência de Projetos de Pesquisa Avançada de Defesa (DARPA) selecionou oito equipes para participar de uma série de testes. A lista inclui Aurora Flight Sciences, EpiSys Science, Georgia Tech Research Institute, Heron Systems, Lockheed Martin, Perspecta Labs, PhysicsAI e SoarTech (como você pode ver, junto com grandes empreiteiros de defesa como Lockheed Martin, pequenas empresas como Heron Sistemas).
O objetivo do programa era criar sistemas de IA para drones de combate e alas não tripuladas cobrindo caças tripulados. Os cientistas e militares esperam que a IA seja capaz de conduzir combates aéreos com mais rapidez e eficiência do que os humanos e reduzir a carga do piloto, dando-lhe tempo para tomar decisões táticas importantes em uma missão de combate maior.
A primeira fase dos testes AlphaDogfight foi realizada em novembro de 2019 no Laboratório de Física Aplicada da Universidade Johns Hopkins. Nele, algoritmos de rede neural criados por diferentes equipes travaram uma batalha aérea com o sistema de inteligência artificial Red, criado por especialistas da DARPA. As batalhas entre os algoritmos foram travadas no modo 1x1 em um nível de dificuldade baixo. A segunda fase de testes ocorreu em janeiro de 2020. Ele diferia do primeiro no aumento da complexidade. A fase final de testes, que ocorreu em 20 de agosto de 2020, pôde ser assistida ao vivo no canal da DARPA no YouTube .
Os testes foram realizados no simulador de aeronaves FlightGear usando o modelo de software de dinâmica de vôo JSBSim. Nos primeiros dois estágios, algoritmos de rede neural controlavam os caças pesados F-15C Eagle e, no terceiro, o F-16 Fighting Falcon médio.
Como uma máquina derrotou um homem
No terceiro estágio do teste, os algoritmos da rede neural primeiro conduziram batalhas aéreas entre si. O vencedor de todas as batalhas foi o sistema criado pela Heron Systems. As batalhas aéreas foram travadas de perto usando apenas armamento de canhão.
O algoritmo de Heron Systems então conduziu um duelo com um experiente piloto de caça da Força Aérea dos Estados Unidos e instrutor, indicativo de chamada Banger. No total, foram travadas cinco batalhas. O algoritmo de IA triunfou sobre tudo. “As técnicas padrão de combate aéreo que os pilotos de caça aprendem não funcionaram”, admitiu o piloto que perdeu o carro. Mas nas últimas rodadas, o homem foi capaz de resistir por mais tempo.
O motivo é que as IAs não podiam aprender com sua própria experiência durante os testes do mundo real. Na quinta e última rodada do dogfight, o piloto humano foi capaz de mudar significativamente suas táticas, o que lhe permitiu resistir por muito mais tempo. No entanto, a falta de velocidade de treinamento de um piloto experiente levou à sua derrota.
Outro vencedor do teste é o aprendizado por reforço profundo, no qual algoritmos de inteligência artificial repetidamente, às vezes muito rapidamente, testam um problema em um ambiente virtual até que desenvolvam algo como o entendimento. Que tipo de rede neural os desenvolvedores usaram não é divulgado. A Heron Systems usou o aprendizado por reforço para treinar a rede neural. Durante o treinamento, a rede executou quatro bilhões de simulações.
O segundo resultado em combate aéreo virtual foi mostrado por um algoritmo desenvolvido pela Lockheed Martin. Sua preparação também foi realizada por meio do treinamento de uma rede neural com reforço.
Poucos detalhes

Lee Rietholz, diretor e arquiteto-chefe de inteligência artificial da Lockheed Martin, disse a repórteres após o teste que tentar fazer o algoritmo funcionar bem em combate aéreo é muito diferente de ensinar software a simplesmente "voar", ou seja, manter uma certa direção, altitude e velocidade.
« , . , . , . , . , [] , .
, , . , : , , , . , . », — .
Não há dúvida de que a IA pode aprender e muito rapidamente. Usando recursos locais ou na nuvem para simular batalhas aéreas, ele pode repetir a lição indefinidamente em várias máquinas. A Lockheed, como várias outras equipes, tinha um piloto de caça. Eles também podem executar conjuntos de treinamento em 25 servidores DGx1 ao mesmo tempo. Mas o que eles acabaram produzindo poderia rodar em uma única GPU . Em comparação, após a vitória, Ben Bell, engenheiro sênior de aprendizado de máquina da Heron Systems, disse que seu algoritmo passou por pelo menos 4 bilhões de simulações e ganhou cerca de 12 anos de experiência.
Como resultado, a DARPA parabenizou a startup Heron Systems pela vitória , cujo algoritmo conseguiu contornar o desenvolvimento de empresas maiores como a Lockheed Martin.
O que mais há de interessante no blog do Cloud4Y
→ “Faça você mesmo”, ou um computador da Iugoslávia
→ O Departamento de Estado dos EUA criará seu próprio grande firewall
→ Inteligência artificial canta sobre revolução
→ Qual é a geometria do Universo?
→ Ovos de Páscoa nos mapas topográficos da Suíça
Assine o nosso canal Telegram para não perder mais um artigo. Escrevemos no máximo duas vezes por semana e apenas a negócios.