Interação entre agente e ambiente - o caminho para AGI

imagem



Uma rede neural pode ser ensinada a pensar como um humano? Ou pelo menos como um animal? Sobre o que os animais pensam? Você pode chamar o que está acontecendo nos reflexos da cabeça do gato? E qual é o segredo da consciência afinal? A seguir, tentaremos entender todas essas questões.



Não é segredo que as redes neurais podem aproximar qualquer função, existem até teoremas que provam isso. Existe uma camada de entrada, camadas ocultas e uma camada de saída. No caso da aprendizagem por reforço, a camada de entrada é como o ambiente atua sobre o agente. E a camada de saída são as ações do agente no ambiente. Para obter um agente suficientemente inteligente, precisamos de 3 coisas: um número suficiente de neurônios em camadas ocultas, um ambiente suficientemente elaborado que possibilite receber reforço e também precisamos de um grande número de neurônios de entrada e saída para maximizar a interação com o ambiente.



Considere o cérebro humano - 100 bilhões de neurônios. Formalmente, são cerca de 10 camadas de 10 bilhões de neurônios. Escreva nos comentários quanta energia é necessária para calcular esse valor. Para experimentos, você pode usar um número subestimado de 10 a 100 vezes de neurônios.



O meio ambiente deve ser tão diverso quanto o mundo ao nosso redor. Podemos colocar um agente robô em realidade ou ensiná-lo em realidade virtual, pedindo-lhe um reforço da função (a ação do agente) que gostaríamos que ele desempenhasse.



Eu gostaria de falar sobre neurônios de entrada e saída separadamente. Seu objetivo é a interação com o meio ambiente. Os neurônios de entrada de um gato são todos os seus receptores nos olhos, ouvidos e pele, assim como em muitos outros. Os neurônios de saída estão conectados principalmente a vários músculos, o que dá à criatura a capacidade de interagir com o ambiente (o feedback do agente sobre o ambiente). Quanto mais neurônios de entrada e saída - melhor, mais ampla e melhor será a interação "ambiente-agente-ambiente"



Vejamos alguns exemplos. Os receptores captam a falta de ar - o cérebro força os pulmões a respirar. Os receptores do estômago falam de fome - o cérebro tira a função de obter alimento em um determinado ambiente. Ou um exemplo com uma agulha - se algo picar a pele, o sinal vai para o cérebro, é processado lá e o cérebro dá uma ordem para a mão como se livrar desse problema. Tudo se resume a uma coisa simples - quando os receptores não são perturbados, não há ação. Mas se o receptor está excitado, o cérebro procura uma solução que ajude a remover a excitação desse receptor. Assim que a cadeia desejada for encontrada e o receptor perder sua excitação, as conexões neurais dessa cadeia são reforçadas. E já da próxima vez essa cadeia de ações será uma prioridade. Isso acontece com todas as ações em nossa vida. Assim, você pode criar um agente para qualquer ambiente e para todas as funções de que precisarmos.A questão reside apenas na capacidade produtiva.



All Articles