🧝🏾 🏥 🤰 Tecnologia de reconhecimento facial: uma história secreta 📚 💚 👨🏾‍🏭

Sessenta anos atrás, Woody Bledsoe, filho de um fazendeiro, inventou a tecnologia de identificação facial. Mas as evidências de seu envolvimento na descoberta praticamente desapareceram.

Os editores da Netology prepararam uma tradução adaptada do artigo da Wired sobre esse desconhecido para um amplo círculo da história, sobre os desenvolvimentos de Bledsoe e sua equipe, que são usados na moderna tecnologia de reconhecimento facial.

Por cerca de trinta anos, Woody Bledsoe foi professor na Universidade do Texas em Austin e trabalhou no desenvolvimento de raciocínio automatizado e inteligência artificial. De acordo com as memórias de Lance, filho de Bledsoe, o professor era um cientista otimista entusiasmado que, no final dos anos 1950, sonhava em criar um computador dotado de capacidades humanas e capaz de provar teoremas matemáticos complexos, manter uma conversa e jogar pingue-pongue decentemente.

Mas no início de sua carreira, Bledsoe estava procurando uma oportunidade de ensinar as máquinas a reconhecer rostos - uma habilidade humana subestimada, mas potencialmente poderosa. Esses foram os primeiros estudos sobre identificação facial (1960), e o trabalho do professor atraiu o interesse dos serviços de inteligência dos Estados Unidos. Os principais investidores de Woody eram provavelmente empresas de fachada da CIA.

:

Hoje, o reconhecimento facial é usado para fornecer segurança em telefones, laptops, passaportes e aplicativos de pagamento. Espera-se que essa tecnologia revolucione o mercado de publicidade direcionado e acelere o diagnóstico de certas doenças. Ao mesmo tempo, a tecnologia de identificação facial está se transformando em um instrumento de pressão governamental e vigilância corporativa.

Por exemplo, com a ajuda dessa tecnologia na China, o governo está rastreando representantes da minoria étnica uigur, centenas de milhares dos quais foram colocados em campos de prisioneiros políticos. E nos Estados Unidos, de acordo com o The Washington Post, a Polícia de Imigração e Alfândega e o FBI estão conduzindo uma busca digital: procurando suspeitos em bancos de dados do governo de carteiras de motorista - às vezes sem ir primeiro ao tribunal.

Em 2019, uma investigação do Financial Times revelou que pesquisadores da Microsoft e da Universidade de Stanford coletaram e disponibilizaram publicamente um grande número de pacotes de dados de imagens de pessoas sem o conhecimento ou consentimento das fotografadas. Posteriormente, esses dados foram destruídos, mas pesquisadores de startups de tecnologia e uma academia militar chinesa conseguiram obtê-los.

A pesquisa de Woody Bledsoe sobre o reconhecimento facial na década de 1960 antecipou os avanços tecnológicos e os aspectos éticos que estamos vendo hoje. No entanto, essas obras fundamentais são quase inteiramente desconhecidas - a maioria delas nunca foi tornada pública.

Em 1995, por razões desconhecidas, Woody pediu ao filho para destruir o arquivo de pesquisa. Mas a maioria dos artigos sobreviveu, e milhares de páginas de seu trabalho agora estão hospedadas no Centro Briscoe de História Americana da Universidade do Texas.

Entre outras coisas, dezenas de fotos de pessoas sobreviveram, e alguns rostos estão marcados com estranhas notações matemáticas, como se atingidos por algum tipo de doença de pele "geométrica". Nestes retratos, pode-se perceber a história do surgimento da tecnologia, que nas próximas décadas se desenvolverá e penetrará ativamente em muitas áreas da atividade humana.

Como tudo começou. Método Tupla

Woodrow Wilson (Woody) Bledsoe nasceu em 1921 em uma grande família de meeiros de Oklahoma. Ele era o décimo filho da família e, pelo que se lembrava, sempre ajudava o pai nas tarefas domésticas. Ele possuía uma mentalidade matemática. Formado do ensino médio. Ele estudou por três meses na Universidade de Oklahoma, após o qual Woody foi convocado para o exército às vésperas da Segunda Guerra Mundial.

Após a guerra, Woody estudou matemática na Universidade de Utah e depois foi para Berkeley para fazer seu doutorado. Depois de se formar na pós-graduação, Woody trabalhou na pesquisa de armas nucleares na estatal Sandia Corporation, no Novo México - junto com personalidades como Stanislaw Ulam, que ajudou a criar a bomba de hidrogênio.

Na Sandia, Woody deu os primeiros passos no mundo da computação, compromisso com o qual se manterá por toda a vida. Primeiro escrevi o código para projetos de armas nucleares. E mais tarde, Woody se interessou pelo reconhecimento automático de padrões, especialmente leitura de máquina - o processo de ensinar o sistema a reconhecer imagens não marcadas de caracteres escritos.

Woody Bledsoe e seu colega Iben Browning, um polímata, engenheiro aeronáutico e biofísico, criaram um método que mais tarde se tornaria conhecido como método n-tupla.

Os cientistas começaram projetando um símbolo impresso - digamos a letra Q - em uma grade retangular de células, como uma folha de papel pautada. A cada célula-célula foi atribuído um número binário dependendo da presença ou ausência de uma parte do símbolo nela: 0 - para uma célula vazia, 1 - para uma cheia. As células foram então agrupadas aleatoriamente em pares ordenados, como conjuntos de coordenadas. Em teoria, os grupos podem incluir qualquer número de células, daí o nome do método. Então, usando várias etapas matemáticas, o sistema atribuiu um valor único à grade de símbolos. E quando um novo símbolo era encontrado, a grade desse símbolo era comparada com outras no banco de dados até que a correspondência mais próxima fosse encontrada.

A essência do método era permitir o reconhecimento de muitas variantes do mesmo sinal: a maioria dos Qs tendia a obter resultados bastante semelhantes em comparação com outros Qs. O processo funcionava melhor com qualquer padrão, não apenas com texto. De acordo com Robert S. Boyer, matemático e amigo de longa data de Woody, o método da tupla ajudou a definir o escopo do reconhecimento de padrões. Este foi um dos primeiros passos para a pergunta: "Como posso programar uma máquina para fazer o que as pessoas fazem?"

Na época em que estava desenvolvendo o método de tuplas, Woody primeiro sonhou em criar uma máquina, que ele chamou de "homem do computador".

Anos depois, ele se lembrou da “excitação selvagem” que sentiu ao formular habilidades para inteligência artificial:

“Eu queria que ele lesse caracteres digitados e texto manuscrito. Eu podia vê-lo ou parte dele em uma pequena câmera que ficaria presa aos meus óculos, com um fone de ouvido através do qual eu o ouviria chamar os nomes dos meus amigos e conhecidos quando os encontrasse na rua ... Veja, meu amigo computador poderia para reconhecer rostos. "

Research at Panoramic Research Incorporated

Em 1960, Woody - junto com Iben Browning e outro colega de Sandia - fundou a Pesquisa Panorâmica Incorporada (Panorâmica). Eles foram inicialmente alojados em um pequeno prédio em Palo Alto, que ainda não era conhecido como o coração do Vale do Silício. Na época, a maioria dos computadores - dispositivos massivos que armazenavam dados em cartões perfurados ou fitas magnéticas - ficava em escritórios de grandes empresas e laboratórios governamentais. A empresa de Woody não tinha dinheiro para comprar um computador, então os cientistas alugaram tempo de computação em tal máquina de seus vizinhos, muitas vezes tarde da noite quando era mais barato.

O negócio da Panoramic era "testar as idéias que esperávamos virariam o mundo de cabeça para baixo".

De acordo com Nels Winkless, um escritor e consultor que esteve envolvido em vários projetos panorâmicos e mais tarde co-fundador da revista Personal Computing, "seu trabalho era fazer o que as outras pessoas acham estúpido demais".

As invenções de alguns dos pesquisadores panorâmicos tornaram-se amplamente conhecidas. Por exemplo, Helen Chan Wolf, uma pioneira na programação de robôs, trabalhou no Shakey the Robot. De acordo com o Instituto de Engenheiros Elétricos e Eletrônicos, é "o primeiro robô do mundo que incorpora inteligência artificial".

A Panoramic tentou em vão encontrar financiamento. Woody fez o possível para apresentar a tecnologia de reconhecimento de personagens, incluindo a apresentação da invenção à Fair Life Insurance Society e à revista McCall. Mas o contrato nunca foi assinado.

Ao longo de sua existência, a Panoramic teve pelo menos um patrono confiável para mantê-la à tona, a Agência Central de Inteligência.

Se houver referências à CIA nos papéis de Woody Bledsoe, é provável que tenham sido destruídas em 1995. Mas fragmentos de material remanescente indicam claramente que a empresa de Woody trabalhou com empresas de fachada da CIA por muitos anos. Nels Winkless, que era amigo da equipe da Panoramic, diz que a empresa provavelmente foi criada com financiamento de agências. "Ninguém nunca me falou diretamente sobre isso", lembra Winkless, "mas foi."

A Panoramic Research Incorporated foi uma das 80 organizações que trabalham no projeto MK-Ultra, de acordo com o site de consultas da Lei de Acesso Livre à Informação (FDA), o Black Vault. Este é o infame programa de "controle da mente" da CIA que usava tortura psicológica sem o consentimento das pessoas. Por meio da fundação de pesquisa simulada, a Medical Sciences Research Foundation, a Panoramic foi contratada para realizar subprojetos para estudar toxinas bacterianas e fúngicas e "controlar remotamente certas espécies animais".

David H. Price, antropólogo da Saint Martin University, acreditava que Woody e seus colegas também recebiam dinheiro da Society for the Study of Human Ecology. Em nome desta sociedade, a CIA concedeu bolsas a cientistas cujo trabalho pudesse melhorar os métodos de interrogatório usados pela agência, ou servir de cobertura para tais pesquisas.

Mas a pesquisa mais significativa da Panoramic foi fornecida por outra empresa fictícia, o King-Hurley Research Group (King-Hurley). De acordo com uma série de processos movidos na década de 1970, a CIA usou esse grupo de pesquisa para comprar aviões e helicópteros para a agência secreta da força aérea conhecida como Air America. Por um tempo, King-Hurley também financiou pesquisas psicofarmacológicas em Stanford.

No início de 1963, King-Hurley estava aceitando apenas várias apresentações de idéias de Woody Bledsoe. Ele propôs realizar "pesquisas para determinar a viabilidade de criar uma máquina simplificada de reconhecimento facial". Com base em seu trabalho com Browning no método de tupla, Woody queria ensinar o sistema a reconhecer 10 faces. Ou seja, ele planejava usar um banco de dados de 10 fotos de pessoas diferentes e descobrir se a máquina consegue identificar novas fotos de cada uma delas. “Em breve será possível aumentar o número de pessoas para milhares”, escreveu Woody. Em um mês, King-Hurley deu-lhe permissão para começar a trabalhar.

Primeiras experiências no campo do reconhecimento facial

Identificar dez pessoas pode parecer uma meta bastante modesta hoje, mas em 1963 era incrivelmente ambiciosa. O salto do reconhecimento de caracteres escritos para o reconhecimento facial foi gigantesco. Mesmo porque não havia um método padrão para digitalizar fotografias, nem uma base de imagem digital existente na qual confiar. Os pesquisadores modernos podem treinar seus algoritmos em milhões de selfies grátis, e o Panoramic teria que construir um banco de dados do zero.

Havia também um problema mais sério: as faces tridimensionais das pessoas, ao contrário dos signos bidimensionais, não são estáticas. As imagens da mesma pessoa podem diferir na rotação da cabeça, na intensidade da luz e no ângulo, bem como dependendo da idade, penteado e humor - em uma foto uma pessoa pode parecer despreocupada, em outra - ansiosa.

Por analogia, ao encontrar um denominador comum em uma fração extremamente complexa, a equipe teve que ajustar a variabilidade e ordenar as imagens que estavam comparando.

E dificilmente seria possível dizer com certeza que seus computadores darão conta dessa tarefa. Uma das máquinas principais era o CDC 1604 com 192 KB de RAM - cerca de 21.000 vezes menos que um smartphone moderno típico.

Desde o início, Woody estava totalmente ciente dessas complexidades, então ele escolheu uma abordagem de dividir para conquistar: ele dividiu a pesquisa em partes e as atribuiu a diferentes colaboradores.

O trabalho de digitalização das imagens ocorreu da seguinte forma. O pesquisador tirou fotos em preto e branco dos participantes do projeto em filme 16mm. Em seguida, ele usou o dispositivo de digitalização que Browning havia desenvolvido para transformar cada imagem em dezenas de milhares de pontos de dados. Cada ponto deveria ter um valor de intensidade de luz na faixa de 0 (mais escuro) a 3 (mais claro) - em um determinado local da imagem. Havia muitos pontos a serem processados pelo computador ao mesmo tempo, então o pesquisador escreveu o programa NUBLOB, que dividiu a imagem em amostras aleatórias e calculou um valor único para cada um, como aqueles atribuídos usando o método de tupla.

Woody, Helen Chan Wolfe e outro pesquisador trabalharam na inclinação da cabeça. Primeiro, os cientistas desenharam uma série de pequenas cruzes numeradas no lado esquerdo do rosto do sujeito, do topo da testa ao queixo. Em seguida, fizeram dois retratos, em um dos quais o homem olhava para a frente, e no outro ele girava 45 graus. Após a análise da localização das cruzes nessas duas imagens, os dados foram extrapolados para uma imagem facial com rotação de 15 ou 30 graus. Uma imagem em preto e branco de um rosto marcado foi carregada em um computador, e a saída foi um retrato giratório automaticamente - assustador, preciso e surpreendentemente preciso.

As soluções dos pesquisadores eram originais, mas não eficazes o suficiente. Treze meses após o início do trabalho, a equipe da Panorâmica admitiu que não havia treinado a máquina para reconhecer pelo menos um rosto, quanto mais dez.

Crescimento do cabelo, expressões faciais e sinais de envelhecimento - este triplo desafio representou “uma fonte colossal de variabilidade”, escreveu Woody em seu relatório de progresso de março de 1964 para King-Hurley. A tarefa definida "vai além do estado atual do campo de reconhecimento de padrões e tecnologias de computador modernas." Ao fazer isso, Woody recomendou o financiamento de mais pesquisas para tentar encontrar uma "abordagem completamente nova" para resolver o problema do reconhecimento facial.

Abordagem "homem-máquina" para reconhecimento de rosto

No ano seguinte, Woody chegou à conclusão de que a abordagem mais promissora para o reconhecimento automatizado de rosto é aquela que restringe a área às relações entre os elementos principais: olhos, orelhas, nariz, sobrancelhas, lábios.

O sistema que ele propôs era semelhante ao do criminologista francês Alphonse Bertillon, que ele criou em 1879. Bertillon descreveu as pessoas com base em 11 medidas físicas, incluindo o comprimento da perna esquerda e o comprimento do cotovelo até a ponta do dedo médio. A ideia era que, se medidas suficientes fossem tomadas, cada pessoa seria única. O método era trabalhoso, mas funcionou: com a ajuda dele em 1897, muito antes do uso generalizado de impressões digitais, os gendarmes franceses identificaram o assassino em série Joseph Vas.

Ao longo de 1965, a Panoramic tentou criar um sistema de identificação facial Bertillon totalmente automatizado. A equipe estava tentando desenvolver um programa que pudesse definir narizes, lábios e muito mais usando áreas claras e escuras em uma fotografia. Mas eles falharam.

Em seguida, Woody e Wolfe adotaram o que eles chamam de abordagem “homem-máquina” para reconhecimento de rosto - uma técnica que incorporou um pequeno input humano na equação.

Woody recrutou seu filho Gregory e seu amigo para o projeto - eles receberam 122 fotos de cerca de 50 pessoas. Os caras fizeram 22 medições de cada rosto, incluindo o comprimento da orelha e a largura da boca. Wolfe então escreveu um programa para processar os dados.

. , : , .

O próximo passo, no final de 1965, foi criar uma versão maior do mesmo experimento para tornar "humano" mais eficiente em seu sistema homem-máquina. Com o dinheiro de King-Hurley, eles compraram o tablet RAND, um dispositivo de US $ 18.000 que parecia um scanner de imagem de mesa, mas funcionava como um iPad. Usando uma caneta, o pesquisador desenhou em um tablet e, na saída, recebeu uma imagem de computador de resolução relativamente alta.

Um novo lote de fotos foi tirado por meio do tablet RAND, enfatizando os elementos-chave do rosto com a caneta. Esse processo, embora complexo, foi muito mais rápido do que antes: foram inseridos dados de cerca de 2.000 imagens, incluindo pelo menos duas imagens de cada rosto. Cerca de 40 imagens foram processadas por hora.

Mesmo com essa amostra maior, a equipe de Woody lutou para superar os obstáculos habituais.

O problema do sorriso, que “distorce o rosto e muda radicalmente as dimensões da interface”, assim como o envelhecimento, ainda não foi resolvido.

Ao tentar combinar a foto de 1945 de Woody com a foto de 1965, o sistema ficou confuso. Ela viu pouca semelhança entre um jovem com um sorriso largo e cabelo escuro e espesso e um homem mais velho com uma expressão sombria e cabelo ralo.

Foto de Woody Bledsoe de um estudo de 1965. Fotógrafo: Dan Winters

Era como se décadas tivessem criado uma pessoa diferente - e de certa forma era. A essa altura, Woody estava cansado de procurar novos contratos para a Panoramic e se viu "na posição ridícula de trabalhar demais ou não o suficiente". Ele continuamente apresentava novas ideias aos seus patrocinadores, algumas das quais são eticamente questionáveis hoje.

Em março de 1965 - 50 anos antes de a China começar a usar a correspondência facial para identificar uigures étnicos na província de Xinjiang - Woody convidou a Agência de Projetos de Pesquisa Avançada (ARPA) do Departamento de Defesa dos Estados Unidos para apoiar o Panoramic no estudo do uso de traços. pessoas para determinar a origem racial de uma pessoa. “Há um grande número de dimensões antropológicas de pessoas de todo o mundo que pertencem a diferentes grupos raciais e ecológicos”, escreveu Woody. "É um armazém de dados vasto e valioso que foi coletado com grande dificuldade e custo, mas não usado corretamente." Se o ARPA concordou em financiar este projeto permanece desconhecido.

Woody investiu milhares de dólares na Panoramic com seus próprios fundos, sem garantia de retorno. Enquanto isso, seus amigos da Universidade do Texas em Austin o persuadiram a conseguir um emprego na universidade, atraindo-o com um salário estável. E em janeiro de 1966, Woody deixou a Panoramic. A empresa fechou logo em seguida.

Com o sonho de criar um homem da computação, Woody mudou-se com sua família para Austin para se dedicar ao estudo e ensino do raciocínio automatizado. Mas seu trabalho em tecnologia de reconhecimento facial não parou por aí.

Experiência de reconhecimento facial de maior sucesso de Woody Bledsoe

Em 1967, Woody assumiu uma tarefa final relacionada ao reconhecimento de padrões faciais. O objetivo do experimento era ajudar as agências de aplicação da lei a vasculhar rapidamente os bancos de dados de pessoas presas em busca de correspondências.

Como antes, o financiamento para o projeto parece ter vindo do governo dos Estados Unidos. Um documento de 1967, desclassificado pela CIA em 2005, menciona um "contrato externo" para um sistema de reconhecimento facial que reduziria o tempo de busca em cem vezes.

O principal parceiro do projeto de Woody foi Peter Hart, um engenheiro de pesquisa do Laboratório de Física Aplicada do Stanford Research Institute. (Agora conhecido como SRI International. O instituto se separou da Universidade de Stanford em 1970 devido a diferenças no campus sobre a forte dependência do instituto de financiamento militar.)

Woody e Hart começaram com um banco de dados de cerca de 800 imagens - duas de cada "400 homens adultos caucasianos". Os fotografados diferiam em idade e giro da cabeça. Usando um tablet RAND, os cientistas registraram 46 coordenadas para cada fotografia, incluindo cinco valores para cada orelha, sete para o nariz e quatro para cada sobrancelha. Com base na experiência anterior de Woody com a normalização da variação da imagem, uma equação matemática foi usada para "virar" as cabeças em vista frontal. Então, para compensar a diferença de escala, cada imagem foi ampliada ou reduzida a um tamanho padrão, onde a métrica de referência era a distância entre as pupilas.

A tarefa do sistema era memorizar uma versão de cada pessoa e usá-la para identificar a outra.

Woody e Hart ofereceram ao carro um de dois atalhos. Na primeira, conhecida como combinação de grupos, o sistema dividia o rosto em características - sobrancelha esquerda, orelha direita e assim por diante - e comparava as distâncias relativas entre elas.

Fotógrafo: Dan Winters A

segunda abordagem foi baseada na teoria de decisão bayesiana, em que a máquina usava 22 dimensões para fazer um palpite geral.

Como resultado, ambos os programas lidaram com a tarefa de maneira aproximadamente igual. E também acabou por ser melhor do que os rivais humanos. Quando Woody e Hart pediram a três pessoas que combinassem subgrupos de 100 indivíduos, mesmo o mais rápido deles levou seis horas. O CDC 3800 concluiu uma tarefa semelhante em cerca de três minutos, alcançando uma redução de 100 vezes no tempo. Os humanos eram melhores em lidar com mudanças de direção e fotos de baixa qualidade, mas o computador era "muito superior" na detecção de mudanças relacionadas à idade.

Os pesquisadores concluíram que a máquina "domina" ou "quase domina" a pessoa. Este foi o maior sucesso de Woody em sua pesquisa sobre reconhecimento facial.

Foi também seu último trabalho sobre o assunto, que nunca foi publicado "no interesse do estado", o que Woody e Hart lamentaram profundamente.

Em 1970, dois anos após o fim de sua colaboração com Hart, um técnico de robôs chamado Michael Kassler disse a Woody que Leon Harmon, da Bell Labs, estava planejando um estudo sobre reconhecimento facial. "Estou indignado que este segundo tipo de estudo será publicado e acabará sendo o melhor sistema homem-máquina", respondeu Woody. "Acho que com muito trabalho Leon estará cerca de 10 anos atrás de nós em 1975 ano. ”Woody deve ter ficado desapontado quando a pesquisa de Harmon foi capa da Scientific American alguns anos depois - enquanto seu próprio trabalho mais avançado era mantido em depósitos.

Usando o método Woody Bledsoe na moderna tecnologia de reconhecimento facial

Nas décadas que se seguiram, Woody ganhou prêmios por suas contribuições para o raciocínio automatizado. Por um ano, ele atuou como presidente da Associação para o Desenvolvimento de Inteligência Artificial. Mas seu trabalho com reconhecimento facial permaneceu em grande parte não reconhecido e quase esquecido, enquanto outros colecionavam louros.

Em 1973, o cientista da computação japonês Takeo Kanade deu um grande salto na tecnologia de reconhecimento facial.

Com base em um banco de dados de 850 fotografias digitalizadas da Feira Mundial de Sweet, no Japão, em 1970, o Canadá desenvolveu um programa que pode extrair características faciais - nariz, boca e olhos - sem intervenção humana. O Canadá conseguiu realizar o sonho de Woody de excluir o homem do sistema homem-máquina.

Woody usou seu conhecimento de reconhecimento facial algumas vezes ao longo dos anos.

Em 1982, ele foi levado como especialista em um caso criminal na Califórnia. Um suposto membro da máfia mexicana foi acusado de cometer uma série de roubos no condado de Contra Costa. O promotor tinha várias evidências, incluindo imagens de videovigilância de um homem de cabelos compridos com barba, óculos escuros e um chapéu de inverno. Mas nas fotos, o acusado parecia ser um homem barbeado e com cabelo curto. Woody mediu o rosto do ladrão, comparou-o com as fotos do acusado e descobriu que os rostos pertenciam a duas pessoas diferentes devido à diferença na largura dos narizes. Apesar de o homem ainda ter ido para a prisão, foi absolvido de quatro acusações, nas quais Woody foi testemunha.

“Apenas nos últimos 10 anos, a tecnologia de reconhecimento facial aprendeu a lidar com imperfeições”, diz Anil K. Jain, um cientista de software da Michigan State University e co-editor do Handbook of Face Recognition.

Quase todos os problemas que Woody enfrentou desapareceram. Hoje existe um suprimento inesgotável de imagens digitalizadas. “Por meio da mídia social, você pode obter quantas fotos de rosto quiser”, diz Jane. E, graças aos avanços em aprendizado de máquina, memória e poder de processamento, os computadores aprendem a aprender com eficácia. Com algumas regras simples, eles podem analisar grandes quantidades de dados e criar modelos para quase tudo, desde um rosto humano a um saco de chips - não são necessárias mais medições com um tablet RAND ou método Bertillon.

Mesmo considerando o quão longe o reconhecimento facial avançou desde meados da década de 1960, Woody Bledsoe identificou muitos dos desafios que ainda precisam ser enfrentados nessa área.

, - . , , , .

Embora os sistemas modernos de aprendizagem profunda não sejam explicitamente instruídos pelo programador para identificar narizes e sobrancelhas, a virada de Woody nessa direção em 1965 definiu a direção da indústria por décadas. “Nos primeiros 40 anos, foi a extração de recursos que dominou”, diz Takeo Kanade, agora professor do Carnegie Mellon Institute of Robotics.

Hoje, em certa medida, eles voltaram ao que se assemelha às primeiras tentativas de Woody de “descobrir” um rosto humano, quando ele usou uma variação do método da tupla para encontrar padrões de semelhanças em um campo gigante de pontos de dados. Por mais complexos que sejam os sistemas de reconhecimento facial modernos, Anil Jane afirma que eles simplesmente comparam pares de imagens e atribuem a eles uma pontuação de similaridade.

Mas talvez o mais importante, o trabalho de Woody Bledsoe estabeleceu o tom ético para a pesquisa de reconhecimento facial - tanto relevante quanto problemático. Ao contrário de outras tecnologias que mudaram o mundo, cujas capacidades catastróficas se tornaram aparentes ao longo dos anos - mídia social, YouTube, drones - o abuso potencial da tecnologia de reconhecimento facial tornou-se evidente quase desde o momento em que nasceu na Panoramic.

Muitos preconceitos que podem ser atribuídos aos resquícios da época da pesquisa de Woody - a atração de quase apenas brancos por experimentos, a confiança aparentemente descuidada no governo, o desejo de usar o reconhecimento facial para discriminar por motivos raciais - tudo isso é inerente ao campo moderno do reconhecimento facial.

Nos testes de 2019 do software Rekognition da Amazon, 28 jogadores da NFL foram identificados por engano como criminosos. Poucos dias depois, a American Civil Liberties Union entrou com uma ação no Departamento de Justiça dos EUA, no FBI e na Drug Enforcement Administration para obter informações sobre o uso de tecnologia de reconhecimento facial da Amazon, Microsoft e outras empresas. Um relatório de 2019 do Instituto Nacional de Padrões e Tecnologia, que testou o código de mais de 50 desenvolvedores de software de reconhecimento facial, descobriu que os homens brancos tinham menos probabilidade de se relacionar com criminosos do que outros grupos. Em 2018, um casal de cientistas fez duras críticas: "Acreditamos que a tecnologia de reconhecimento facial é o mecanismo de vigilância mais perigoso já inventado."

Na primavera de 1993, devido a uma doença degenerativa de ALS, a fala de Woody se deteriorou. Mas ele continuou a ensinar na Universidade do Texas até que sua fala se tornou ilegível. Ele continuou sua pesquisa no campo do raciocínio automatizado - até parar de segurar a caneta. Até o final, permanecendo como cientista, Woody fez anotações de seu discurso para acompanhar o desenvolvimento da doença.

Woody Bledsoe morreu em 4 de outubro de 1995. O obituário não mencionou seu trabalho em reconhecimento facial. Na foto do obituário, Woody de cabelos grisalhos está olhando diretamente para a câmera, um largo sorriso no rosto.

Comentário de Elena Gerasimova, chefe de análise e ciência de dados da Netology

As ideias de Woody Bledsoe não tiveram sucesso comercial, talvez porque seu tempo caiu em um dos "invernos da inteligência artificial". Havia pouca confiança nas tecnologias, não havia capacidade suficiente para demonstrar resultados impressionantes e as tecnologias para reconstruir o cérebro humano eram principalmente utilizadas por entusiastas - o acadêmico Andrei Nikolaevich Kolmogorov, o matemático americano George Tsibenko e outros.

No entanto, graças a essa pesquisa, avanços modernos tornaram-se possíveis, que são baseados em poder de computação poderoso, nuvens, microchips.

Em 1998, Yang LeCun aperfeiçoou as abordagens para reconhecer números escritos à mão em seu LeNet - graças à evolução da capacidade de computação que não estava disponível durante a pesquisa de Woody Bledsoe.

A tecnologia de reconhecimento facial faz fronteira com a tecnologia de geração de rosto mais avançada, que é usada, por exemplo, para criar deepfakes e gerar rostos de adultos e crianças, bem como de gatos e cães. Parece que é mais fácil - tirar uma foto de uma pessoa e carregá-la, condicionalmente, em um catálogo eletrônico de roupas; ou grave um vídeo fofo com um bebê e brinquedos; ou ensinar uma rede neural a criar a imagem de uma criança na roupa, no interior ou com um brinquedo, que pretendemos colocar no catálogo e assim demonstrar? A resposta será levantada pelo montante de investimento em empresas que desenvolvem tecnologia para criação de imagens fotorrealísticas - só nos Estados Unidos, em 2019, o investimento total foi de mais de US $ 500 milhões.

Geração de imagens fotorrealísticas de pessoas

Se você está interessado em trabalhar com dados, redes neurais, oferecemos-lhe a oportunidade de conhecer nossos programas, cuja formação está baseada em uma base científica e de pesquisa:

Profissão " Data Scientist ". Prêmio “ Marca de Qualidade ” na indicação “Treinamento de profissionais da indústria digital” (2019).
Profundo Aprendizagem curso . Na página inicial do curso, você pode ver exemplos de projetos dentro do curso e ver como está o treinamento.

E para quem procura abordagens à implementação de inteligência artificial, aprendizagem de máquina e “reboot digital”, sugerimos consultar as informações do curso “ Transformação empresarial: a introdução da inteligência artificial ”. Os alunos criam uma estratégia para a implementação de inteligência artificial e elaboram casos de negócios reais sob a orientação de especialistas russos e estrangeiros.

Tecnologia de reconhecimento facial: uma história secreta

: