O serviço de IA da Bielo-Rússia está à frente da IA ​​do Google e da Microsoft no reconhecimento de automóveis

imagem



Quando se trata de reconhecimento de objetos, os primeiros cliques serão direcionados ao Google ou à Microsoft. E se eles lutassem entre si para reconhecer carros? Conduzimos um estudo adicionando o serviço Bielorrusso SpotVision Car Detection à lista de jogadores. Quem ganhará?



Vamos começar com o fato de que precisávamos resolver um problema aplicado - identificar carros em fotos, selecioná-los e relatar as coordenadas dos carros. A ideia, em primeiro lugar, surgiu para uso pessoal - encontrar e ver de forma rápida e eficiente as vagas de estacionamento gratuitas no pátio antes que o motorista chegue lá. Mais tarde, esta ideia tornou-se uma tarefa para as empresas - fornecer serviços adicionais para clientes de qualquer empresa de estacionamento, bem como clientes de serviços de videovigilância.



O objetivo é reconhecer carros em imagens de câmeras de CFTV e transmitir informações de forma esquemática para um mapa em um aplicativo móvel ou painel.



Em primeiro lugar, testamos a IA do Google, pois confiamos em muitos produtos do Google incondicionalmente. E parecia que, para um monstro tão grande e influente, o reconhecimento do carro seria uma questão insignificante (será dado facilmente, será fácil de fazer). No entanto, ficamos muito desapontados. O reconhecimento de IA do Google para carros não é muito preciso. Portanto, ele se parece mais com uma RP de outros produtos do Google do que com um sistema de visão por computador que funciona bem.



Para o primeiro teste, tiramos imagens bem iluminadas na altura e escala ideais dos veículos. O lançamento de avistamento falhou. De mais de 40 carros, o Google AI e apenas 10 carros circulou.



Teste 1. Google AI

imagem



Tendo descoberto que até mesmo o grande Google falha no reconhecimento em um nível tão banal, pegamos o serviço Microsoft Computer Vision para comparação. Obtivemos o seguinte resultado.



Teste 1. Microsoft Computer Vision

imagem



Existem 6 (!) Carros no total. E parece muito triste.



Percebendo que a esfera da IA ​​está apenas começando a se desenvolver, e nosso interesse por esportes não pode ser aliviado, começamos a coletar um conjunto de dados de carros e treinar nossa própria rede neural. Tomamos a estrutura YOLOv3 Darknet como base. As experiências têm mostrado que é ele quem cria menos problemas na implementação. Ele processa imagens rapidamente e aplica aumento automaticamente quando há imagens insuficientes. Após um período de treinamento intensivo, temos uma rede neural treinada com base em mais de 25 mil imagens. No momento, estamos adicionando mais 2500 fotos para treinamento.



É assim que o SpotVision Car Detection, sistema de IA da Bielorrússia, lidou com a mesma tarefa.



Teste 1. Detecção de carro SpotVision



imagem



Como você pode ver, a grande maioria dos carros foi identificada, e não apenas no estacionamento. Ou seja, onde o olho humano pode ver facilmente o carro, o sistema SpotVision faz um excelente trabalho.



Vamos complicar a tarefa e fazer uma visão noturna. Do ponto de vista da relevância da aplicação, é mais difícil para os condutores encontrarem um lugar de estacionamento gratuito à noite devido à pouca visibilidade e ao grande número de carros já estacionados. Portanto, a discriminação noturna é mais valiosa.



Isso é o que o Google deu como resultado.



Teste 2. Google AI

imagem



e uma versão semelhante do Microsoft



Test 2. Microsoft Computer Vision

imagem



Isto é - zero completo e a ausência de quaisquer sinais de carros na imagem.



Vamos comparar os resultados do sistema de reconhecimento de máquina SpotVision.



Teste 2. SpotVision Car Detection Continuando

imagem



. Na maioria das vezes, as câmeras CCTV são instaladas nos andares superiores de edifícios de vários andares. Isso fornece a maior cobertura visual da área de estacionamento com uma única câmera. Isso reduz o custo dos serviços de vigilância por vídeo para equipamentos e instalação. Como o caso mais frequente e exigido é o de reconhecimento de automóveis nos pátios de complexos residenciais e centros comerciais, também nos comprometemos a analisá-lo em três sistemas.



Teste 3. Google AI

imagem



Test 3. Microsoft Computer Vision

imagem



Test 3. SpotVision Car Detection

imagem



Agora vamos colocar a questão diretamente: como os sistemas lidam se a imagem mostra um carro inteiramente e as bordas dos carros adjacentes são capturadas?



Teste 4. Teste de IA do Google

imagem



4. Microsoft Computer Vision

imagem



Teste 4. SpotVision Car Detection

imagem



De acordo com os resultados, o Google AI encontrou 4 objetos na imagem, e três deles são rodas, não carros inteiros. O Microsoft Computer Vision identificou 2 carros. O Spotvision reconheceu 4 veículos como um todo e uma roda separadamente. O sistema de reconhecimento de carro da Bielorrússia lidou com a tarefa com um pequeno erro, mas da forma mais completa.



É interessante o que os sistemas circularão onde não há sinais óbvios do carro, nos quais os sistemas de reconhecimento se baseiam com mais frequência - este é o contorno usual do carro e o contorno das rodas.



Teste 5. Google AI

imagem



Test 5. Microsoft Computer Vision

imagem



Test 5. SpotVision Car Detection

imagem



Surpreendentemente, todos os três serviços identificaram o carro com precisão, apenas o Google AI reagiu adicionalmente à roda ou redemoinhos de fumaça colorida, circulando-o com um retângulo.

Chuva e neblina são outra complicação natural do reconhecimento. Eles reduzem a clareza da imagem e podem ocultar objetos da visão computacional.



Teste 6. Google AI

imagem



Test 6. Microsoft Computer Vision

imagem



Test 6. SpotVision Car Detection O

imagem



Google AI e o SpotVision Car Detection tiveram o melhor desempenho, embora tenham perdido de vista dois carros que viajavam à distância. O Microsoft Computer Vision perdeu uma máquina e, das quatro óbvias, apenas circulou três.



Portanto, dois testes de controle com o número máximo de veículos mostrados. O teste 7 mostra 46 veículos.



Teste 7. Google AI

imagem



Test 7.Microsoft Computer Vision

imagem



Test 7. SpotVision Car Detection

imagem



Dos 46 carros na foto, o Google AI encontrou 11 carros, Microsoft Computer Vision - 30 carros e erroneamente circulou o sinal no mastro, e SpotVision encontrou 46 carros.



Vamos continuar com exemplos em que existem muitos carros. Mudando o ângulo de visão.



Teste 8. Google AI

imagem



Test 8. Microsoft Computer Vision

imagem



Test 8. SpotVision Car Detection Adicionamos

imagem



fotos de jardas reais, levando em consideração as mudanças sazonais. Na variante abaixo, é inverno e neve. Como você pode ver, manchas descongeladas e lugares onde os carros saíram podem ser erroneamente reconhecidos como carros. E também os carros sob a neve se tornam invisíveis aos sistemas de visão computacional.



Teste 9. Google AI

imagem



Teste 9. Microsoft Computer Vision

imagem



Test 9.SpotVision Car Detection

imagem



A mesma visualização, apenas no modo noturno.



Teste 10. Google AI

imagem



Test 10. Microsoft Computer Vision

imagem



Test 10. SpotVision Car Detection

imagem



Acontece que o Google AI e o Microsoft Computer Vision trabalham com uma gama mais ampla de tarefas, mas sofreram uma falha absoluta na detecção de carros. A maioria dos casos falhou total ou parcialmente, alguns foram identificados com manchas. Portanto, eles não são adequados para atender empresas que desejam expandir seus recursos por meio da integração com serviços de IA. Ao mesmo tempo, o serviço SpotVision Car Detection da Bielorrússia lidou com 98% com as tarefas atribuídas e está pronto para aplicação em tempo real.



Se você deseja testar cada serviço por si mesmo, aqui estão os links



Google AI

Microsoft Computer Vision

Spotvision Car Detection



All Articles