Introdução
No mundo moderno, a tarefa de segmentação, como se viu, é resolvida uma ou duas vezes, embora eu achasse que era algo complicado e surpreendente. Tudo que você precisa fazer é ler alguns artigos, instalar certas bibliotecas e marcar os dados, tudo sobre tudo leva algumas horas, exceto para criar uma amostra de teste.
Marcação de dados
Esta etapa na implementação da segmentação de quadro de fluxo de vídeo é uma das mais trabalhosas em termos de trabalho humano.
Para fazer isso, você precisa usar programas especiais para marcar os quadros do fluxo de vídeo. Com este programa basta abrir o arquivo de vídeo necessário e marcar os frames, tendo previamente criado classes nas quais segmentaremos as imagens. No meu exemplo introdutório, a filmagem é dividida nas seguintes classes (carro, estrada, faixa de pedestres, gramado, edifícios, pessoas, calçada, marcações de estradas).
Na verdade, posições como estradas, edifícios, gramados, calçadas, etc. é possível não reconhecê-lo, já que a câmera neste caso está rigidamente fixada e, portanto, essas áreas estarão sempre no mesmo lugar.
Treinamento de uma rede neural para segmentação de imagens
( , ).
.
, . 4 (, , ... , , , ) 60 DeepLab v3+ ( ResNet-18). . 2.
, , , . .
, (. 3 4), .

, (. 5 6).

, , (. 7 9). (. 8).
3%, 54%. , . , , , . .



, . ( ), , .
- , . ( , ), . ., . , . , , . , , , , , , .
PS: Se alguém souber qual software pode ser usado para gravar um stream de vídeo de um stream do YouTube da maneira mais simples possível?) As câmeras simplesmente gravam dados em um buffer circular (nas últimas 12 horas) na forma de um stream do YouTube, formando assim a vigilância por vídeo, onde cada residente da casa pode ver as últimas 12 horas.