
Você pode ler não apenas nos lábios durante uma conversa, mas também nas mãos que se agitam sobre o teclado. Assim, pelos movimentos das mãos vistos pelos atacantes durante a videochamada, é possível adivinhar senhas e palavras-código digitadas em um teclado QWERTY tradicional.
Desenvolvedores americanos criaram um algoritmo especial que pode ler os movimentos dos contornos dos ombros e braços do usuário digitando no teclado, analisá-los e compará-los com os caracteres inseridos. Em seguida, a IA elabora uma lista de letras e números provavelmente digitados, o que permite, por exemplo, recuperar caracteres digitados durante a autorização. E tudo isso - quase em tempo real, durante uma videoconferência.
Existe uma maneira de determinar os caracteres digitados no teclado pelo som das teclas. Isso requer acesso ao PC de destino. O método, entretanto, é impreciso, uma vez que o ruído natural interfere muito na percepção e na análise. Além disso, a criptoanálise acústica não funciona para teclados com pressionamentos de tecla de baixa amplitude.
O algoritmo, inventado por desenvolvedores da Universidade do Texas em San Antonio, leva em consideração a velocidade de digitação, a ordem em que as mãos são usadas, monitora seu movimento e conta o número provável de letras em uma palavra. O arsenal do aplicativo inclui um dicionário das palavras mais populares usadas como senhas. De acordo com os pesquisadores, o sinal de vídeo é menos sujeito a distorção do que o áudio.

O algoritmo de análise e decodificação de vídeo funciona da seguinte maneira:
- .
- .
- .
- .
- : .
- .
- , .

Os pesquisadores testaram o algoritmo em várias condições.
Em um caso, eles usaram um dicionário com 65 mil das palavras mais populares e distribuíram as 50 mais prováveis em uma seleção. A precisão dependia das plataformas web utilizadas. As palavras previstas mais precisas foram inseridas no Skype. Em condições idênticas, acabou sendo 3,4% mais preciso do que o zoom e 8% mais preciso do que o Hangouts.
Em outro caso, eles pegaram um dicionário de 4 mil palavras. Mas então 75% das palavras inseridas estavam na lista de 200 palavras mais prováveis.
Uma nuance interessante: o trabalho do algoritmo é altamente dependente das roupas dos sujeitos. Por exemplo, pessoas com as mãos desprotegidas são mais suscetíveis a ataques. A precisão do reconhecimento dos caracteres inseridos quando os participantes do experimento estavam com roupas sem mangas foi de 81,7%, contra 74,4% e 73% da precisão com mangas compridas e curtas, respectivamente.
O estilo de digitação e a precisão do reconhecimento são influenciados pelo tipo de teclado e pela distância entre as teclas. Mas, como se viu, isso não é tão essencial para a precisão. O teclado Logitech é significativamente maior do que o Anker, mas a precisão é quase idêntica.
Além dos testes de laboratório, os desenvolvedores observaram 10 participantes em seu ambiente doméstico típico: sete homens e três mulheres. Todos os participantes tiveram aproximadamente a mesma velocidade de digitação de 3,7 cliques por segundo e uma taxa de erro de 86,7%. Para a pureza do experimento, uma série de condições limitantes foram introduzidas: duração da chamada de 30 minutos, atividades de PC recomendadas de dez minutos, etc.
De acordo com os resultados do experimento, descobriu-se que em casa nem todos usavam a posição das câmeras, semelhante às condições de laboratório. Além disso, uma resolução diferente das webcams afetou a precisão das informações produzidas pelo algoritmo. Em um caso, o cabelo cobriu completamente a área do antebraço, privando o algoritmo da capacidade de análise. Portanto, em geral, não é tão difícil se proteger.
