Escuta em conversas privadas é uma das ameaças de privacidade mais comuns e desagradáveis. Não é à toa que muitas pessoas colam microfones e câmeras em laptops para manter em segredo os momentos mais pessoais e privados. Bem, é hora de colar as tampas do seu aspirador de pó inteligente também. Porque cientistas da Universidade Nacional de Cingapura descobriram uma maneira de grampear salas com um aspirador de pó.
Recentemente, pesquisadores propuseram vários métodos de escuta telefônica por meio de vários dispositivos inteligentes da "casa inteligente". Este artigo descreve o LidarPhone - um novo canal de ataque acústico por meio de lidars, que são equipados com aspiradores de pó robóticos domésticos populares. A ideia principal é redirecionar o lidar para funcionar como um microfone a laser que pode captar sons de vibrações sutis induzidas em objetos próximos.
Os sons são ondas de pressão que se propagam através das vibrações do meio. Consequentemente, a energia do som no ambiente é parcialmente induzida em objetos próximos, criando vibrações físicas sutis dentro desses meios sólidos. O conceito fundamental do LidarPhone é sentir essas vibrações induzidas em objetos do cotidiano usando o sensor LIDAR do aspirador de pó do robô e, em seguida, processar o sinal de vibração gravado para recuperar traços de sons. Esse método de detecção é inspirado no princípio dos microfones a laser, que usam feixes de laser refletidos para captar sons de objetos vibrantes.
Como funciona um lidar barato
Embora os microfones a laser exijam ajustes complexos, os sensores LIDAR rotativos são equipados com pelo menos um transmissor de laser e um sensor de reflexão. Isso fornece recursos essenciais para a conversão de lidar em microfone. É claro que a implementação prática dessa ideia exige a superação de uma série de dificuldades.
Um dos principais problemas ao usar lidar como um microfone a laser é a relação sinal-ruído (SNR) extremamente baixa dos sinais refletidos. Isso se deve em parte ao fato de que o LidarPhone se baseia em princípios físicos diferentes dos microfones a laser, apesar de suas semelhanças óbvias em alto nível. Os microfones a laser têm como alvo materiais altamente reflexivos (ou seja, produzindo reflexos especulares), como janelas de vidro SNR alto. Em contraste, amplificadores lidar de hardware e conversores analógico-digital (ADCs) são ajustados para serem sensíveis apenas a sinais de baixa intensidade, que refletem principalmente em superfícies ásperas, como paredes, produzindo reflexos difusos. Portanto, mesmo que o lidar receba sinais de alta intensidade da janela de vidro,ele não receberá informações úteis.
Diferença entre a reflexão especular direcional para um microfone a laser (à esquerda) e reflexões difusas com SNR mais baixo recebido pelo LidarPhone
Para superar o problema de SNR baixo, os cientistas usaram várias técnicas de processamento de sinal, incluindo a filtragem de componentes de frequência contendo ruído. Para reduzir ainda mais o efeito do ruído, eles realizaram a redução do ruído subtraindo o ruído perfilado dinamicamente usando análise espectral. Com mais detalhes, os métodos físicos e matemáticos são descritos em trabalhos científicos .
Outra questão importante no desenvolvimento do ataque LidarPhone foi a baixa taxa de amostragem do lidar. Dado seu movimento rotacional, a taxa de amostragem de um ponto no alvo é equivalente à taxa de rotação do lidar. Os cientistas aumentaram a taxa de amostragem multiplicando a velocidade lidar (5 Hz) pelo número de amostras por revolução (360). Assim, a taxa de amostragem aumentou de 5 Hz para 1,8 kHz, que é um indicador importante ao treinar uma rede neural.
O LidarPhone processa e extrai cuidadosamente os traços de sinal de áudio de reflexões de laser inicialmente ruidosas. Dessa forma, informações confidenciais são capturadas (por exemplo, a fala emitida por um alto-falante do computador quando a vítima está participando de uma teleconferência).
Neste artigo científico, a título de experimento, o ataque foi testado no aspirador de pó robô Xiaomi Roborock. O protótipo do LidarPhone foi treinado com números de alto-falantes de computador e música de alto-falante de TV: mais de 30 mil trechos de áudio com duração total de mais de 19 horas de áudio gravado. Como resultado, o LidarPhone mostrou uma precisão média de cerca de 91% e 90% ao classificar números e música, respectivamente.
No experimento, o LidarPhone recebeu informações de fala confidenciais de feixes de laser refletidos dos menores objetos vibrantes, como uma lata de lixo ou um saco plástico. A ilustração abaixo mostra a aparência de um sinal sonoro com reflexo de vários objetos.
A figura corresponde aos sons da palavra "nove" derivados a) do áudio original; b) gravação do microfone a uma distância de 3 metros; c) lixeira processada pode lidar com registros; d) Pacote IKEA. Os arquivos de áudio correspondentes são publicados em bit.ly/lidarphone-sensys
LidarPhone supera as limitações dos métodos modernos de escuta telefônica que requerem algum tipo de equipamento de escuta para aumentar as chances de detecção. Não há bugs ou equipamentos estranhos aqui. Apenas um aspirador de pó comum que fica modestamente em um canto e não levanta suspeitas.
Os pesquisadores escreveram que muitos outros sensores de luz, incluindo aqueles em smartphones, poderiam teoricamente ser usados como microfones. Recentemente, vários artigos científicos descobriram casos de uso para sensores não acústicos em smartphones que potencialmente permitem gravar conversas sem permissão. Estamos falando sobre o uso de acelerômetro, giroscópio e motor de vibração ( 1 , 2 , 3 , 4 ).
Mas usar um smartphone para escutas telefônicas é trivial e previsível. Eletrodomésticos com lidars, que ninguém pode suspeitar de estar espionando conversas, é um assunto completamente diferente. Como um aspirador de pó. Em geral, a proliferação de dispositivos inteligentes em nossas casas abre muitas oportunidades para ataques acústicos desse tipo com a escuta de conversas privadas. A principal coisa a lembrar é que um lidar é na verdade um microfone a laser pronto para uso. Artigo de
pesquisa lançado em 16 de novembro de 2020 na Conferência Virtual SenSys '20 no Japão.
