Esteganografia e ML. Ou o que obtivemos das redes adversárias geradoras (GANs)?





A esteganografia é a ciência de transmitir informações secretamente, ocultando o próprio fato da transmissão. E a própria palavra esteganografia vem do grego. στεγανός “escondido” + γράφω “Eu escrevo” e significa literalmente “escrita secreta”. Nesta área, como em muitas outras, especialmente nos últimos anos, os métodos de aprendizado de máquina se generalizaram, em particular, as redes adversárias geradoras (GAN). 



Próximo no menu:



  1. Esteganografia tradicional para manequins 
  2. O que é GAN e com o que são consumidos?
  3. Então, como os GANs são aplicados?
  4. O futuro do GAN: o que nos espera na esteganografia?


Esteganografia tradicional para manequins



Desde os tempos antigos, a esteganografia clássica tem sido usada pelas pessoas como um meio de comunicação secreta: tinta invisível, poesia tibetana e muito mais. A esteganografia moderna usa comunicações eletrônicas e tecnologia digital para ocultar uma mensagem. Todo stegosystem moderno consiste em dois componentes principais: algoritmos de injeção e extração. Assim, o algoritmo de injeção toma como entrada uma mensagem secreta, uma chave secreta e um container que será utilizado para transferir a mensagem. O resultado de seu trabalho é uma mensagem stego.



Geralmente, uma mensagem pode ser qualquer coisa: texto, imagem, dados de áudio e assim por diante. Para cada tipo de dado, são desenvolvidas suas próprias abordagens de ocultação. Assim, na esteganografia do texto, são utilizadas suposições na localização e no número de caracteres no texto, que não são levados em consideração ao ler uma pessoa. Por exemplo, uma das técnicas é a formatação. Sua essência consiste em uma divisão de linha aumentando os espaços entre as palavras, quando um espaço corresponde, por exemplo, ao bit 0, e dois espaços ao bit 1. Ou, na esteganografia de redes, informações ocultas são transmitidas através de redes de computadores usando as peculiaridades dos protocolos de transferência de dados. As técnicas típicas de esteganografia de rede envolvem a alteração das propriedades de um dos protocolos de rede. No futuro, consideraremos apenas a esteganografia em imagens,respectivamente, chamaremos as mensagens stego transmitidas de imagens stego.



Mais sobre stegosystems
  ,   1 .   ,   ,   . : , / , , .







– , . — , . .



,   .



. , . , «» ,   . ,   . .



  . , , ,  .   ,   , .



    .   , .   , .



Na esteganografia de imagens, três diferentes arquiteturas fundamentais são distinguidas de acordo com diferentes métodos de obtenção de imagens stego.



1) Modificação de imagem



Existem basicamente dois tipos de abordagens de modificação para a esteganografia. O primeiro tipo  trata do suporte ao modelo estatístico, e o  segundo   implementa a incorporação como resultado da minimização de uma função de distorção particular.



2) Seleção de imagem



A seleção de imagens consiste em escolher o contêiner certo e envolve duas abordagens principais. O primeiro é selecionar uma imagem candidata para modificação. Neste método, você precisa encontrar um contêiner adequado para modificação no banco de dados. Embora esses métodos sejam chamados de seleção de imagem, eles são essencialmente uma modificação com alguma etapa adicional. Porém, no futuro, não consideraremos esse método como independente. Outra abordagem é selecionar um contêiner como uma imagem stego sem modificação. Nesta abordagem, é importante estabelecer regras para a correspondência entre a mensagem e a imagem stego.



3) Síntese de imagem



A terceira estratégia é baseada na síntese de imagens. E aqui a nossa Alice (esteganógrafa) tenta criar uma nova imagem que contenha as informações necessárias. Uma vez que a síntese de uma imagem realista é um problema complexo, o método tradicional resolve os problemas da esteganografia criando imagens “não naturais”, como  texturas  ou  imagens de impressões digitais .



O que é GAN e com o que são consumidos?



Rede adversária gerativa (GAN para abreviar) é um algoritmo de aprendizado de máquina não supervisionado construído em uma combinação de duas redes neurais. Em 2014, foi introduzido pela primeira  vez pelo  Google. Em um sistema GAN, uma das redes gera padrões e a outra tenta distinguir padrões “genuínos” de incorretos. 



Uma rede generativa, usando um conjunto de variáveis ​​de espaço de latência, sempre tenta moldar uma nova amostra misturando várias amostras originais. A Rede Discriminativa D é treinada para distinguir entre amostras genuínas e falsas. Ao mesmo tempo, seus resultados são enviados para a entrada da rede generativa G para que ela possa selecionar o melhor conjunto de parâmetros latentes, e a rede discriminativa não seja mais capaz de distinguir amostras genuínas de falsas. Como você pode ver, o objetivo da rede G é aumentar a porcentagem de erros na rede D, e o objetivo da rede D é, ao contrário, melhorar a precisão do reconhecimento.



Os GANs encontraram excelentes aplicações em visão computacional e  processamento de linguagem natural  (na geração de imagens e textos). Mas, ao mesmo tempo, a esteganografia não foi poupada.



Então, como os GANs são aplicados?



Os recursos de GAN podem ser vistos de diferentes ângulos: jogo competitivo, gerador ou função de exibição. Eles são consistentes com a classificação das principais estratégias em esteganografia, ou seja, modificação, síntese e seleção.



1) Modificação de imagem



A modificação de imagem baseada em GAN se concentra no jogo adversário entre o esteganógrafo e o esteganizador. Este método usa um gerador treinado para construir vários elementos “chave”. Existem três estratégias principais.



Criar imagem stego



Denis Volkhonsky, Ivan Nazarov e Evgeny Burnaev  propuseram  projetar um gerador para a criação de uma imagem stego. Esta abordagem permite uma mensagem stego mais à prova de esteganálises que pode transmitir mensagens usando algoritmos de esteganografia padrão. Em essência, eles apresentaram uma rede adversarial gerativa que consiste em três redes: gerador G, discriminador D e classificador S de esteganálise.



O classificador S determina se a imagem realista oculta informações classificadas.







Criar matriz de probabilidade de modificação



Um exemplo é  ASDL-GAN  para aprender automaticamente a função de distorção. Este esquema opera na tradição da esteganografia moderna e minimiza a função de distorção aditiva. A própria matriz de probabilidade de mudança é obtida minimizando a expectativa matemática da função de distorção. O gerador G em seu esquema é treinado para reconhecer as probabilidades de alteração de P da imagem de entrada.



Jogo adversário



A terceira estratégia envolve o uso direto de um jogo competitivo entre três de seus participantes (Alice, Bob, Wendy) para estudar o algoritmo de modificação. Um método  ADV-EMB que tenta alterar a imagem para ocultar a mensagem enganando o classificador de esteganálise.



Nesta abordagem, os pixels da "imagem candidata" são divididos em dois grupos, um grupo de pixels é usado para modificação e o segundo grupo de pixels é usado para criar distúrbios a fim de resistir ao analisador.



2) Seleção de imagem



A esteganografia de seleção de GAN visa estabelecer a relação entre a mensagem e a imagem de stego. No entanto, não existem muitas fontes sobre esse assunto, embora alguns trabalhos façam tentativas separadas  nessa direção.



Uma ideia é que o remetente defina o tipo de exibição usando um gerador entre a mensagem e a imagem selecionada. Para o destinatário, a mensagem é gerada diretamente a partir da imagem selecionada. A essência desse método é estabelecer a relação entre a imagem e a mensagem secreta para que o contêiner se transforme naturalmente em uma imagem stego. A análise estatística esteganográfica não funciona porque a operação de modificação em si não é realizada diretamente.



3) Síntese de imagem



A imagem geralmente é criada com um gerador overtrained e várias estratégias são sugeridas aqui.



Aprendendo com um professor



Aqui, os  autores usam uma rede neural para estudar um algoritmo de aprendizado adversarial no qual três jogadores (Alice, Bob e Eva) representam redes neurais.







Alice usa o contêiner e a mensagem secreta para criar uma imagem stego, enquanto Bob tenta recuperar a mensagem. Eva extrai a probabilidade P da mensagem secreta da imagem. Ao mesmo tempo, Alice tenta alcançar um equilíbrio em que a probabilidade de Eva receber uma imagem com uma mensagem secreta é de 1/2. (isto é, Eva já está apenas tentando adivinhar o resultado arbitrariamente). Esse algoritmo introduz três funções de perda, pelas quais Alice, Bob e Eva são responsáveis, respectivamente.



Aprendendo sem professor



Esteganografia sem modificação



Neste método,  as mensagens secretas são convertidas em um vetor de ruído, que é enviado ao gerador como entrada para criar uma imagem stego.



Primeiro, o gerador G é treinado com algum conjunto de dados. Isso produz um gerador que pode criar imagens realistas. Durante a segunda fase, o extrator E é treinado usando a função de perda de extração de mensagem. O objetivo desta etapa é recuperar a mensagem da imagem stego gerada.



Na última etapa, o emissor estabelece a relação entre o ruído e a mensagem, e a mensagem secreta e os vetores de ruído são segmentados para criar um mapeamento. O receptor pode usar o extrator para reconstruir o vetor de ruído e, em seguida, a mensagem secreta é obtida usando o mapeamento resultante.



Esteganografia WGAN-GP



Nesta abordagem, o  extrator de mensagem e o gerador de imagem stego são treinados simultaneamente. WGAN-GP é adaptado para gerar imagens stego com qualidade superior. De acordo com o método proposto, o Gerador G aprende a entrada do minimax do jogo (uma regra de decisão para minimizar possíveis perdas daquelas que não podem ser evitadas pelo tomador de decisão no pior cenário) para competir com o Discriminador (D) e o Extrator (E )







Formação de meio-professor



Esteganografia ACGAN



Para realizar o treinamento parcial, uma rede auxiliar específica para tarefas deve ser adicionada ao GAN original.  Este método  estabelece a relação entre os rótulos de classe de imagem gerados e as informações secretas, com os rótulos de classe e ruído injetados diretamente no gerador para criar a imagem stego. Na fase de extração da mensagem, a imagem stego é fornecida ao discriminador para obter fragmentos de informações secretas.



Esteganografia de amostragem limitada



 Nesse caso, a  operação de incorporação da mensagem torna-se um problema de seleção de imagem. O artigo considera a criação de uma imagem stego como um problema de minimizar a distância entre a imagem original e a imagem stego.



Esteganografia usando o ciclo de Gana



Alguns pesquisadores consideram a síntese da imagem stego como um problema de tradução "imagem a imagem". Um modelo muito famoso para tradução de imagens é o  CycleGAN . Este modelo aprende a converter uma imagem da classe X para a classe Y, minimizando a função de perda adversária e a função de perda de consistência do loop. O artigo  argumenta que o CycleGAN pode ser visto como um processo de codificação para ocultar informações.



O futuro do GAN: o que nos espera na esteganografia?



Os métodos baseados em GAN são extremamente interessantes e promissores para abreviação. Essa abordagem atualmente tem três direções principais de desenvolvimento. O futuro do GAN: o que nos espera na esteganografia?



Capacidade



Em métodos como GAN-CSY, a instabilidade dos pixels gerados leva a uma baixa precisão de recuperação de mensagens. Em outros métodos, a mensagem não existe em sua forma usual, mas é um atributo de categoria ou um vetor de ruído. A desvantagem é que as mensagens nos métodos existentes não incluem muitas informações. Assim, uma das áreas que requerem atenção é melhorar a estabilidade e aumentar o volume de dados transmitidos.



Avaliação da qualidade da imagem



É difícil quantificar a qualidade das imagens sintéticas. No campo da síntese de imagens, os critérios de avaliação das imagens geradas não são suficientemente confiáveis.



Alguns métodos que usam avaliação manual são subjetivos e carecem de critérios objetivos para avaliação. Os critérios de avaliação atuais são principalmente IS (Inseption Score) e FID (Frechet Inception Distence). Essas classificações levam em consideração apenas a autenticidade e a qualidade da imagem. Portanto, encontrar estimativas adequadas ainda é uma linha de pesquisa importante e não desenvolvida.



Steganalysis



A tarefa de esteganálise é dividida em duas etapas. A primeira etapa é o exame das imagens, que mostrará se a imagem é falsa. A segunda etapa é a esteganização da imagem, que determina se a imagem gerada contém uma mensagem secreta. Atualmente, as imagens geradas pelo GAN são indistinguíveis ao

olho humano. Na esteganografia tradicional, existem muitos métodos para examinar imagens a fim de distinguir entre imagens naturais e geradas. Mas no futuro, com o desenvolvimento das abordagens descritas, será difícil determinar se a imagem é gerada ou não. Consequentemente, aumentar a eficiência da esteganálise deve ser reconhecido como a direção mais promissora.



O material foi elaborado com base  neste artigo.



All Articles