Inteligência Artificial e Aprendizado de Máquina em Webcasting: Tendências Recentes





Olá, Habr. Meu nome é Alexander Alpern, sou o CEO e fundador do Grupo Webinar. Hoje, gostaria de discutir questões como o uso de tecnologias de aprendizado de máquina e inteligência artificial na transmissão pela Internet, o processamento de conteúdo de mídia e sua entrega ao usuário.



Para que serve? Aumentar as visualizações, fidelizar o telespectador, o conteúdo informativo dos programas, bem como reduzir a carga da rede são apenas algumas das vantagens proporcionadas pelas tecnologias modernas.



Pandemia + tráfego = problemas



De acordo com a TeleGeography, que analisou as taxas de câmbio do tráfego global da Internet, o consumo de tráfego disparou em 2020. Assim, a média global passou de cerca de 120 para 170 Tbps, em seu pico - 300 Tbps.



imagem



A princípio, o crescimento já foi bastante grande, mas no ano passado todos os recordes foram quebrados - o crescimento foi de 47%. O caixão é aberto de forma simples - centenas de milhões de pessoas foram trancadas em casa, então a atividade de usar mensageiros da Internet, plataformas de aprendizagem online, serviços de jogos em nuvem e, é claro, plataformas de vídeo como o YouTube aumentou dramaticamente.



Os pontos de troca de tráfego mais carregados estavam na Alemanha, Frankfurt (DE-CIX FRA) e na Holanda, Amsterdã (AMS-IX). Em março, o centro ponto a ponto DE-CIX atingiu um pico de tráfego histórico de 9,1 Tbps .



Na Rússia, uma situação semelhante foi observada - em março-abril de 2020, os cinemas online registraram um aumento de 2 a 4 vezes no tráfego. A razão ainda é a mesma - por causa da pandemia e do auto-isolamento, as pessoas ficavam isoladas em seus próprios apartamentos e casas, então a Internet se tornou uma das formas de se entreter. O tráfego móvel no mesmo período cresceu de 10 a 30%, principalmente devido a chats de vídeo e mensagens instantâneas.



Chegou a um ponto em que a Netflix e o YouTube baixaramqualidade de vídeo para usuários europeus. O YouTube começou a mostrar vídeos em definição padrão em vez de HD, e a Netflix diminuiu a resolução em 25%.



O que fazer?



Idealmente, aumente a capacidade e o rendimento da infraestrutura de rede, tanto local quanto globalmente. Tudo é complicado aqui, uma vez que os provedores de Internet, comunicação celular e outros serviços de telecomunicações nem sempre podem investir recursos significativos.



A segunda opção é otimizar seu conteúdo. Isso se refere não tanto à redução da qualidade do vídeo ou áudio, como a outros métodos. Iremos considerá-los a seguir.



Otimizando a compressão de diferentes vídeos



Netflix é o maior provedor de conteúdo de mídia. Há vários anos, ela introduziu a prática de selecionar diferentes perfis de compressão para diferentes vídeos, levando em consideração suas características.



A Netflix possui vasta experiência em vídeo, incluindo compactação de conteúdo. Usando seus próprios desenvolvimentos, a empresa treinou um sistema semelhante ao neural que avalia os atributos de vídeo de baixo nível, determinando sua classe e, em seguida, encontra os parâmetros ideais para cada classe.



Parâmetros como a dinâmica da imagem, o grau de clareza e a complexidade geral do gráfico são avaliados. Em questão de minutos, o sistema avalia a dinâmica do enredo, o grau de clareza e a saturação geral da "imagem". Com base nos dados de análise, o sistema toma uma decisão sobre a otimização do vídeo. Portanto, se o programa ou transmissão não for muito dinâmico, a qualidade do vídeo pode ser reduzida. Se a imagem mudar rapidamente, as cores estiverem saturadas e o gráfico for complexo, a qualidade diminui ligeiramente ou permanece no mesmo nível.



imagem



Assim, a otimização da transmissão do vídeo é alcançada, a carga na infraestrutura de rede é reduzida. O trabalho com vídeo é realizado de forma que o resultado final seja invisível para os consumidores de conteúdo. Em outras palavras, o público simplesmente não percebe nada. Para compressão, a empresa usaVários codecs e modelos de compressão, incluindo 4K VMAF , para que a rede não fique congestionada mesmo durante a transmissão de vídeo 4K.



Selecionando a fonte de vídeo com qualidade ideal



Uma alta resolução e, portanto, uma grande quantidade de dados transmitidos, não significa um vídeo de boa qualidade entregue ao destinatário. Um exemplo disso é o gif postado acima.



A escolha de uma fonte de vídeo de boa qualidade é um problema urgente para os distribuidores de pacotes de canais de TV. Ssimwave surgiu com uma solução de aprendizado de máquina que seleciona automaticamente a fonte de conteúdo com a mais alta qualidade.



imagem



Um exemplo é a transmissão do canal CNN. Em uma fonte, os parâmetros de vídeo são 1080 @ 29,97i, MPEG-2, 40 Mbps, e na outra - com 720p60, H264, 22 Mbps. Como mencionado acima, alta resolução não significa de forma alguma uma boa qualidade de vídeo para o destinatário. A qualidade é influenciada por um grande número de fatores, incluindo compactação e formatos de cores, faixa dinâmica, procedimentos de transcodificação, tecnologias de entrega e versões de jogadores assinantes.



É simplesmente impossível avaliar tudo isso manualmente. Mas a rede neural é capaz de lidar com a tarefa sem problemas. A Ssimwave conseguiu desenvolver uma solução que permite selecionar a fonte de transmissão com a maior qualidade e volume mínimo de dados em questão de segundos.



Não apenas pelo trânsito



O aprendizado de máquina, a inteligência artificial e as redes neurais ajudam não apenas a otimizar o volume do conteúdo transmitido. Existem muitas outras áreas onde a tecnologia é simplesmente indispensável agora.



Navegação no catálogo de vídeos



Muitas empresas de conteúdo de mídia têm catálogos - com jogos, vídeos, filmes e programas. De acordo com a Netflix, ao escolher um filme para assistir, os assinantes são mais propensos a prestar atenção aos ícones de cartazes de filmes. Segundo o diretor criativo da empresa, Nick Nelson, em 82% dos casos, a escolha do filme é determinada pelo ícone / pôster apresentado.



Conseqüentemente, quanto mais bem-sucedida for a imagem, maior será a probabilidade de o visualizador escolher esse conteúdo específico. Tudo isso é relevante não só para o vídeo, mas também para outros bens digitais.



imagem



Para confirmar ou refutar a opinião de Nelson, a Accedo fez parceria com a AWS e a British Television Corporation ITV para executar um teste A / B para identificar os fatores que influenciam as escolhas do usuário. A conclusão não é muito surpreendente: os usuários escolhem um filme, guiados por suas emoções ao ver as imagens. Demora menos de 2 segundos para avaliar a captura de tela.



Assim, as tecnologias de aprendizado de máquina e IA podem ser usadas para selecionar capturas de tela com conversões ideais. Para filmes, essas capturas de tela geralmente incluem a imagem de um herói cujo rosto expressa emoções e, na maioria das vezes, são escolhidas fotos com antagonistas. Capturas de tela com grupos de heróis são de menos interesse.



Além disso, a inteligência artificial ajudou a formar diferentes coleções para diferentes categorias / segmentos de espectadores - tanto social quanto geograficamente. Agora, não é surpreendente que os catálogos tenham uma aparência diferente em diferentes países ou regiões do mesmo país. Mas apenas 10-20 anos atrás, a situação era diferente.



Aumentando o conteúdo de informação do vídeo



imagem



Trata-se de criar e estruturar metadados multimídia para diferentes vídeos - por exemplo, vídeos de esportes. IBM Watson, um supercomputador IBM com inteligência artificial integrada, se destacou em particular aqui. Ele pode criar descrições visuais em tempo real, transcrever áudio, adicionar notas editoriais.



Essas habilidades são usadas durante o trabalho com eventos esportivos populares - por exemplo, a Copa do Mundo, o Aberto dos Estados Unidos, o Super Bowl e outros.



A IA processa o fluxo de transmissão, marcando os pontos-chave nele, adicionando notas e comentários. Além disso, o fluxo já processado é enviado aos editores do programa de transmissão ou é transmitido diretamente aos telespectadores.



Redução da rotatividade de clientes



O aprendizado de máquina e a inteligência artificial são ótimos para evitar a rotatividade do cliente. Isso acontece se o interesse dos usuários pelo conteúdo diminuir. De acordo com nossos dados, conteúdo desinteressante ou excessivamente complexo pode causar rotatividade de um quarto dos usuários. Isso é muito e não deveria ser permitido.



Para reduzir a taxa de rotatividade, é importante:



  • entenda o que pode causar rotatividade
  • automatizar análises
  • usar ferramentas de previsão


O Analytics usa dados como informações do usuário, visibilidade do conteúdo, avaliações do usuário, atividade de interação do usuário com suporte (aqui podemos falar não apenas sobre vídeos, mas também sobre cursos online, como no nosso caso) e outros dados. Por exemplo, na plataforma We.Study, o próprio sistema regularmente "monitora" o curso, fornecendo recomendações específicas para melhorá-lo, permitindo acompanhar o comportamento dos participantes e prever a rotatividade.



Com base nos resultados da análise, certas ações podem ser tomadas - mudar o conteúdo, o programa de treinamento, se forem cursos - para melhorar a interação com os usuários.



Personalização de conteúdo em destaque



imagem



Todos os usuários do YouTube sabem o que é o conteúdo recomendado. Quanto mais bem-sucedida for a recomendação, maior será a chance de o usuário assistir ao vídeo ou visualizar outro tipo de conteúdo.



Caso ilustrativo - o projeto IBM Watson e a plataforma Iris.tv. Os parceiros conseguiram uma personalização de conteúdo ideal. Para fazer isso, os vídeos são primeiro passados ​​por um supercomputador que coleta metadados. Em seguida, a plataforma analisa esses dados para criar novas categorias e títulos da biblioteca de filmes.



Além disso, com o auxílio do aprendizado de máquina, a plataforma conseguiu treinar para analisar os interesses de usuários específicos para garantir a oferta de um vídeo interessante para uma pessoa após assistir ao próximo programa.



Qual é o próximo?



Existem muitos casos de uso de IA e aprendizado de máquina, então apenas os pontos mais reveladores são indicados no artigo. A conclusão geral é que essas tecnologias estão começando a ser utilizadas de forma sistemática. Anteriormente, eles eram usados ​​apenas como um teste. Agora, centenas e milhares de empresas de conteúdo estão usando o aprendizado de máquina para otimizar o conteúdo, depurar processos de negócios, atrair novos usuários e reter os antigos.



Nos próximos 3-5 anos, a esmagadora maioria dos provedores de conteúdo de mídia mudará para o uso de tecnologias modernas, devido ao fato de que permitem resolver os problemas dos clientes individuais e da empresa como um todo.



All Articles