
Captura de tela do CU-SeeMe - um dos primeiros sistemas de videoconferência da Internet que apareceu em 1992. No ambiente de negócios e na indústria de defesa, exemplos do uso de tecnologias de videoconferência surgiram na década de 1980.
Apesar de quatro décadas de evolução da tecnologia, a videoconferência de baixo nível é essencialmente mágica que não funciona na metade do tempo. Neste artigo, explicarei por que isso está acontecendo.
Em um mundo assustado com a propagação de uma doença fatal, mais cedo ou mais tarde os empregadores inevitavelmente pedirão aos empregados que fiquem em casa ... e trabalhem a partir daí. Essa vantagem, na maioria das vezes, não era aproveitada pelos trabalhadores no passado, mas tornou-se possível graças à Internet. Mas a Internet está longe de ser ideal para esse tipo de aplicação, e isso prova isso quase todas as vezes que você inicia uma videoconferência. Pequenos atrasos fazem com que as pessoas interrompam umas às outras. Perde-se tempo porque os interlocutores têm que repetir o que foi dito. E sempre haverá um colega que decide trabalhar em um café com todo o barulho ao seu redor. Pessoalmente, trabalho remotamente há quase quatro anos, por isso sempre tive a oportunidade de fazer chamadas em conferência; Percebi que havia problemas com eles - técnicos, culturais e práticos.E muitas das dificuldades que essa tecnologia apresenta se resumem aos muitos pequenos recursos da Internet. Hoje vamos falar sobre a complexidade do sistema de videoconferência.
“Muitas videoconferências são um terrível desperdício de dinheiro; eles não oferecem nenhuma vantagem sobre a conferência de voz porque os usuários não sabem como aproveitar o potencial do componente visual. " - Esta é uma citação de um colunista de 1992 da Network World por James Kobelous, que observou que muitas empresas têm investido pesadamente em tecnologia de videoconferência internamas não conseguiu torná-los mais eficazes do que simples telefonemas. Na época, eles literalmente não tinham vantagens para a tecnologia moderna. Aqui está a aparência de um sistema de videoconferência padrão naquela época, de acordo com o artigo: “Normalmente, a videoconferência pode usar transmissão de áudio remota paralela, microfones internos fixos e móveis, várias câmeras de parede giratória, suportes para gráficos estáticos e em movimento (com a câmera na mão alto-falante enquanto desenha), projetores de slides de 35 mm, videocassetes, aparelhos de fax, lousas eletrônicas interativas e computadores pessoais.
A tecnologia de videoconferência exigiu muitas inovações para ganhar popularidade generalizada
Sim, a tecnologia de chamadas em conferência é um pouco frustrante mesmo em 2020, mas vale a pena dizer que percorremos um longo caminho ao longo dos anos. Embora a tecnologia de videoconferência permaneça irritantemente falha, ela ainda reflete nossas quatro décadas de esforços para solucionar problemas.
Desde sua introdução nos locais de trabalho na década de 1980, o equipamento de videoconferência já percorreu um longo caminho. Para muitas empresas, adquiri-lo custava cinco zeros, e o custo por hora de cada ligação era muito mais alto (até US $ 1.000 / hora) em comparação com os salários do dia.
(Talvez isso se reflete no fato de que em muitos do primeiro sistema de transmissão de vídeo aplica-se a "um transmissor, vários receptores", em que foi utilizada a mesma tecnologia da televisão por cabo ou satélite. Eles não eram interativos, mas funciona.)
Com por outro lado, em apenas alguns anos, as tecnologias de videoconferência melhoraram significativamente e seus preços diminuíram dez vezes. Em 1982, quando o Compression Labs lançou seu primeiro sistema de videoconferência, ele custava US $ 250.000, mas os preços estavam caindo rapidamente - em 1990 era possível comprar um sistema pronto por apenas 30.000 e em 1993 - menos de 8.000 .
Mas havia muitos trade-offs para implementar a videoconferência. As linhas T1 podem transmitiraproximadamente 1,5 megabits de streaming de dados por segundo. Essa largura de banda seria quase o suficiente para assistir a um único vídeo do YouTube a 480p, e na década de 1980 custava milhares de dólares para comprar. (Por causa de sua estrutura multilinha, que deveria ser o equivalente a 24 linhas telefônicas separadas, as linhas T1 continuam muito caras hoje, embora a fibra tenha ultrapassado elas em velocidade.)

Um desenho de um pedido de patente de 1987 emitido pelo Compression Labs. Ele descreve uma das primeiras tecnologias de videoconferência bidirecional. ( Patentes do Google )
Com o tempo, isso levou a variantes de sistemas usando redes menos potentes para videoconferência, como o Compression Labs Rembrandt 56, que usava linhas ISDN, que na época atingiam uma velocidade máxima de 56 kilobits / s. Esses sistemas de US $ 68.000, que alavancaram as inovações de compressão de vídeo da Compression Labs, permitiram aos consumidores reduzir os custos em cerca de US $ 50 / hora . (Observação: nas décadas de 1980 e 1990, os teletrabalhadores usavam ISDN com mais frequência.)
Como você pode imaginar, a videoconferência floresceu principalmente em escritórios do governo no início, e muitas das primeiras pesquisas sobre a aplicabilidade de tais tecnologias eram geralmente conduzidas pelos militares.
"A compressão de vídeo envolve o inevitável trade-off entre resolução de imagem e capacidade de processamento de movimento", diz uma dissertação de 1990 de um aluno da Escola de Treinamento Avançado da Marinha dos EUA, que descreve as diretrizes de videoconferência para o ROCA. “A qualidade da imagem depende da largura de banda. À medida que a largura de banda diminui, mais codificação é necessária, resultando em imagens degradadas. "
Também é importante notar que a videoconferência se tornou um elemento importante no avanço das tecnologias de compressão de imagem ao longo da década de 1980. Na verdade, o Compression Labs, responsável por muitas dessas inovações, tornou-se uma fonte de controvérsia nos anos 2000 - foi adquirido por um novo proprietário que tentou explorar uma patente de um algoritmo de compressão usado no formato JPEG para processar grandes corporações . O troll de patentes resolveu uma disputa com muitas das principais empresas de tecnologia em 2006, depois que um tribunal concluiu que a patente era apenas para aplicativos de vídeo.
A tecnologia de videoconferência de nível de consumidor (ou seja, webcams) surgiu em 1994 com o lançamento do Connectix Quickcam, um dispositivo com o qual estou intimamente familiarizado.... Este dispositivo de $ 100 não teve um bom desempenho em PCs mais antigos devido à largura de banda limitada fornecida pelas portas paralelas e outros dispositivos mais antigos; no entanto, levou a outras inovações que continuaram por várias décadas. (As portas USB e Firewire - esta última usada na câmera iSight que a Apple vendeu no início dos anos 2000 - fornecia largura de banda suficiente para gravar vídeo ou mesmo transmiti-lo pela Internet.)
Inovações importantes também estavam surgindo no setor corporativo. Em 1992, a Polycom lançou seu primeiro telefone de conferência- um dispositivo que permitia que várias pessoas conversassem em um escritório; nesse formato, as conferências continuaram a ser realizadas nas três décadas seguintes. Poucos anos depois, a WebEx, que mais tarde foi adquirida pela Cisco , desenvolveu uma das primeiras tecnologias de videoconferência para a Internet, que ainda usamos hoje.
As tecnologias de software de vídeo foram bastante aprimoradas no início dos anos 2000 pelo Skype, cuja capacidade de fornecer vídeo de alta qualidade e conversas de voz em uma rede ponto a ponto tornou-se uma grande inovação na tecnologia de conferência. No entanto, depois de ser adquirido pela Microsoft, o Skype mudou de um esquema ponto a ponto para um sistema de supernó.
Em meados dos anos 2000, as webcams tornaram-se componentes padrão de laptops e desktops. A ideia em si foi proposta em 2001 no Hewlett Packard Concept PC , e os primeiros computadores com webcams integradas foram o iMac G5 e a primeira geração do MacBook Pro com processadores Intel.
Portanto, temos todo esse conjunto de gadgets, que nos permitem comunicar uns com os outros quase sem o menor problema. Mas por que estamos insatisfeitos com isso? Há várias razões para isso.
1,5 / — , Skype . ( T1.) VoIP- Microsoft 100 /, . , .

- Polycom -.
-
Para responder à pergunta de por que a videoconferência de escritório continua a enfrentar tantos desafios, apesar de todas as inovações, precisamos dar um passo para trás e considerar que estamos nos esforçando para realizar muitas tarefas em bases muito precárias.
Temos todas essas inovações, mas elas competem com muito mais recursos.
Se você está sentado em casa na frente de um laptop conectado a um canal de fibra óptica de 100 megabits, existe a possibilidade de que você esteja transmitindo um videogame para a próxima sala enquanto baixa 15 torrents, mas ainda assim não terá nenhum problema específico.
Mas se você estiver em um escritório com mais cem pessoas e esse escritório tiver várias videoconferências todos os dias, isso terá uma carga muito alta na Internet do escritório.
Aqui está um exemplo de uma situação que pode surgir hoje: digamos que haja uma assembleia geral à tarde, mas você tem um prazo, então, em vez de caminhar quinze metros até a sala de conferências, você decide ingressar na reunião online. Digamos que dez de seus colegas decidiram fazer o mesmo. Mesmo que vocês estejam todos em uma grande sala, nenhuma dessas conexões é feita localmente. Você está se conectando a uma reunião em uma rede local via Internet, o que significa que essa rede local não só precisa fazer upload de um monte de dados adicionais para a Internet, mas também baixá-los de volta.
Se você, por exemplo, trabalha no Google, onde uma infraestrutura de rede em grande escala é construída, isso pode não ser um problema sério. Mas em empresas menores, uma rede corporativa pode ser extremamente cara, custando centenas ou milhares de dólares por mês, sem contar os custos de instalação . Como resultado, em algum estágio você pode atingir o limite máximo de suas capacidades.
De repente, a videoconferência, que deveria atender usuários remotos, começa a desacelerar e gaguejar. (Este pode ser um dos motivos pelos quais o pessoal de TI está recomendando que você não carregue o Dropbox em seu PC de trabalho.)
Mas mesmo pequenos momentos de atraso podem criar problemas sérios. Você já teve suas palavras sobrepostas à fala de outra pessoa? Isso acontece quando um pequeno atraso se insinua no sinal. E como o vídeo e o som são frequentemente transmitidos de maneiras diferentes (às vezes até por dispositivos diferentes), esses atrasos podem causar problemas de sincronização - por exemplo, situações em que o som se move mais rápido que o interlocutor. A empresa de videoconferência 8x8 afirma que 300 milissegundos é a latência aceitável para uma chamada de vídeo, mas essa latência é suficiente para duas pessoas começarem a falar ao mesmo tempo. (Talvez você precise de um sistema como os walkie-talkies ?)

Muitas webcams modernas simplesmente não são ótimas, especialmente se forem integradas à tela de um laptop.
Por que as chamadas em conferência não funcionam bem fora do escritório
Mas mesmo se você estiver em casa ou na estrada, provavelmente, ainda haverá problemas que o impedem de fornecer som e vídeo de alta qualidade; e nem sempre estão relacionados à largura do canal da Internet.
Alguns dos problemas serão relacionados ao ruído, alguns relacionados à qualidade da câmera e alguns relacionados às configurações de som.
Quanto à qualidade das câmeras, um fenômeno interessante surgiu nos últimos anos: na verdade, estamos interessados em melhorar a qualidade das câmeras, mas ao mesmo tempo nos esforçamos para reduzir o tamanho das lentes, e isso não deixa muito espaço para melhorias. Na verdade, as câmeras não têm para onde ir - você precisa miniaturizar a tecnologia ou tentar implementar elementos que se revelem controversos em vez de úteis. O exemplo mais notório foi o Huawei Matebook Pro - os designers decidiram colocar a câmera sob a tecla flip-up, e este acabou sendo o aspecto mais controverso de um bom laptop.
Tudo isso está acontecendo em um momento em que a importância da clareza da câmera está aumentando constantemente, o que significa que as webcams de laptop são significativamente piores do que suas contrapartes móveis - por exemplo, o MacBook Pro de 16 polegadas usa uma webcam de 720p . E isso é hoje, quando muitos smartphones modernos são capazes de gravar vídeo de câmeras frontais em resolução 4K. Mesmo que o streaming não lide com resolução total, há uma chance de que níveis de compressão mais baixos melhorem a qualidade.
Falando em níveis de compressão, a nova moda de se livrar dos conectores de fone de ouvido criou um problema muito sério para chamadas em conferência. Para simplificar, a maioria das versões do Bluetooth tradicionalmente tem uma qualidade de som bastante medíocre ao usar um microfone.Isso se deve a um problema particular com a especificação Bluetooth que tem afetado a tecnologia ao longo da maior parte de sua história: é impossível obter som de microfone de alta qualidade a partir da especificação devido à falta de largura de banda; a situação é agravada se o dispositivo estiver conectado a uma rede WiFi de 2,4 GHz, que tem a mesma frequência do Bluetooth.
Na verdade, ao usar um fone de ouvido Bluetooth, a qualidade do som do microfone cai significativamente. Embora Bluetooth 5.0poderia potencialmente fornecer largura de banda para melhorar o som do microfone do headset, esse padrão é principalmente compatível apenas com os PCs e smartphones mais modernos. O fato é que, se você deseja se conectar a uma videoconferência, basta conectar seus fones de ouvido com fio, mesmo via USB. Descobri que mesmo fones de ouvido com cancelamento de ruído sem fio sofisticados, como o Sennheiser PXC 550, são problemáticos para uso como microfone em videoconferência. (Hoje eu uso o muito mais badalado Sony WH-1000XM3, mas apesar de todo o esforço que fiz para desenvolver seu microfone, quando preciso fazer uma chamada, ligo o cabo do fone de ouvido com o microfone embutido.)
Também é importante notar que chamadas telefônicas comuns para um número podem ter um efeito semelhante na qualidade da chamada, porque as linhas de voz geralmente são muito compactadas . (É por esse motivo que a música em espera soa especialmente horrível .) Se você puder escolher entre discar e ligar por meio de um aplicativo, escolha um aplicativo.
Quando se trata de som, o ambiente também deve ser considerado. Salas com muitos ecos não são particularmente adequadas para chamadas em conferência. Embora trabalhar em uma cafeteria possa estimular sua criatividade, você não conseguirá encontrar um espaço tranquilo para bater um papo (ou uma conexão de Internet rápida o suficiente).
Mas no que diz respeito ao ruído de fundo, a boa notícia é que existe uma tecnologia que permite que o microfone lide com os sons de liquidificadores de frappuccino. O aplicativo Krisp para macOS, Windows e iOS usa inteligência artificial para eliminar muitos ruídos de fundo. Embora não seja gratuito, pode melhorar a qualidade do som. Para usuários do Linux, há também uma opção bastante eficaz - no aplicativo pulseaudio, você pode habilitar uma opção que remove o ruído de fundo das gravações em tempo real. (Não é de alta qualidade como o Krisp, mas é grátis!)
Uma inovação semelhante na frente do vídeo - desfoque de fundo - apareceu nas principais ferramentas de chat de vídeo como Microsoft, Teams e Skype .
Em breve poderemos participar de videoconferências da Starbucks com a mesma qualidade de casa.
Mas mesmo que você tenha escolhido os fones de ouvido certos, se livrado de todo o ruído ambiente, encontrado a sala perfeita e acertada, você não conseguirá se livrar do fato de que todos os outros participantes da conferência precisam criar um ambiente confortável por conta própria. E se um dos interlocutores decidir participar de uma conferência com a janela aberta para uma rodovia barulhenta ou se conectando pela pior rede wireless do mundo, não souber da existência de um botão mudo ou decidir se comunicar de pijama ( ou pior ainda ), então todo o processo de comunicação certamente irá ladeira abaixo. E hoje em dia, quando as pessoas são forçadas a trabalhar em casa, elas podem não ter um plano B.
Em muitos aspectos, isso é mais uma questão cultural do que técnica, mas pode ser explicado com um conceito mais relacionado à segurança cibernética do que às videochamadas: a superfície de ataque. Quanto mais pessoas participarem de uma conferência, maior será a superfície de ataque e mais provável será que um elo fraco estrague toda a conversa.
Sejamos honestos: embora o software de videoconferência não seja perfeito, ele percorreu um longo caminho e agora é, em princípio, bom o suficiente para permitir que você trabalhe regularmente em casa sem afetar a qualidade do trabalho.
Um grande exemplo disso é o e-learning, uma versão educacional de videoconferência que é considerada tão eficaz que se tornou essencialmente uma prática comum em caso de queda de neve em algumas áreas.
Considerando tudo o que podemos fazer com a Internet e o grande volume de dados transferidos, só podemos nos maravilhar com o desempenho da videoconferência. E para fazer isso, geralmente é necessária muita compactação e redução de qualidade. É por isso que temos que repetir nossas palavras com muita freqüência. Talvez, ao contrário, devêssemos nos surpreender que nossos colegas quase sempre nos ouvem.