Legendas enigmáticas na CNN

Os telespectadores da CNN notaram que no boletim de notícias 12/11/2020 em seu canal oficial do YouTube, em vez de legendas, havia uma espécie de bagunça de retalhos de palavras em inglês, com uma tampa contínua:





Como isso pode ter acontecido? (Em 01/12/2020, as legendas do YouTube não foram corrigidas.)



Estenótipo



Por mais de cem anos, os estenógrafos americanos têm usado dispositivos especiais com um teclado mínimo de 22 teclas - duas teclas para cada dedo para minimizar o movimento da mão:







cem anos atrás, o estenótipo era uma variante da máquina de escrever e cada tecla deixava uma impressão no papel. Não havia carruagem: após cada "acorde" de uma ou mais teclas pressionadas simultaneamente, o papel rolava uma linha para baixo. A impressão de cada letra estava sempre no mesmo lugar da linha. As teclas P, R, S, T estão presentes em duplicata cada uma - sob a mão esquerda e sob a mão direita.





Cada "acorde" e cada linha na impressão corresponde a uma sílaba. Não há espaços entre as palavras e as próprias palavras são transmitidas foneticamente: na impressão mostrada acima, a frase “Você deve ser capaz de ler estas palavras curtas” é transcrita . Uma vez que existem menos teclas do que letras no alfabeto inglês, e ainda mais do que sons na fala inglesa, um engenhoso sistema de "codificação" é usado, por exemplo [n] é escrito como PB, [l] como HR, ditongo [eɪ] como AEU etc. Com esta codificação, por exemplo, a palavra brilho gravada como TKPWHRAOEPL - «acorde" dos onze capotamentos!



Exemplo de um trecho da transcrição de uma audiência no tribunal


Após a reunião, o estenógrafo teve que sentar e redigitar sua transcrição em uma máquina de escrever comum, porque é absolutamente impossível para uma pessoa despreparada lê-la. No exemplo acima, a frase "absolutamente cem por cento" é escrita como SHRAOUT HRAOE WOPB HUPBD PERS, que significa [sljuːtliː wɒn hʌnd pɛrs] - as sílabas ausentes devem ser reconstruídas de acordo com o contexto, e as vogais não correspondem exatamente à transcrição do dicionário. Existem diferentes sistemas de notação e abreviatura, de modo que até os próprios estenógrafos têm dificuldade em ler as notas uns dos outros. Aqui está um pequeno trecho de um livro texto abreviado que foi editado pelo proprietário para um sistema diferente:





Acredita-se que a taxa média de fala em inglês seja de 130 palavras por minuto, e um estenógrafo estenotipado pode digitar até 300 palavras por minuto, o que permite gravar a conversa mesmo quando os interlocutores se interrompem. Existe um sistema Velotype semelhante , focado em letra por letra em vez de fonético; ele permite que você digite até 200 palavras por minuto. A diferença é causada pelo fato de que as palavras em inglês quase sempre têm mais letras do que sons - às vezes duas vezes, como nas palavras escolha [tʃuːz] ou terra[ɜːθ]. O Velotype foi criado em 1939 quando as paradas de tabulação e o processamento automático de dados floresceram; A motivação para escrever carta por carta era uma transcrição mais simples que poderia até mesmo ser atribuída a uma máquina eletromecânica. Junto com outros equipamentos de escritório, as próprias máquinas estenográficas foram eletrificadas: em vez de teclas conectadas mecanicamente e letras digitadas em papel, aparelhos eletrônicos, monitores convenientes, armazenamento digital e processamento de transcrições têm sido usados ​​desde o final do século passado.





No início deste século, as capacidades de processamento computadorizado de linguagem natural atingiram o nível de decifrar automaticamente transcrições fonéticas de estenótipos e transformar "SHRAOUT HRAOE" em "absolutamente". Então, o apoio às pessoas com deficiência atingiu o nível dos canais de TV que acompanham as transmissões ao vivo com legendas em tempo real para quem acha mais fácil ler do que ouvir. Isso significa que um estenógrafo com um estenótipo está assistindo à transmissão, ele grava a fala do locutor e de outros participantes da transmissão, seu computador transcreve a transcrição, se necessário, traduz automaticamente para o idioma do público-alvo e transmite o texto resultante no ar e no YouTube.



Aparentemente, em 12/11/2020, algo deu errado com a CNN neste sistema complexo, e a saída do descriptografador foi misturada com pedaços de uma transcrição não decifrada. Mesmo que encontrassem uma falha durante a transferência, eles decidiram não tocar em nada, para que algo mais importante não se quebrasse. O incidente na Fox News em 2013 causou muito mais barulho : daquela vez, o decifrador não deu conta do nome de Dzhokhar Tsarnaev , que causou a explosão na Maratona de Boston, e substituiu o nome da atriz Zooey Deschanel nas legendas por ele .



All Articles