Mais detalhadamente, o problema é que os recursos contábeis não são suficientes para as tarefas atuais e ninguém quer alocar taxas para novas pessoas. Portanto, de cima, eles decidiram cortar algumas tarefas e liberar o tempo dos contadores para coisas mais úteis. Trabalhos como escanear e reconhecer documentos, copiá-los e adicioná-los a outras alegrias rotineiras entraram na faca.
Assim, como analista, tive a tarefa de encontrar uma solução para o reconhecimento de um documento típico da minha empresa - uma fatura - para estruturá-lo nas instalações de armazenamento disponíveis, bem como em 1C. Uma solução que seja conveniente, compreensível e não custará nada à empresa.
A experiência acabou me divertindo, resolvi compartilhar o que consegui arrecadar. Talvez eu tenha perdido algo, então seja bem-vindo aos comentários, se houver algo a acrescentar.
Os programas de digitalização de documentos e os programas de reconhecimento de documentos não são uma solução nova no mercado, podem ser encontrados em programas gratuitos e integrados em sistemas.
Comecei com programas gratuitos:
- glmageReader
- Papelada
- VietOCR
- Cuneiforme.
Durante o reconhecimento de nossa fatura por esses programas, vi o seguinte:
- Em programas como VietOCR, Paperwork, glmageReader, você pode configurar o armazenamento de documentos digitalizados em pastas específicas, Paperwork pode até classificá-los de acordo com as etiquetas.
- Eles geralmente funcionam bem com texto e, onde o texto não é reconhecido corretamente, alguns programas podem alterar manualmente o conteúdo antes de exportar o arquivo.

No entanto, também existem problemas:
- Há uma diferença entre trabalhar com varreduras de PDF e PNG. Nem sempre é possível converter png em pdf com sucesso.
- A maioria desses programas é difícil de lidar com o reconhecimento de documentos tabulares, mesmo o formato mais simples. Como resultado, obtemos o texto reconhecido sem os campos marcados.
- Por vezes, o tipo de letra é determinado de forma imprecisa, pelo que, ao converter, todo o texto reconhecido se atropela.
- No processo de reconhecimento, às vezes é necessário fazer alinhamento por palavras-chave, com rotações e deslocamento coordenado.
- Em alguns programas, a tabela era reconhecida como imagem e exportada para um novo documento do Word também como imagem, muito truncada, que é até difícil de ver.
- Ao editar conteúdo reconhecido em alguns programas, surgiram problemas, a fonte ou o próprio texto mudou.

A tecnologia funcionou bem e, considerando que os programas são gratuitos, os problemas descritos acima são aceitáveis. No entanto, estava procurando uma solução mais simplificada.
Então pesquisei reconhecimento no ABBYY FineReader 15 Corporate
Durante o período de teste de 7 dias, também estudei essa plataforma.
O que observou:
- Quando abri o arquivo png, ele foi lido perfeitamente e, como resultado, foi convertido com sucesso para pdf sem perder a qualidade da imagem e do texto.
- , . png , .
- - pdf. .
- , , .
- OCR pdf -. - .
- , , . , , .
- Aqui você pode configurar a conversão automática de documentos recebidos que serão regularmente retirados da pasta especificada, de acordo com a programação especificada.
- Ele permite que você compare versões de documentos, mesmo que estejam em formatos diferentes. Com um grande fluxo de documentos e edições, é muito conveniente.
Tive uma experiência agradável ao usar este software. Porém, quando me voltei para a etiqueta de preço da solução do sistema ABBYY Flexicapture (e preciso da solução do sistema), descobri que a solução, principalmente a customizada, custa uma soma bem redonda, cerca de 400 mil rublos / mês. e acima por 10 mil páginas.
Comecei a procurar uma alternativa. Como libertar um funcionário, obter reconhecimento de documentos de alta qualidade e não se preocupar com a segurança e estrutura dos dados.
E então decidi dar uma olhada melhor no ELMA RPA, que já havia estudado antes .
O fornecedor propõe transferir uma parte significativa do trabalho de exportação de dados para ERP dos ombros dos contadores para os robôs. Na verdade, é exatamente isso que resolve o problema que me é proposto. Para me familiarizar com o reconhecimento neste sistema, peguei uma versão de teste do sistema com o fornecedor.
Aqui, descobri que o reconhecimento não se destina a converter os dados recebidos em um novo arquivo de documento.
Aqui, o principal objetivo é reconhecer os detalhes do documento e transferi-los para outros sistemas / sites / aplicativos. Além disso, os robôs colocam todas as informações onde precisam: eles encontram automaticamente as pastas necessárias e as salvam nos formatos necessários.
Que tipos de reconhecimento no sistema eu observei:
Reconhecimento de padrões
Somos oferecidos para reconhecer o documento carregado com base no modelo do documento. Pelo que eu sei, esse tipo de reconhecimento é gratuito, o motor Tesseract está conectado a ele.
O que observou:
- Este tipo de reconhecimento funciona justamente com digitalizações nos formatos jpg e png, ainda não considerou o pdf. Mas o produto ainda é jovem, acho que está tudo pela frente.
- Este tipo de reconhecimento está incluído na Community Edition gratuita
- O texto é convenientemente marcado em blocos que podem ser combinados de acordo com as variáveis que criamos no contexto do robô. Portanto, configure manualmente o que exatamente estamos puxando para o reconhecimento.
- Ele reconheceu nossa fatura 50/50, mudou algumas palavras como achou conveniente. :)
No entanto, o fornecedor para este caso afirmou que este tipo de reconhecimento é adequado para documentos simples, com estrutura textual ou com formas leves. E ele aconselhou usar outro tipo de reconhecimento para reconhecer a fatura - o laboratório de inteligência .
O processo é o mesmo, carregamos o template e o reconhecemos por ele. Mas aqui o modelo é enviado para o servidor em nuvem.
Recebemos uma resposta do servidor (se reconhece este tipo de documento ou não), e se for reconhecido, então a estrutura do template (variáveis para mapeamento) é passada para coincidir com as variáveis que precisarão ser escritas no processo RPA.
Durante o processo de playback, já enviamos um documento que gostaríamos de reconhecer e recebemos uma resposta do servidor iLab sobre o reconhecimento.
O que observei sobre esse reconhecimento:
- pdf, jpg png.
- . .
- - .
- , 1. , , , , .
- Community Edition . , (, , .), , 100 500 . ( , , .)
O processo de reconhecimento de documentos em si é bastante difícil de exibir em vídeo, uma vez que acontece em uma caixa, e a tela fica vazia por vários segundos. Portanto, fiz uma entrada separada dos dados reconhecidos em um bloco de notas para visualização.

Assim, o robô grava os mesmos dados em 1C, criando um novo documento lá:

O que conseguimos descobrir por preços: Se, por exemplo, quisermos trabalhar em grande escala com o reconhecimento ilab, então pelos nossos 10.000 documentos teremos que pagar:
- cerca de 180.000 rublos. de uma vez,
- mais, digamos, 400.000 rublos. comprar um robô com um orquestrador
- total: 580.000 rublos.
O robô é ilimitado e 10.000 documentos serão suficientes por algum tempo. Acontece bastante lucrativo, pelo menos no fato de que pagamos tudo de uma vez.
O que gostamos sobre o reconhecimento nesta plataforma em geral:
- , , . .
- , , , . .
- . 15 , — . , .
- , .
:
- Programas gratuitos lidam com a tarefa de reconhecimento de documentos melhor do que eu esperava, no entanto, devido a eles, não será possível acelerar significativamente o trabalho com um grande volume
- O ABBYY FineReader lida bem com o processamento e reconhecimento de documentos posteriormente, no entanto, para obter uma solução de sistema, você precisa de excelentes recursos financeiros.
- ELMA RPA surpreende pela qualidade de reconhecimento de documentos, variabilidade, bem como capacidades de armazenamento e transferência após o reconhecimento, mas deve-se ter em mente que o produto é jovem.