A ideia nasceu há alguns anos e era simples ao ponto da banalidade: kad.arbitr.ru - o site onde civis e outros casos "vivem" - apenas um depósito sem fundo de informações valiosas para um escritório de advocacia. Os autos devem conter empresas que foram processadas e que ainda não sabem, não estão prontas, não podem ou não querem ir aos tribunais. Resta apenas encontrar essas empresas e entrar em contato com elas.
Dito e feito. Armados com python e um conhecimento básico de sua sintaxe, alguns advogados decidiram descobrir o que resultaria disso.
No inicio
Tudo estava indo bem. Indo ao site kad.arbit.ru com a ajuda de selênio, passando pelo calendário das sessões do tribunal, indicando o tribunal e escolhendo o mês no calendário - o site deu as sessões agendadas:
E aqui começaram os primeiros problemas. Se houvesse muitas reuniões. E na opinião de que kad.arbitr é mais do que 1000, o site cuspiu:
Hmm. Por que, então, essa informação é necessária se não pode ser visualizada?
Mas, vamos lá, os advogados não eram gananciosos e sentiam saudades ultimamente, tornando-se disponíveis. A seguinte imagem abriu:
Faltava coletar tudo isso em alguma bolsa csv, por exemplo. Ao mesmo tempo, mantendo o caso, a empresa demandada e o link para o caso. Descobriu-se algo como o seguinte - olhe .
, .
, :
. Pyhton , . , , (), ( ).
? ! , CTRL+C, CTRL+V ...
. , . python, konvert-online.ru
, .
, . , .
, kad.arbitr.ru c selenium , , .
Código e instruções para revisão - download .