1.3. Mecanismos de pesquisa - especializados e nem tanto
Em geral, os resultados da pesquisa dependem principalmente da tarefa e da exatidão da solicitação. Mas esses resultados são, na maioria das vezes, por um lado,
a) redundantes
e, por outro lado, b) incompletos.
Felizmente, tanto os autores quanto os editores, via de regra, estão interessados em que as informações sobre as publicações sejam indexadas por mecanismos de pesquisa, mas existem algumas nuances: a indexação do conteúdo de arquivos PDF nem sempre é permitida e, em alguns casos, apenas alguns mecanismos de pesquisa têm permissão para indexar sites (por exemplo, os maiores a biblioteca eletrônica doméstica elibrary.ru ao mesmo tempo proibiu a indexação da maioria dos arquivos do google).
Entre outras coisas, os resultados da consulta dependem da ordem das palavras e do endereço IP a partir do qual a pesquisa é realizada.
Se falamos de busca de publicações, então a pergunta "qual mecanismo de busca usar" tem uma resposta - Google (isso sem contar os buscadores bibliográficos especializados, sobre eles a seguir).
Em primeiro lugar, o Google indexa o conteúdo da web de forma bastante completa. Em segundo lugar, um grande número de configurações de pesquisa avançada (incluindo aquelas que usam operadores) facilitam muito o trabalho. Em terceiro lugar, como já indiquei, o conteúdo dos arquivos pdf é indexado pelo googl mesmo se o pdf consistir em imagens e a camada de texto estiver ausente no arquivo.

, . Pander, C. H. (1830). Beiträge zur Geognosie des Russischen Reiches. St.Petersburg, Karl Kray. 150 S.

Configurações de pesquisa avançada do Google. No Yandex, infelizmente, a maioria das configurações de pesquisa avançada que estavam disponíveis anteriormente desapareceram há muito tempo, existem pequenas coisas como pesquisar por extensão de arquivo (apenas em vez do tipo de arquivo do Google: o operador mime é usado :)
Para pesquisar publicações, os mais úteis são as configurações avançadas e os operadores que permitem limitar a pesquisa a arquivos um determinado formato (por exemplo, pdf usando filetype: pdf), certos sites / domínios. Por exemplo, se eu preciso olhar quais sites chineses publicaram publicações em formato pdf, onde amonites são mencionados, então esta consulta ajudará: ammonites filetype: pdf site: cn... Bem, "+" e "-" são usados para indicar termos necessários ou indesejáveis. Por exemplo, ao pesquisar informações sobre cefalópodes - amonites, você geralmente não precisa de informações sobre o explosivo de mesmo nome ou uma tribo que já viveu no Oriente Médio e é regularmente mencionado na Bíblia. Assim, o pedido pode ser corrigido da seguinte forma: ammonites tipo de arquivo: pdf -explosivos -Bíblia
Se você estiver procurando por uma publicação específica, é aconselhável colocar parte do título ou todo o título entre aspas.
Também é importante que o Google tenha dois projetos separados que estão diretamente relacionados à busca por publicações:
1) Google booksNa verdade, é um mecanismo de busca separado que indexa o conteúdo de um grande número de livros, revistas, coleções e outras publicações. Ao mesmo tempo, uma parte significativa das publicações está disponível para download em formato pdf (por norma, são edições antigas, do início do século XX em diante); dependendo do IP, a lista de publicações disponíveis para download pode variar significativamente, o número máximo de trabalhos está disponível para usuários dos Estados Unidos.
Algumas publicações estão disponíveis para visualização total ou parcial. Esses trabalhos podem ser baixados usando programas especiais, como o downloader EDS Google Book ou plug-ins (como Greasemonkey para Mozilla em combinação com um programa de download automático de arquivos, como Download Master ).
E, finalmente, um benefício considerável pode ser obtido mesmo a partir das informações que estão presentes em publicações que geralmente são inacessíveis para visualização em qualquer forma, exceto para fragmentos em várias linhas ( visualização de fragmentos ). No entanto, existem duas dificuldades principais com essas publicações:
a) você pode, é claro, tentar procurar esses trabalhos em outro lugar, mas a probabilidade de que estejam disponíveis apenas na biblioteca é bastante alta.
b) há muita confusão nos nomes das fontes (especialmente aquelas que não foram originalmente fornecidas em latim), e as informações exibidas geralmente são incompletas.
No entanto, as informações contidas em tais fragmentos podem ser muito importantes e praticamente não encontradas de outras maneiras.

É assim que uma versão típica de publicação no google books se parece no formato de visualização de trechos: via de regra, parte da informação bibliográfica necessária está faltando (o número da edição do periódico, às vezes partes importantes do título da publicação). É bom se a revista tiver 2 edições por ano. E se 20? E se o nome estiver incorreto?
2) Google Scholar(Google Academy em russo). Trata-se de um motor de busca bibliográfica que procura bem os próprios artigos e os links para os mesmos, ao mesmo tempo que permite copiar imediatamente os títulos das publicações formatadas de acordo com os tipos de citação populares (APA, Harvard, GOST, etc.). Entre as conveniências desse sistema está o fato de que não apenas os sites das editoras são indexados, mas também as redes sociais especializadas e uma variedade de sites onde os artigos científicos são frequentemente disponibilizados gratuitamente e todos os links para versões em texto completo são agrupados em um único cluster. No entanto, o Google Scholar não indexa todas as publicações - é fácil verificar com a mesma consulta de pesquisa "palavras-chave" tipo de arquivo: pdfno Google e no Google Scholar. Essa distinção é especialmente pronunciada com palavras-chave raras.
Bem, o recurso mais útil do google scholar é a capacidade de se inscrever para uma variedade de notificações (mais sobre isso na continuação deste post).

Buscando palavras-chave no google scholar. Preste atenção às opções de classificação, opções de intervalo de tempo e grupos de artigos.
Os motores de busca bibliográfica (BPS) orientados para trabalhar com publicações são agora muito diversos e numerosos. Além dos projetos do Google acima, podem ser observados os seguintes sites, que podem ser considerados como BPS:
1) sites que indexam um grande número de publicações em todo o mundo. Em primeiro lugar, este é Scopus eWeb of Science , disponível por assinatura (no caso do Scopus, o acesso também é fornecido para revisores de periódicos da Elsevier), bem como o maior site que atribui DOIs a publicações ( CrossRef ) ou um agregador de informações sobre publicações, bolsas, pesquisadores, etc. Dimensões .
Todos eles, exceto Dimensões, permitem que você pesquise informações sobre uma quantidade limitada de dados - principalmente um título / palavras-chave / currículo. Para piorar, CrossRef se destaca aqui - lá a pesquisa vai apenas pelo nome e com uma referência estrita à forma da palavra. Verdade, CrossRef tem significativamente mais publicações em russo indexadas do que em outros BTSs a partir deste ponto e, além disso, esta é a maneira mais conveniente de resolver um problema como "Eu tenho um nome de publicação, preciso encontrar seu DOI" (todos os DOIs não podem ser encontrados assim o único registrador de identificadores digitais para publicações, há também DataCite, por exemplo - mas, curiosamente, simplesmente não existe serviço universal para resolver esse problema).

Pesquisa simples em dimensões
Dimensões é um projeto muito interessante que apareceu recentemente, principalmente devido a uma variedade de configurações diferentes, uma ampla cobertura de publicações (apenas publicações com DOI são indexadas, ainda há um pouco menos do que há no CrossRef) e pesquisa de texto completo. Em vez disso, aqui você pode selecionar diferentes opções de pesquisa (texto completo / por currículo / por título e palavras-chave). Os resultados podem ser classificados em uma ampla variedade de maneiras (data / relevância / número de links / número de altmetria), e limitados por diferentes parâmetros (fonte / autor / anos / assunto e muito mais). As dimensões têm versões diferentes (incluindo paga e corporativa), apenas a opção gratuita é considerada aqui (não tratamos de outras ainda). Separadamente, você pode pesquisar informações por publicações,e em bancos de dados e concessões (a última opção está disponível apenas por assinatura).

Analytical view , , ( — 2016 2020 ). , , ..
Opções adicionais são oferecidas na guia Visualização analítica. Eles tornam mais fácil entender quem está agora ou em qualquer intervalo de tempo selecionado está envolvido em um determinado tópico, em quais revistas essas pessoas escrevem artigos e com quais co-autores. Essa é uma maneira conveniente de encontrar coautores e revisores em potencial, especialmente para aqueles que acabaram de começar a trabalhar em um tópico e não têm uma boa ideia do que está sendo feito com ele em escala global. Para os pesquisadores que possuem um ORCID em seus artigos, o perfil contém esse identificador e o ID do autor do Scopus, bem como (se disponível) o ResearcherID / perfil no Publons anexado a eles automaticamente. Repito - Dimensions é um projeto extremamente útil e intuitivo. Você pode simplesmente apertar todos os botões em uma linha e acessar todas as guias.
2) também os sites das maiores editoras internacionais (Elsevier, Wiley, Springer, Taylor & Francis, etc.) e distribuidores (Ingentaconnect, GeoscienceWorld) de publicações científicas podem ser considerados BTS especializados. No entanto, limitar os resultados da pesquisa a um ou outro editor ou distribuidor geralmente não é benéfico e, em vez disso, pode ser útil para se familiarizar brevemente com um determinado tópico.
3) em certa medida, as funções do BTS são desempenhadas por redes sociais científicas ( Academia.edu , ResearchGate ), bem como por um "híbrido" de rede social e gestor bibliográfico Mendeley (tanto uma versão offline como programa quanto sua versão online estão disponíveis); muitas opções do Scopus agora estão disponíveis lá depois que a Elsevier comprou o Mendeley). No entanto, o conteúdo das redes sociais científicas é bem indexado pelo googl, e então faz sentido navegar regularmente no feed de atualização em busca de algo completamente novo.
4) em uma categoria separada de BTS, sites regionais ou especializados podem ser distinguidos, onde principalmente há dados sobre publicações publicadas em qualquer país ou vários países (por exemplo, a Biblioteca Eletrônica Nacional elibrary.ru na Rússia, o Instituto Nacional de Informática do Japão, a Biblioteca Nacional França ), bem como sites especializados dedicados a algumas áreas científicas específicas (por exemplo, Biblioteca do Patrimônio da Biodiversidade(BHL))
Uma característica desses portais é que eles são extremamente relutantes em permitir que mecanismos de pesquisa de terceiros indexem seu conteúdo, portanto, se você precisar encontrar algo em francês ou japonês, é mais confiável olhar os sites relevantes e pesquisar neles.

Até recentemente, no site da Biblioteca Nacional da França, toda a interface era francesa, até que finalmente anexou lá primeiro uma versão em inglês do site, e depois a tradução automática sobre IP
Separadamente, deve-se dizer sobre BHL. Este é um projeto extremamente útil para todos os pesquisadores que estão de alguma forma envolvidos no estudo de organismos modernos ou fósseis. Esta biblioteca é diferenciada por uma ampla gama de fontes (incluindo várias raridades) e pela presença de ferramentas de pesquisa especiais (como uma pesquisa de táxons na guia Pesquisa avançada - se alguém coleta materiais sobre um determinado grupo de animais e plantas, essa é uma boa maneira de encontrar rapidamente publicações sobre tema). Entre as deficiências do BHL, pode-se notar que a camada de texto pode muitas vezes ser reconhecida incorretamente (com o idioma errado), bem como a qualidade monstruosa das ilustrações padrão (a qualidade de um .djvu borrado).
Como a qualidade da imagem geralmente é de grande importância para estudos taxonômicos, a abordagem mais correta aqui é baixar a publicação necessária no formato jp2 e, em seguida, processar os arquivos (primeiro reformatando em jpg / tiff comum e, em seguida, processando ScanTailor e OCR). A propósito, todas as publicações de BHL são postadas no archive.org, e às vezes é mais conveniente realizar uma pesquisa de texto completo exatamente no archive.org (isso pode ser relevante no caso de procurar por alguma raridade - algo interessante pode acontecer aqui, incluindo aqueles carregados pelos usuários.

Exemplo de saída ao pesquisar por táxon em BHL

Se você precisa de um PDF de alta qualidade, é melhor salvar o arquivo usando o método "Baixar conteúdo - Baixar livro - Baixar JPEG 2000" e, em seguida, processá-lo
E, claro, se você precisar encontrar publicações em russo, não poderá fazer sem pesquisar na biblioteca eletrônica em combinação com o cyberleninka . Embora a cobertura das fontes na biblioteca eletrônica seja muito maior, regularmente encontramos situações em que a biblioteca eletrônica se oferece para pagar por um artigo - e no site da Cyberleninki o mesmo artigo é de domínio público.
Apesar de uma série de deficiências inerentes à biblioteca eletrônica, parece desde o nascimento (a incapacidade de baixar até mesmo o acesso aberto funciona sem inserir um nome de usuário / senha; a falta de uma versão em inglês e a opção de assinar certas atualizações), a pesquisa lá é bastante decente. Mas se houver necessidade de rastrear regularmente informações sobre revistas em russo, também vale a pena criar um diretório separado de links para os sites das publicações necessárias - na biblioteca eletrônica você não consegue adivinhar quando e por que eles podem fechar repentinamente o acesso a certas publicações. E mais uma coisa - no caso em que a revista não seja de domínio público e seja distribuída apenas por dinheiro tanto na biblioteca quanto no site da editora, então no site da editora os artigos podem ser mais baratos (como é o caso, por exemplo, da revista "Indústria do Petróleo" )

Configurações de pesquisa avançada na biblioteca eletrônica (na página inicial do site - no canto superior esquerdo do link "pesquisa avançada"). O histórico de consultas de pesquisa anteriores também é mantido aqui
5) Os maiores projetos "piratas" que fornecem acesso gratuito a publicações científicas - SciHub e LibGen - podem ser considerados como BTSs , pois têm a capacidade de pesquisar por título de publicação ou palavras-chave de uma forma ou de outra.
E se o sci-hub puder ser usado como um complemento conveniente para a pesquisa no Dimensions, então monografias raras aparecem regularmente no LibGen, que não são encontradas em nenhum outro lugar - elas são digitalizadas por entusiastas e postadas no LibGen em particular.
E, por fim, vale mencionar separadamente sobre a busca por dissertações. Embora muitas dissertações (russas modernas e, às vezes, estrangeiras bastante antigas) sejam postadas na Internet em domínio público e indexadas por mecanismos de busca, faz sentido consultar o site da VAK para obter informações sobre as dissertações mais recentes, cuja defesa está planejada apenas . Lá, as dissertações agora podem ser pesquisadas por especialidade, palavras-chave, data de defesa e outros parâmetros (neste caso, a pesquisa é realizada separadamente para dissertações VAK e separadamente para aquelas que são defendidas em conselhos de organizações que têm o direito de conceder diplomas de forma independente). Mas há uma nuance - se você tiver o uBlock Origin instalado, ele bloqueia a pesquisa neste site.

Um exemplo de pesquisa no site VAK
Continua.