O que acontece quando as pesquisas do Google usam a palavra "vs"

Aconteceu com você: você procura algo no Google e insere "vs" após a palavra de pesquisa, esperando que o mecanismo de pesquisa ofereça automaticamente algo um pouco semelhante ao que você precisa?





Digitando "vs" após a palavra de pesquisa



Isso aconteceu comigo.



Como se viu, isso é um grande negócio. Esta é uma técnica que, ao procurar uma alternativa para algo, pode economizar uma tonelada de tempo.



Vejo três razões pelas quais essa técnica se mostra perfeitamente se for usada para procurar informações sobre tecnologias, certos desenvolvimentos e conceitos que eles desejam entender:



  1. A melhor maneira de aprender algo novo é descobrir como ele é, novo, semelhante ao que já é conhecido ou como o novo difere do conhecido. Por exemplo, na lista de frases que aparece após "vs", você pode ver algo sobre o que pode dizer: "E, então, acontece que o que estou procurando parece que isso já me é familiar".
  2. — . , , .
  3. «vs» — , Google , - -. «or», - -. , «or», Google , - .




Ao processar um bert ou solicitação, o Google faz sugestões sobre a Vila Sésamo. E a consulta vs vs me dá dicas sobre o Google BERT.



Isso me fez pensar. E se você pegar as palavras sugeridas pelo Google depois de digitar "vs" e pesquisar por elas, adicionando também "vs" depois delas? E se você repetir isso várias vezes? Nesse caso, você pode obter um bom gráfico de rede de consultas relacionadas.



Por exemplo, pode ser assim.





Gráfico ego para consulta bert com raio 25



Essa é uma técnica muito útil para criar mapas mentais de tecnologias, desenvolvimentos ou idéias que refletem o relacionamento de entidades semelhantes.



Eu vou te dizer como criar esses gráficos.



Automatizando a coleta de dados "vs" do Google



Aqui está um link que você pode usar para obter sugestões do Google para conclusão de consultas no formato XML do Google. Esse recurso não parece uma API destinada ao uso geral, portanto, provavelmente não deve ser muito pesado nesse link.



http://suggestqueries.google.com/complete/search?&output=toolbar&gl=us&hl=en&q=<search_term>


O parâmetro URL output=toolbarindica que estamos interessados ​​nos resultados no formato XML, gl=usdefine o código do país, hl=enpermite especificar o idioma e a construção q=<search_term>é exatamente o que você precisa para obter os resultados do preenchimento automático.



Os parâmetros gle hlusam os identificadores padrão de país e idioma de duas letras .



Vamos experimentar tudo isso iniciando uma pesquisa com, por exemplo, uma consulta tensorflow.



O primeiro passo do trabalho é de se referir ao especificado no URL, com a seguinte estrutura descrevendo a consulta: q=tensorflow%20vs%20. O link inteiro ficará assim:



http://suggestqueries.google.com/complete/search?&output=toolbar&gl=us&hl=en&q=tensorflow%20vs%20


Em resposta, obtemos os dados XML.



O que fazer com XML?



Agora você precisa verificar os resultados da conclusão da conclusão para verificar se está em conformidade com um determinado conjunto de critérios. Com aqueles que nos convêm, continuaremos trabalhando.





Verificando os resultados



Eu, ao verificar os resultados, usei os seguintes critérios:



  • A consulta de pesquisa recomendada não deve conter o texto da consulta original (ou seja, - tensorflow).
  • A recomendação não deve incluir solicitações que foram consideradas adequadas anteriormente (por exemplo - pytorch).
  • Uma recomendação não deve incluir várias palavras "vs".
  • Após a localização de 5 pesquisas correspondentes, o restante não será considerado.


Essa é apenas uma das maneiras de "limpar" a lista de recomendações para concluir uma consulta de pesquisa recebida do Google. Às vezes, também vejo o benefício de escolher em uma lista de apenas recomendações de uma palavra, mas o uso dessa técnica depende de cada situação específica.



Portanto, usando esse conjunto de critérios, obtivemos os 5 resultados a seguir, cada um dos quais recebe um determinado peso.





5 resultados



Próxima iteração



Essas 5 recomendações encontradas são então submetidas ao mesmo processamento da consulta de pesquisa original. Eles são passados ​​para a API usando a palavra "vs" e, novamente, são selecionados 5 resultados de preenchimento automático que atendem aos critérios acima. Aqui está o resultado desse processamento da lista acima.





Localizando resultados de preenchimento automático para palavras



que já foram encontradas Você pode continuar esse processo examinando as palavras na coluna que ainda não foram examinadastarget.



Se você executar iterações suficientes dessa pesquisa de palavras, obterá uma tabela bastante grande contendo informações sobre consultas e pesos. Esses dados são adequados para visualização de gráficos.



O ego conta



O gráfico de rede que mostrei no começo do artigo é o chamado gráfico do ego, construído, no nosso caso, para uma consulta tensorflow. Um gráfico do ego é um gráfico com todos os seus nós a alguma distância do nó tensorflow. Esta distância não deve exceder a distância especificada.



Como é determinada a distância entre os nós?



Vamos dar uma olhada no gráfico final primeiro.





O gráfico do ego para uma consulta de fluxo tensor com um raio de 22 é o



peso da aresta conectando a consultaAeBjá sabemos. Esta é a classificação da recomendação da lista de conclusão, variando de 1 a 5. Para tornar o gráfico não orientado, você pode simplesmente adicionar os pesos dos links entre os vértices indo em duas direções (ou seja, deAkB, e se houver esse link, deBkA) ... Isso nos dará pesos de borda variando de 1 a 10.



O comprimento da borda (distância), portanto, será calculado usando a fórmula11 — . Escolhemos o número 11 aqui porque o peso máximo da aresta é 10 (a aresta terá esse peso se as duas recomendações aparecerem no topo das listas de conclusão umas das outras). Como resultado, a distância mínima entre solicitações será 1. O



tamanho (tamanho) e a cor (cor) do vértice do gráfico são determinados pelo número (contagem) de casos em que a solicitação correspondente aparece na lista de recomendações. O resultado é que, quanto maior o pico, mais importante é o conceito apresentado a ele.



O gráfico do ego em questão tem um raio de 22. Isso significa que você pode chegar a cada solicitação do topo tensorflowpassando uma distância não superior a 22. Vamos dar uma olhada no que acontece se você aumentar o raio do gráfico para 50.





Gráfico do ego para a consulta do tensorflow com raio 50



Curiosamente, acabou! Este gráfico contém a maioria das tecnologias básicas que qualquer pessoa que trabalha com inteligência artificial precisa conhecer. Os nomes dessas tecnologias são agrupados logicamente.



E tudo isso é construído com base em uma única palavra-chave.



Como desenhar gráficos semelhantes?



Usei a ferramenta on-line Flourish para desenhar esse gráfico .



Este serviço permite criar gráficos de rede e outros diagramas usando uma interface simples. Suponho que vale a pena olhar para aqueles interessados ​​em construir gráficos do ego.



Como criar um gráfico do ego com um determinado raio?



Você pode usar o pacote Python para criar um gráfico do ego com um determinado raio networkx. Tem um recurso muito útil ego_graph. O raio do gráfico é indicado quando essa função é chamada.



import networkx as nx

#  
#nodes = [('tensorflow', {'count': 13}),
# ('pytorch', {'count': 6}),
# ('keras', {'count': 6}),
# ('scikit', {'count': 2}),
# ('opencv', {'count': 5}),
# ('spark', {'count': 13}), ...]

#edges = [('pytorch', 'tensorflow', {'weight': 10, 'distance': 1}),
# ('keras', 'tensorflow', {'weight': 9, 'distance': 2}),
# ('scikit', 'tensorflow', {'weight': 8, 'distance': 3}),
# ('opencv', 'tensorflow', {'weight': 7, 'distance': 4}),
# ('spark', 'tensorflow', {'weight': 1, 'distance': 10}), ...]

#   
G=nx.Graph()
G.add_nodes_from(nodes)
G.add_edges_from(edges)

# -  'tensorflow'
EG = nx.ego_graph(G, 'tensorflow', distance = 'distance', radius = 22)

#  
subgraphs = nx.algorithms.connectivity.edge_kcomponents.k_edge_subgraphs(EG, k = 3)

# ,  'tensorflow'
for s in subgraphs:
    if 'tensorflow' in s:
        break
pruned_EG = EG.subgraph(s)

ego_nodes = pruned_EG.nodes()
ego_edges = pruned_EG.edges()


Além disso, usei outra função aqui - k_edge_subgraphs. É usado para remover alguns resultados que não atendem às nossas necessidades.



Por exemplo, stormé uma estrutura de código aberto para computação distribuída em tempo real. Mas este também é um personagem do universo Marvel. Que sugestões de pesquisa você acha que "vencerá" se você digitar "storm vs" no Google?



A função k_edge_subgraphsencontra grupos de vértices que não podem ser divididos executando kou menos ações. Como se viu, os valores dos parâmetros k=2e se mostram bem aqui k=3. No final, apenas esses subgráficos permanecem, aos quais pertencem tensorflow. Isso nos permite garantir que não estamos muito longe de onde começamos a pesquisa e não entramos em áreas muito distantes.



O uso de gráficos do ego na vida



Vamos nos afastar do exemplo c tensorflowe considerar outro gráfico do ego. Desta vez - um gráfico dedicado a outra coisa que me interessa. Esta é uma abertura de xadrez chamada "jogo espanhol" (abertura de xadrez de Ruy Lopez).



▍ Pesquisa de aberturas de xadrez





Pesquisando o "jogo espanhol" (ruy lopez)



Nosso método nos permitiu descobrir rapidamente as idéias de abertura mais comuns, que podem ajudar um pesquisador de xadrez.



Agora vamos ver outros exemplos de uso de gráficos do ego.



Food Comida saudável



Repolho! Gostoso!



Mas e se você desejasse substituir um repolho bonito e incomparável por outra coisa? O gráfico do ego construído em torno do repolho ( kale) o ajudará com isso .





Gráfico de ego para consulta de couve com raio 25



BuyEu comprei um cachorro



Há tantos cães e tão pouco tempo ... Eu preciso de um cachorro. Mas qual deles? Talvez algo como um poodle ( poodle)?





Gráfico de ego para consulta de poodle com raio 18



▍ Procurando por amor



Cachorro e repolho não mudam nada? Precisa encontrar sua alma gêmea? Se assim for - aqui está um gráfico do ego pequeno, mas muito auto-suficiente, que pode ajudar com isso.





Gráfico ego para pedido café encontra bagel com raio 18



"E se os aplicativos de namoro não ajudarem?



Se os aplicativos de namoro não forem úteis, você pode assistir ao programa em vez de sair com um sorvete com sabor de repolho (ou um sorvete com sabor de foguete descoberto recentemente). Se você gosta de The Office (certamente o filmado no Reino Unido), também pode gostar de alguns dos outros programas.





Gráfico de ego para consultar o escritório com um raio de 25



Resultado



Isso conclui minha história sobre o uso da palavra "vs" nas pesquisas do Google e sobre gráficos do ego. Espero que tudo isso o ajude pelo menos um pouco na sua busca por amor, um bom cachorro e comida saudável.



Você usa truques incomuns ao pesquisar na Internet?






All Articles