SERP: Melhorando o Algoritmo para Mercados Usando Inteligência Artificial

Uma plataforma universal para a criação de marketplaces, adequada para projetos de negócios completamente distintos, desde mercearias a serviços de recrutamento, requer aprimoramento constante, uma vez que as crescentes demandas por serviços online hoje já exigem o trabalho de inteligência artificial. E a satisfação do cliente com os resultados da pesquisa e, consequentemente, o sucesso do negócio, depende da correta configuração dos sistemas de IA.





Como exemplo, podemos tomar a pesquisa contextual usada nos motores de busca. Todo mecanismo de busca tenta vencer a competição e melhorar a qualidade da busca, mas em um mundo que muda rapidamente, o significado das expressões verbais pode mudar significativamente. Por exemplo, ao solicitar a palavra "feed", o buscador oferecia anteriormente o resultado "fita de cetim", enquanto agora os resultados da pesquisa mostram informações sobre uma rede de lojas e um portal de informações. Mas a inteligência artificial vem ao resgate na emissão dos resultados, o que ajuda a corrigir os resultados em tempo recorde.





Digamos que um pedaço de texto defina a palavra "fita" como parte de um pacote bonito. Para simplificar, classificamos todos os significados desta palavra sem esclarecimento, por exemplo, devido a redes ultraprecisas - Redes Neurais Convolucionais (CNN). Esta arquitetura CNN usa o chamado conjunto de redes ultracurtas e recorrentes e na saída dá uma definição relevante da palavra "fita" com base no conteúdo semântico do texto. Os dados de entrada são uma matriz com uma altura fixa  n. Além disso, cada linha é um mapeamento vetorial do identificador, ou seja, palavras no espaço de recursos de dimensão  k... Para criar um espaço de recursos, é conveniente usar as ferramentas de semântica de distribuição FastText, Glove, Word2mVec. A matriz é processada por filtros com largura fixa, que são iguais à dimensão do espaço do recurso. Para selecionar seus tamanhos, o parâmetro da altura das linhas adjacentes h é selecionado . Consequentemente, o tamanho da matriz de saída depende da altura do filtro e da matriz original. Após esta etapa, o mapa de feições é processado por uma camada de subamostragem, reduzindo a dimensão do mapa de feições gerado, e é alocado para cada convolução, e as informações dominantes são extraídas. Em seguida, os mapas de características são combinados em um vetor de características, que é incluído no cálculo dos rótulos finais da classe.





, , , . , . CBOW, , . : softmax – , , . , k . (2k+1). .





skip-gram, , , .





, . , , – , , , – . : -, -. – , .





, – , , , 5 .





-

. , , , , .





, 45 , , , . , , . «», , , , , .





. , . , .  . , . «» . . Negative Sampling. «» :





s (x, ω)

, , :





s (x, ω)

  .





-s (x, ω)

– .





. .





Uma combinação equilibrada de algoritmos de classificação melhorará a qualidade de todo o sistema. Mas não devemos esquecer as exceções, porque o sistema de classificação do Google observou que seu mecanismo de pesquisa ainda não está pronto para finalmente confiar a classificação a algoritmos de aprendizado de máquina. Os modelos gerados automaticamente podem se comportar de maneira imprevisível em novas classes de consultas que não são como as consultas do conjunto de treinamento em comparação com os modelos criados por especialistas humanos.








All Articles