Hoje chamamos a sua atenção a análise (pesquisa) de bebidas alcoólicas da rede de lojas Lenta (doravante - Lenta), que se encontra no catálogo do site oficial da empresa.
Planejamento, preparação, amostragem
Por que você escolheu bebidas alcoólicas e esta empresa? Sim, é tudo muito simples - a primeira coisa que me vem à cabeça (sim, acontece) e uma grande variedade desse segmento. Acho que no futuro haverá uma análise dos produtos de outras empresas. Mas voltando aos nossos elementos de pesquisa de garrafa . Tendo estudado previamente a estrutura do próprio site da empresa, chegamos à conclusão que o catálogo de produtos é dinâmico em função da localização do objeto de venda e da variação do sortimento. Decidiu-se fazer uma amostragem em Moscou, em hipermercados. Claro que, sem ter dados precisos sobre o sortimento dos produtos alcoólicos da empresa, não se pode dizer que seja representativo, mas ainda acreditamos que está tudo bem. Tendo estudado o número de unidades de produtos nos catálogos do site por pontos de venda, obtemos que, em média, o mesmo, aqui.
Ferramentas analíticas
senior data analyst - python 3+, pandas , BeautifulSoup, request, csv, lxml , seaborn, matplotlib, plotly , Anaconda, JupyterLab Jupyternotebook, google sheets( ) brain.
( !) - (). (python). - , - , - «» ( ). .
, , () . , 101 . Jupyter .
.csv , , .
, () . , ( ) “ ” , , , , . “” python . , strip() replace(), , ₽.
price \xa0 - , ( ). replace() astype(float) float .
describe() . 986.78 . , 631.59 .
c matplotlib , . 2400 , .
Para uma análise aprofundada, vamos construir um gráfico de boxplot a partir da biblioteca plotly. Agora vemos que o valor esmagador das emissões começa em 2.420 rublos. E o maior lançamento foi o conhaque Hennessy XO por 1.6209 rublos. Usando o método sort_value (), descobrimos as cinco bebidas alcoólicas mais caras da Faixa de Opções.
Gostaria de lembrar que os preços e o sortimento são dinâmicos, então tudo pode mudar todos os dias.
Obrigado pela atenção, tudo de bom, seu konstatic.