Os melhores produtos de dados nascem nos campos

A maioria dos nossos pedidos on-line é coletada em depósitos, e não em armazéns. Isso leva a erros entre o que é mostrado no site e o que podemos realmente montar em um pedido online .

Devido à alta taxa de rotatividade de mercadorias nas lojas e à complexidade dos sistemas de gerenciamento de estoque, ocorrem erros que podem ser detectados automaticamente. Com base em nosso conhecimento de sistemas e usando engenharia social, propusemos uma solução que nos permitisse encontrar automaticamente produtos problemáticos e ajustar seu estoque antes da publicação no site.





imagem



,    « ».    2011 . (  ,   13, 107),       ,   Data- .



«»



   ,   ,   «».       ,  .



  •  —  .
  •  — ,     .
  •  — .
  •  — .
  •  — 5   .




,   ,      « »,  98%         .



8 000 .  , 40 000   .   , ?   ,   , ,   ,  ,  .   ,      - , , - « ».   ,   ,     -  .



-    ,  —   .



  ,     ,     Data Accelerator.  — data-,   data-driven.  Data Accelerator 126 ,   5      — « »,     .



 ,    ,   ,   . ,    .



  : Data Scientist, Data Engineer, Data Analyst, Product Owner  Scrum-.



:



  • ,     (  );
  •  eCom,    .


 , .





,    ,  ,  :   . ,   ,   3 , ,    ,   6 . , , ,    …



      ,       . . « » ,   ,   .



,  —    . ,    ,        .   ,     ,   1. , , ,    .   .  .



imagem

 — .  ,   . , , .   2500 ,   43,    .        «».



imagem



,   excel-,  ,     excel-  :   ,   .   ,  , ,   , , .



,   ,  60%   , .      ,    81%, ,  -, .



MVP.



 6 ,   proof of concept   , ,   ,  .    ,   ,   .

, , ,   ,   ,    — ,   , .    ,     , , .



«-1».



  ,   ,   : « ,   , , , ».     , , « » ,    .     4  , .



   ,   . -,   ,   , - , , .     ,       . -, ,        . ,  ,      .



ML-.



,   ML-,     6 .   ML-?



  •    Catboost,   ,     .
  •     ,        .
  •     ,     ,  ,  ,   ,  ,    .
  •   70 .
  •     ,   Permutation Importance  ,   Catboost.
  •   ,       80/20.
  •   ,     .
  • ,    ,     ,    train/valid-.
  •     DVC,    S3.


  :



  • ROC-AUC: 0.68
  • Recall: 0.77




 —    .   ,   DataLake   GreenPlum.   ,  MongoDB,  .   GreenPlum  MongoDB   opensource- Apache- Apache AirFlow  Apache NiFi.



Python-,  Kubernetes.     ,   -   Apache Kafka,   ,         Apache Kafka.



imagem



  6    ,   15%    12%,   E-com   . ,   ,   .



  ,    ,    .   ,    — ,   ,     .           .



p.s. Avito.Tech, .






All Articles