Previsão de série temporal com AutoML







Habr, olá!







No laboratório de modelagem de sistemas naturais do National Center for Cognitive Development da ITMO University, estamos pesquisando ativamente o uso de aprendizado de máquina automático para várias tarefas. Neste artigo, queremos falar sobre o uso do AutoML para previsão eficiente de séries temporais, bem como como isso é implementado na estrutura de código aberto FEDOT . Este é o segundo artigo de uma série de publicações dedicadas a esse desenvolvimento (a primeira delas pode ser encontrada aqui ).







Todos os detalhes estão sob o corte!







Aprendizado de máquina automático (AutoML)



A ciência de dados moderna se tornou uma parte muito popular da esfera de TI. Especialistas coletam dados, limpam, experimentam diferentes modelos, realizam validação e escolhem os melhores. E tudo isso para oferecer ao negócio a solução que mais agregue valor. Ao mesmo tempo, algumas etapas de obtenção dessas soluções são cada vez mais automatizadas a cada ano. Como regra, isso se aplica às partes mais rotineiras. Isso libera o tempo dos especialistas para tarefas mais importantes.







Então, vamos imaginar que um especialista se depara com a tarefa de construir um modelo de aprendizado de máquina e “envolvê-lo” em um serviço da web para que esse mesmo modelo faça um trabalho útil - prever algo. Mas antes de chegar ao estágio de treinamento do modelo, você precisa passar por várias etapas, incluindo:







  • colete dados de muitas fontes, limpe-os;
  • , , ;
  • , ;
  • .


, , . , , , , . , - , . — MLFlow, Apache AirFlow . — - workflow management system (WMS) . .







, ?







, “”, . “” ML .

. , , open-source, TPOT, AutoGluon, MLJAR H2O. AutoML “ , ( ) ”. , . ( ) , : TPOT FEDOT.







SaaS-, DataRobot, GoogleAutoTables, Amazon SageMaker, ML , AutoML.







, AutoML : . , , . , .









, , open-source . , — ( ).







, . : , . : , , — . AutoML legacy — , ( “ ”) : , .







, - , — . open-source — AutoTS. “” — AR ARIMA. “” , ( ), . , , pmdarima.







— AutoML- . . , , H2O, . , open-source , , , . .







AutoML-?







, , . :

  • (, , — , — );
  • ;
  • () ;
  • ( -);
  • in-sample out-of-sample ;
  • — ?

    , , , — .


AutoML . , , data-driven , .. , .. - .







— , 2018 . FEDOT — 2020 .







AutoML, . , open-source AutoML , — FEDOT.







, , — . , , , (, ). .

, , . , , .. , , , . , , baseline .







, , (, , ).







, , . , AutoML FEDOT, .







FEDOT

. , , . FEDOT, , .







, FEDOT , :







  • — , : (, , ) , ;
  • — , . . Primary , Secondary — ;
  • — , . FEDOT ( Chain).


:



, FEDOT







, , , .







. “”, — . — . — “” AutoML. , . , — .







FEDOT



, . FEDOT- . ? , , ? ?







! .

, — : SSA , . H2O. .







. — , . , . , , :















“lagged-“ . FEDOT “lagged”. — .







1 . , . muli-target . :













. 3 lagged







. , AR ARIMA. , .









. — “US airline passengers” :













— , - . , , AutoML . , .







: — . — . ⋅.



















, , . — , , . , .







14 . , — .







, . , . , , jupyter notebook’.









— . FEDOT :







  • , ;
  • ;
  • .


, , , . . . . .









, ,







lagged-, , ridge- (. ), “”.









, — “”. , , .







,

. , , . , , . ( ) . — — . . , , , . ( ) , — .







:















! “” . . . () (). FEDOT.







, :









(, — )







.









AutoML. FEDOT , API.







, “”. AutoML :







  • — . , , . , , “” . ;
  • — , , . , .


:









.







. : (MAE) (RMSE): MAE — 100.52, RMSE — 120.42.









, : ?







: . . 14 . 14 ( 42). in-sample .

, out-of-sample in-sample :









. in-sample out-of-sample







, 14 . 28 — 2 14 . , (out-of-sample).







, in-sample . ( ). , , .







FEDOT — 3- 14 . . . , , .









14 .







. , , .









( ). , ,







, . , , , . , .







— K- , . , . K- . — .

, , , .









, “” ,







, — , 1000 ⋅, 0. . (, ) . K-nn . , , : MAE — 88.19 RMSE — 177.31.







, - . 5 . , , .







: AutoTS pmdarima

: . , , . , -, ( ). : . , FEDOT , . !







FEDOT open-source — AutoTS pmdarima. Jupyter notebook , , . , . 3 , . ( - ):







RMSE∓CKO
pmdarima 155∓1 196∓1
AutoTS 198∓22 236∓41
FEDOT 110∓14 170∓26


:







, FEDOT “ ”.









, , AutoML. , ML-, .







AutoML FEDOT: , . FEDOT .







( ) .







:









AutoML, FEDOT!







Trabalharam no artigo: Mikhail Sarafanov , Pavel Vychuzhanin e Nikolai Nikitin .








All Articles