
Habr, olá!
No laboratório de modelagem de sistemas naturais do National Center for Cognitive Development da ITMO University, estamos pesquisando ativamente o uso de aprendizado de máquina automático para várias tarefas. Neste artigo, queremos falar sobre o uso do AutoML para previsão eficiente de séries temporais, bem como como isso é implementado na estrutura de código aberto FEDOT . Este é o segundo artigo de uma série de publicações dedicadas a esse desenvolvimento (a primeira delas pode ser encontrada aqui ).
Todos os detalhes estão sob o corte!
Aprendizado de máquina automático (AutoML)
A ciência de dados moderna se tornou uma parte muito popular da esfera de TI. Especialistas coletam dados, limpam, experimentam diferentes modelos, realizam validação e escolhem os melhores. E tudo isso para oferecer ao negócio a solução que mais agregue valor. Ao mesmo tempo, algumas etapas de obtenção dessas soluções são cada vez mais automatizadas a cada ano. Como regra, isso se aplica às partes mais rotineiras. Isso libera o tempo dos especialistas para tarefas mais importantes.
Então, vamos imaginar que um especialista se depara com a tarefa de construir um modelo de aprendizado de máquina e “envolvê-lo” em um serviço da web para que esse mesmo modelo faça um trabalho útil - prever algo. Mas antes de chegar ao estágio de treinamento do modelo, você precisa passar por várias etapas, incluindo:
- colete dados de muitas fontes, limpe-os;
- , , ;
- , ;
- .
, , . , , , , . , - , . — MLFlow, Apache AirFlow . — - workflow management system (WMS) . .
, ?
, “”, . “” ML .
. , , open-source, TPOT, AutoGluon, MLJAR H2O. AutoML “ , ( ) ”. , . ( ) , : TPOT FEDOT.
SaaS-, DataRobot, GoogleAutoTables, Amazon SageMaker, ML , AutoML.
, AutoML : . , , . , .
, , open-source . , — ( ).
, . : , . : , , — . AutoML legacy — , ( “ ”) : , .
, - , — . open-source — AutoTS. “” — AR ARIMA. “” , ( ), . , , pmdarima.
— AutoML- . . , , H2O, . , open-source , , , . .
AutoML-?
, , . :
- (, , — , — );
- ;
- () ;
- ( -);
- in-sample out-of-sample ;
- — ?
, , , — .
AutoML . , , data-driven , .. , .. - .
AutoML, . , open-source AutoML , — FEDOT.
, , — . , , , (, ). .
, , . , , .. , , , . , , baseline .
, , (, , ).
. , , . FEDOT, , .
, FEDOT , :
- — , : (, , ) , ;
- — , . . Primary , Secondary — ;
- — , . FEDOT ( Chain).
:
, FEDOT
, , , .
. “”, — . — . — “” AutoML. , . , — .
FEDOT
, . FEDOT- . ? , , ? ?
! .
. — , . , . , , :

“lagged-“ . FEDOT “lagged”. — .
1 . , . muli-target . :

. 3 lagged
. , AR ARIMA. , .
: — . — . ⋅.

, , . — , , . , .
14 . , — .
, . , . , , jupyter notebook’.
— . FEDOT :
- , ;
- ;
- .
, , , . . . . .
, ,
lagged-, , ridge- (. ), “”.
, — “”. , , .
. , , . , , . ( ) . — — . . , , , . ( ) , — .
:
! “” . . . () (). FEDOT.
, :
(, — )
.
AutoML. FEDOT , API.
, “”. AutoML :
- — . , , . , , “” . ;
- — , , . , .
:
.
. : (MAE) (RMSE): MAE — 100.52, RMSE — 120.42.
, : ?
: . . 14 . 14 ( 42). in-sample .
, out-of-sample in-sample :
. in-sample out-of-sample
, 14 . 28 — 2 14 . , (out-of-sample).
, in-sample . ( ). , , .
FEDOT — 3- 14 . . . , , .
14 .
. , , .
( ). , ,
, . , , , . , .
— K- , . , . K- . — .
, , , .
, “” ,
, — , 1000 ⋅, 0. . (, ) . K-nn . , , : MAE — 88.19 RMSE — 177.31.
, - . 5 . , , .
: . , , . , -, ( ). : . , FEDOT , . !
FEDOT open-source — AutoTS pmdarima. Jupyter notebook , , . , . 3 , . ( - ):
| ∓ | RMSE∓CKO | |
|---|---|---|
| pmdarima | 155∓1 | 196∓1 |
| AutoTS | 198∓22 | 236∓41 |
| FEDOT | 110∓14 | 170∓26 |
:

, FEDOT “ ”.
, , AutoML. , ML-, .
AutoML FEDOT: , . FEDOT .
:
AutoML, FEDOT!
Trabalharam no artigo: Mikhail Sarafanov , Pavel Vychuzhanin e Nikolai Nikitin .
