
fundo
Nos Ășltimos dois anos, o mercado de sistemas de monitoramento foi agitado pela sigla AIOps. Todos os fornecedores começaram a buscar o uso de inteligĂȘncia artificial em seus sistemas complexos e caros. Os termos âanĂĄlise de causa raizâ, âcorrelaçãoâ, âferramentas de MLâ, âdetecção de anomaliasâ, âprevisĂŁo de incidentesâ, âredução de ruĂdoâ sĂŁo completa e provavelmente para sempre definidos em materiais de marketing e sites de vĂĄrios sistemas de monitoramento.
Como sabemos, brochuras publicitĂĄrias sĂŁo uma coisa, mas projetar a vida cotidiana Ă© outra. Provavelmente, muitos enfrentaram uma situação quando as promessas dos vendedores de certas inovaçÔes tecnolĂłgicas colidiram, como o Titanic com um iceberg, com a prĂĄtica de implementação, principalmente no complexo ambiente de TI de grandes empresas. Portanto, inicialmente olhei com grande ceticismo e nĂŁo compartilhei o entusiasmo em torno deste tĂłpico. AlĂ©m disso, quando existem soluçÔes de concreto armado como Zabbix, Prometheus e Elastic. Mas hype hyip, ceticismo, ceticismo, e ainda somos engenheiros e devemos verificar e estudar tudo na prĂĄtica, e nĂŁo nos perguntarmos se acreditamos ou nĂŁo no âbotĂŁo mĂĄgicoâ de fornecedores eminentes e startups promissoras. E assim, apĂłs outra apresentação do integrador e promessas de muito dinheiro "o paraĂso em nossa terra pecaminosa de engenheiros de operação", reunimos um pequeno grupo de iniciativa,que decidiu âsentirâ o que esta mĂĄgica da inteligĂȘncia artificial e do aprendizado de mĂĄquina representa em nossa prĂĄtica. Assim, nasceram materiais e atĂ© um pequeno projeto pet que gostaria de compartilhar com vocĂȘs.
â , . . - . : -. â â â, .. , â â, . â â â.
ML- . , . - , .
. HTTP- . ââ, . , downdetector , , , ;)
2020-10-14 14:00 +03:00 38 ( ), .. [2020-10-12 23:00:00 +03:00 â 2020-10-14 14:00 +03:00]. : 3612.
(threshold), , 0, 1, 179 . (. . 1: . UTC. ,
).
. 1. . UTC. , â .
, 3- , 44 (. . 2). 4 . â0110010011101010âŠâ, , , % ( 1 ), - .
. 2. 3- . , â .
ââ : - , . - , . , AI/ML.
ML?
, , Data Scientist . , , -, , 3- :
- . â , .
- , , , .
- , , "" . .. " " , , .
DetectIidSpike ML.NET. : . , . "" , . .
DetectIidSpike :
- confidence â [0, 100]. , , , , ;
- pvalueHistoryLength â p-value. - " ", .
, . HTTP- , .. . . - . , .. 5 : . , , .. . (, ), "", .
ââ. , , , (), «» ( ). 5 . , websockets , . , ( kubernetes ).
(confidence: 95, pvalueHistoryLength: 5), 36 . , , .. . , 24 . (, ).
. 3. (confidence: 95, pvalueHistoryLength: 5) , â
(. 3), , . , , ( ).
. 4 pvalueHistoryLength=12 confidence: 98. : 14 .
. 4. (confidence: 98, pvalueHistoryLength: 12)
, DetectIidSpike (24 44) 3 , 7,5 (24 179) . , , . , ML . , :)
P.S.: ML, -, . .
PPS: Abaixo darei mais alguns screenshots do nosso pet-projeto com os dados reais das verificaçÔes realizadas e as anomalias geradas. VocĂȘ pode ver com que eficiĂȘncia ou ineficaz (para quem como) o algoritmo funciona (cĂrculo amarelo - anomalias no intervalo selecionado).


