Muitos, provavelmente, já viram o filme "Cavaleiros da Justiça", onde cientistas de dados, baseados em um conjunto de fatos sobre o ataque terrorista, quase resolveram o crime, mas cometeram um erro, cuja probabilidade era criticamente pequena. Vamos discutir alguns aspectos do viés de dados que são repletos de decisões perigosas.
Razões de enviesamento de dados
— , , , - (, , - ).
, - : , , , . , , , , (, , ), , .
. , - — , , - -, . , - , , - . , , , .
, , . , , , : - , .
, -, - .
: , , , : , … - . . :
, , , ;
;
, , ;
, , ..
, . , . , , , , , (, - «300» «400-700»), , , , , .
, , — - .
- — , .
, . , , , , , , , - , -5 . , - , , , , «», , .
, . , , — , .
,
? , .
, — . , . , «» : , ( - !) . : , . , , , . , , , , , - — , - . — , , .
, , . , - , - — , . : ; , ; , , , , , . «-» (, ), , .
, . :)
, " "