Muito se tem escrito sobre a lei dos grandes números (zbch) (por exemplo, em inglês, aqui e aqui , também [1]). Neste texto, tentarei falar sobre o que a lei dos grandes números não é - sobre a percepção errônea dessa lei e as armadilhas potenciais ocultas nas formulações matemáticas.
Vamos começar com o que é a lei dos grandes números. Informalmente, este é um teorema matemático de que "a probabilidade de desvios da média da amostra em relação à expectativa matemática é pequena" e que "essa probabilidade tende a zero à medida que a amostra cresce". Bastante informalo teorema afirma que com podemos estar razoavelmente certos de que a média de nossa amostra é próxima o suficiente da média "real" e, portanto, a descreve bem. Claro, a presença de "bagagem" estatística tradicional é assumida - nossas observações da amostra devem descrever o mesmo fenômeno, devem ser independentes, e o pensamento de que existe alguma distribuição "real" com uma média "real" não deve nos causar dúvidas significativas.
Quando formulamos a lei, dizemos “média amostral” e qualquer coisa que possa ser matematicamente escrita como tal média se enquadra na lei. Por exemplo, a participação de eventos na massa total pode ser registrada como uma média - só precisamos registrar a presença de um evento como "1" e a ausência como "0". Como resultado, a média será igual à frequência e a frequência deve ser próxima à média teórica. É por isso que esperamos que a porcentagem de caras seja próxima de ½ ao lançar uma moeda perfeita.
Considere agora as armadilhas e os equívocos sobre esta lei.
Primeiro, o ZBCH nem sempre é correto. Este é apenas um teorema matemático com "entradas" - suposições. Se as suposições estiverem erradas, a lei não precisa ser implementada. Por exemplo, é assim se as observações são dependentes, ou se não há certeza de que a média "real" existe e, claro, ou se o fenômeno em estudo muda com o tempo e não podemos dizer que observamos a mesma quantidade. Na verdade, até certo ponto, o ZBC também é verdadeiro nesses casos, por exemplo, para observações fracamente correlacionadas ou mesmo no caso em que o valor observado muda ao longo do tempo. No entanto, para aplicar isso corretamente à realidade imediata, é necessário um matemático especialista bem treinado.
Em segundo lugar, parece ser verdade que o ZBR afirma que "a média da amostra está próxima da média verdadeira". No entanto, esta afirmação permanece incompleta: é imperativo acrescentar “com alto grau de probabilidade; e essa probabilidade é sempre inferior a 100%. "
Em terceiro lugar, gostaria de formular o ZBP como “a média da amostra converge para a média real com crescimento ilimitado da amostra”. No entanto, isso não é verdade porque a média da amostra não converge de forma alguma, pois é aleatória e assim permanece para qualquer tamanho de amostra. Por exemplo, mesmo que você lance uma moeda simétrica um milhão de vezes, mesmo assim, há uma chance de que a proporção de caras esteja longe de ½ ou até zero. Em certo sentido, sempre há uma chance de obter algo fora do comum. Devemos admitir, entretanto, que nossa intuição ainda nos diz que o ZBP deve descrever algum tipo de semelhança, e é realmente o caso. Só que não é a média que "converge", mas a "probabilidade de desvio da média da amostra de seu valor verdadeiro" e converge para zero. Uma vez que esta ideia é intuitivamente muito conveniente ("as chances de ver algo incomum tendem a zero"),os matemáticos inventaram para isso um tipo especial de convergência - "convergência em probabilidade".
Quarto, o ZBH nada diz sobre quando a média amostral pode ser considerada próxima o suficiente da teórica. A lei dos grandes números apenas postula a existência de um determinado fenômeno, não diz nada sobre quando ele pode ser usado. Acontece que a lei dos grandes números não responde à questão-chave do ponto de vista da prática - "posso usar ZBP para minha amostra de tamanho n?" Outros teoremas fornecem respostas a essas perguntas, por exemplo, o Teorema do Limite Central. Dá uma ideia de até que ponto a média da amostra pode se desviar de seu valor real.
Em conclusão, o papel central da ZBP na estatística e na teoria da probabilidade deve ser observado. A história dessa lei começou quando os cientistas notaram que as frequências de alguns fenômenos recorrentes se estabilizam e param de mudar significativamente, sujeitas a repetidas repetições de experiência ou observação. Surpreendentemente, essa "estabilização de frequência" foi observada para fenômenos completamente não relacionados - de lançamentos de dados a rendimentos agrícolas, indicando a possível existência de uma "lei da natureza". Curiosamente, essa lei da natureza acabou por ser uma parte da matemática, e não da física, química ou biologia, como geralmente é o caso com as leis da natureza.
[1] Ilustrando a Lei dos Grandes Números (e intervalos de confiança) Jeffrey D Blume e Richard M Royall