8 A Lei dos Grandes Números

Um dos principais tópicos da Probabilidade é a "lei dos grandes números". Ela afirma que a soma de um grande número de variáveis independentes tende a se aproximar da esperança. Mais precisamente, a média observada X1++Xnn\frac{X_{1}+\dots+X_{n}}{n}, que é aleatória, se aproximará da média teórica 𝔼[X1++Xnn]\mathbb{E}[\frac{X_{1}+\dots+X_{n}}{n}], que é determinística!

A manifestação mais simples desse fenômeno diz respeito às frequências relativas. Imagine que executamos um experimento muitas vezes, sob as mesmas condições, e contamos quantas vezes resultou em sucesso e quantas vezes resultou em fracasso. Tomando XnX_{n} como o indicador de que o nn-ésimo teste resultou em sucesso, a frequência relativa de sucesso é exatamente dada por X1++Xnn\frac{X_{1}+\dots+X_{n}}{n}. Enquanto escrevia esse preâmbulo, os palestrantes simularam o lançamento de uma moeda justa um milhão de vezes e obtiveram "Cara"499.947 vezes. Repetindo o mesmo procedimento, eles obtiveram "Cara"499.508 vezes, depois 500.318 vezes e, em seguida, 500.512 vezes. Obviamente, algo está acontecendo aqui. Conforme previsto pela lei dos grandes números, a frequência relativa sempre foi muito próxima da probabilidade de obter "Cara"em cada lançamento da moeda, que é exatamente 12\frac{1}{2}. Intuitivamente, tendemos a associar a probabilidade de sucesso à frequência relativa de sucessos, e essa associação está quase arraigada em nosso pensamento.

Mais genericamente, o resultado relevante de cada experimento não precisa ser 0 ou 11 para representar fracasso ou sucesso. Pode ser qualquer variável aleatória. Antes de escrever este parágrafo, os palestrantes lançaram um dado 10 vezes, e a soma dos valores obtidos foi 38. Repetindo o mesmo procedimento, eles obtiveram 33, 28, 37 e, finalmente, 43. Não parece muito com essa soma estar bem concentrada perto de algum valor determinístico. No entanto, as palestras prosseguiram com a simulação de 10.000 lançamentos do dado, e a soma dos resultados foi 35.082. Repetindo esse procedimento, eles obtiveram uma soma de 34.769, depois 35.419 e, finalmente, 34.691. Conforme previsto pela lei dos grandes números, quando o número de lançamentos dos dados era grande, a média observada estava sempre próxima da média teórica, dada por 𝔼[X1]=72\mathbb{E}[X_{1}]=\frac{7}{2}.

Na teoria da Probabilidade, a lei dos grandes números não é apenas uma história ou um fenômeno misterioso, é um teorema que pode ter muitas formulações diferentes. Aqui consideraremos a versão mais simples possível.

Teorema 8.1 (Lei dos Grandes Números).

Se X1,X2,X3,X_{1},X_{2},X_{3},\dots forem variáveis aleatórias discretas independentes duas a duas e com variância quadrática integrável, com a mesma média μ\mu e mesma variância σ2\sigma^{2}, então, para todo a>0a>0 e nn\in\mathbb{N},

(μaX1++Xnnμ+a)1σ2a2n.\mathbb{P}\Big{(}\mu-a\leqslant\frac{X_{1}+\dots+X_{n}}{n}\leqslant\mu+a\Big{)% }\geqslant 1-\frac{\sigma^{2}}{a^{2}\,n}.

A lei dos grandes números é comumente conhecida como a Lei dos Grandes Números.

Chamamos a atenção para o fato de que, não importa quão pequeno seja aa, essa probabilidade pode ser aproximada por 11, desde que escolhamos um valor grande o suficiente para nn (é claro, se aa for muito pequeno, precisaremos de um valor realmente muito grande para nn).

Nosso próximo objetivo é entender como tal estimativa de probabilidades surgiu. Até agora, usamos probabilidades para calcular esperanças e desvios padrão, e agora de repente estamos usando o desvio padrão para fazer estimativas extremamente interessantes sobre probabilidades!

Essa empreitada terá duas partes: entender qual é a variância da soma de muitas variáveis aleatórias e entender como a variância de uma variável aleatória fornece estimativas sobre a probabilidade de ela se desviar de sua média.