Tópico: Lei dos pequenos números
Nessa seção estudaremos como se comportam limites de algumas variáveis aleatórias bastante importantes, mas primeiramente, uma breve intuição.
Apesar de que descreveremos a nossa motivação a partir desse exemplo do estudo de um material radioativo, podemos encontrar aplicações com justificativas bastante semelhantes para outros problemas, como: chegada de carros em um sinal de trânsito, número de mutações em um gene, número de mortes por ano em uma faixa etária…
Digamos que estamos observando um material radioativo que esporadicamente emite fótons que podemos detectar através de um aparelho.
A razão dessas emissões pode ser aproximada pelo seguinte modelo.
Na amostra temos um número grande de átomos instáveis () e em um determinado tempo de observação, cada um deles tem probabilidade muito baixa de decair emitindo um fóton (digamos ).
Nesse caso, supondo que todos decidam emitir de maneira independente, temos para ,
(2.30)
Dessa forma, o número total de emissões observadas para é
(2.31)
E gostaríamos de entender como se comporta essa distribuição, que nada mais é que .
Uma primeira tentativa seria modelar esse processo dizendo que o número de átomos é tão grande, que somente estamos interessados no comportamento assintótico quando vai para infinito.
Mas para manter o número de emissões sob controle, também gostaríamos que , que converge a zero.
Poderíamos por exemplo escolher
(2.32)
Mas a discussão que se segue é muito mais geral que essa escolha específica.
Como estaremos interessados em um regime assintótico da distribuição de (lembre que apesar do espaço amostral de variar com , sua distribuição é sempre uma probabilidade em ), precisamos de definir uma noção de distância entre duas distribuições em .
{definition}
Dadas duas distribuições e em , definimos
(2.33)
chamada de distância em variação total entre e .
No nosso caso, é enumerável.
Vamos ver que nesse caso é possível reescrever a definição acima de modo a ver mais facilmente que se trata de uma distância no espaço de probabilidades em .
{lemma}
Se for finito ou enumerável, então podemos escrever
(2.34)
Demonstração.
Para mostrar que o lado esquerdo é maior ou igual ao direito, escolhemos . Assim
(2.35)
donde
(2.36)
Na outra direção, observe que para todo ,
(2.37)
O que termina a prova do lema.
∎
Fica agora claro que determina uma distância.
{exercise}
Mostre um lema análogo ao anterior para qualquer, desde que e sejam absolutamente contínuas com relação à uma medida fixa nesse espaço mensurável. Nesse caso utilizaremos as derivadas de Radon–Nikodym.
Como estaremos interessados em variáveis independentes, precisamos de um resultado que relacione a distância em variação total com produtos de medida. Isso é parte do seguinte
{lemma}
Sejam distribuições em e distribuições em ambos enumeráveis. Então
(2.38)
Demonstração.
Basta expandir
(2.39)
onde acima usamos que e são probabilidades. Isso termina a prova do lema.
∎
Finalmente, gostaríamos de entender como a distância de variação total se comporta com respeito à soma de variáveis independentes.
Isso estará ligado à convolução de distribuições:
{definition}
Dadas, e distribuições em , definimos a distribuição
(2.40)
Essa definição se relaciona com a soma de variáveis independentes graças ao seguinte
{exercise}
Se e são variáveis aleatórias inteiras e independentes, então .
Dica: particione o espaço amostral nos eventos , para , como na prova do Lema 2 abaixo.
{corollary}
Se e são distribuições em , então .
Como prometido, obtemos a seguinte relação entre a convolução e a distância de variação total.
{lemma}
Sejam , duas medidas em enumerável e um elemento aleatorio
(2.41)
Em particular se são distribuições em , então
(2.42)
Demonstração.
O segundo ponto segue do primeiro aplicado ao caso , e .
Para o primeiro, observamos
(2.43)
provando o lema.
∎
Para enunciar o resultado principal dessa seção, vamos apresentar uma distribuição em bastane importante, que em particular se comporta muito bem com respeito a somas de variáveis independentes, como veremos.
{definition}
Uma variável aleatória é dita ter distribuição de Poisson com parâmetro , se
(2.44)
Denotamos isso por .
A distribuição de Poisson se comporta bem com respeito a somas independentes, como mostra o seguinte
{lemma}
Sejam e independentes, então .
Demonstração.
Basta calcular
(2.45)
mostrando o resultado.
∎
Nossa próxima tarefa é estimar a distância entre uma variável aleatória com distribuição e uma , como segue.
{lemma}
Para , seja e , então,
(2.46)
Demonstração.
Sabemos que
(2.47)
terminando a prova.
∎
O teorema principal de convergência dessa seção concerne a soma de variáveis Bernoulli.
{theorem}
[Lei dos Pequenos Números]
Dado, e , suponha que , e sejam dados como em (2.30).
Então,
(2.48)
Demonstração.
Basta observar que
(2.49)
provando o teorema.
∎
{corollary}
No mesmo contexto do teorema acima, se , então temos
(2.50)
que converge a zero com .
Veremos mais tarde que existem outros tipos de convergência.
{exercise}
Fixado , seja uma variável aleatória com distribuição Poisson(), isto é
(2.51)
Considere no mesmo espaço de probabilidade uma sequência de variáveis aleatórias que sejam \iid, com distribuição e independentes de .
-
a)
Calcule a distribuição de .
-
b)
Mostre que e são independentes.