16 Somas de variáveis aleatórias independentes

Somas de variáveis aleatórias independentes surgem em muitos contextos diferentes. Dadas duas variáveis aleatórias independentes XX e YY, qual é a distribuição de X+YX+Y?

Se XX e YY são ambas discretas, X+YX+Y é discreta e sua função de massa de probabilidade pode ser calculada usando a Lei da Probabilidade Total:

pX+Y(z)\displaystyle p_{X+Y}(z) =x(X=x,Y=zx)=x(X=x)(Y=zx)\displaystyle=\sum_{x}\mathbb{P}(X=x,Y=z-x)=\sum_{x}\mathbb{P}(X=x)\mathbb{P}(% Y=z-x) (16.1)
=xpX(x)pY(zx).\displaystyle=\sum_{x}p_{X}(x)p_{Y}(z-x). (16.2)
Exemplo 16.3.

Suponha que XBinom(n,p)X\sim\mathrm{Binom}(n,p) e YBinom(m,p)Y\sim\mathrm{Binom}(m,p). A função de massa de probabilidade de X+YX+Y pode ser obtida da seguinte forma:

pX+Y(k)\displaystyle p_{X+Y}(k) =j=0(X=j)(Y=kj)\displaystyle=\sum_{j=0}^{\infty}\mathbb{P}(X=j)\mathbb{P}(Y=k-j) (16.4)
=j=0k(nj)pj(1p)nj(mkj)pkj(1p)mk+j\displaystyle=\sum_{j=0}^{k}\tbinom{n}{j}p^{j}(1-p)^{n-j}\tbinom{m}{k-j}p^{k-j% }(1-p)^{m-k+j} (16.5)
=pk(1p)m+nkj=0k(nj)(mkj)\displaystyle=p^{k}(1-p)^{m+n-k}\sum_{j=0}^{k}\tbinom{n}{j}\tbinom{m}{k-j} (16.6)
=(n+mk)pk(1p)m+nk.\displaystyle=\tbinom{n+m}{k}p^{k}(1-p)^{m+n-k}. (16.7)

Quando as variáveis XX e YY são independentes e têm densidades fXf_{X} e fYf_{Y}, temos a relação análoga a seguir

fX+Y(z)=+fX(x)fY(zx)dx.f_{X+Y}(z)=\int_{-\infty}^{+\infty}f_{X}(x)f_{Y}(z-x)\,\mathrm{d}x.
Exemplo 16.8 (Exponenciais e Gama).

Sejam XXYY independentes, ambas com a distribuição Exponencial com parâmetro λ>0\lambda>0, ou seja,

fX(x)=fY(x)={λeλxse x>0;0caso contrário.f_{X}(x)=f_{Y}(x)=\begin{cases}\lambda e^{-\lambda x}&\text{se }x>0;\\ 0&\text{caso contr\'{a}rio.}\end{cases}

Seja Z:=X+YZ:=X+Y. Queremos calcular

fZ(z)\displaystyle f_{Z}(z) =fX(x)fY(zx)dx.\displaystyle=\int_{-\infty}^{\infty}f_{X}(x)\cdot f_{Y}(z-x)\;\mathrm{d}x.

Agora, observe que o produto dentro da integral é igual a zero quando x<0x<0 (pois fX(x)=0f_{X}(x)=0 nesse caso) e quando x>zx>z (pois fY(zx)=0f_{Y}(z-x)=0 nesse caso). A integral é então igual a

0zλeλxλeλ(zx)dx\displaystyle\int_{0}^{z}\lambda e^{-\lambda x}\cdot\lambda e^{-\lambda(z-x)}% \;\mathrm{d}x =λ20zeλzdx=λ2zeλz.\displaystyle=\lambda^{2}\cdot\int_{0}^{z}e^{-\lambda z}\;\mathrm{d}x=\lambda^% {2}\cdot z\cdot e^{-\lambda z}.

A distribuição acima corresponde a uma distribuição Gama com parâmetros 22 e λ\lambda. Em geral, ZZ tem distribuição Gama com parâmetros nn e λ\lambda se a sua densidade for dada por fZ(z)=λn(n1)!zn1eλxf_{Z}(z)=\frac{\lambda^{n}}{(n-1)!}\cdot z^{n-1}\cdot e^{-\lambda x} para z0z\geqslant 0.

O caso em que XX e YY são normais é tão importante que o apresentamos como uma proposição.

Proposição 16.9.

Se X1𝒩(μ1,σ12)X_{1}\sim\mathcal{N}(\mu_{1},\sigma_{1}^{2}) e X2𝒩(μ2,σ22)X_{2}\sim\mathcal{N}(\mu_{2},\sigma_{2}^{2}) são independentes. Então X1+X2𝒩(μ1+μ2,σ12+σ22)X_{1}+X_{2}\sim\mathcal{N}(\mu_{1}+\mu_{2},\sigma_{1}^{2}+\sigma_{2}^{2}).

Demonstração.

Como X1μ1𝒩(0,σ12)X_{1}-\mu_{1}\sim\mathcal{N}(0,\sigma_{1}^{2}) e X2μ2𝒩(0,σ22)X_{2}-\mu_{2}\sim\mathcal{N}(0,\sigma_{2}^{2}), podemos supor que μ1=μ2=0\mu_{1}=\mu_{2}=0. Após manipulações algébricas longas e trabalhosas, é possível obter

fX+Y(z)=12πσ1σ2+e(zx)22σ22ex22σ12dx==12π(σ12+σ22)ez22(σ12+σ22).\displaystyle f_{X+Y}(z)=\frac{1}{2\pi\sigma_{1}\sigma_{2}}\int_{-\infty}^{+% \infty}e^{-\frac{(z-x)^{2}}{2\sigma_{2}^{2}}}e^{-\frac{x^{2}}{2\sigma_{1}^{2}}% }\,\mathrm{d}x=\cdots=\tfrac{1}{\sqrt{2\pi(\sigma_{1}^{2}+\sigma_{2}^{2})}}% \cdot e^{-\frac{z^{2}}{2(\sigma_{1}^{2}+\sigma_{2}^{2})}}. (16.10)

Portanto, fX+Yf_{X+Y} é a densidade correspondente à distribuição 𝒩(0,σ12+σ22)\mathcal{N}(0,\sigma_{1}^{2}+\sigma_{2}^{2}), que era o que queríamos mostrar. ∎