5 Variáveis Aleatórias

5.1 Definição

Com frequência, estamos interessados em uma quantidade que é determinada como resultado de um experimento dado.

Por exemplo, considere um jogo de azar em que dois dados são lançados e você recebe uma recompensa em dinheiro dada pelo valor máximo obtido entre os dois dados. Como você modela essa situação? Como de costume, cada resultado é um par ω=(ω1,ω2)\omega=(\omega_{1},\omega_{2}) onde ambos ω1\omega_{1} e ω2\omega_{2} estão em {1,2,3,4,5,6}\{1,2,3,4,5,6\}. Isso é, Ω={1,2,3,4,5,6}2={1,2,3,4,5,6}×{1,2,3,4,5,6}\Omega=\{1,2,3,4,5,6\}^{2}=\{1,2,3,4,5,6\}\times\{1,2,3,4,5,6\}. A recompensa é determinada pelos valores de ω1\omega_{1} e ω2\omega_{2} por meio da tabela a seguir:

1234561£1£2£3£4£5£62£2£2£3£4£5£63£3£3£3£4£5£64£4£4£4£4£5£65£5£5£5£5£5£66£6£6£6£6£6£6\begin{array}[]{r|rrrrrr}&1&2&3&4&5&6\\ \hline\cr 1&\pounds 1&\pounds 2&\pounds 3&\pounds 4&\pounds 5&\pounds 6\\ 2&\pounds 2&\pounds 2&\pounds 3&\pounds 4&\pounds 5&\pounds 6\\ 3&\pounds 3&\pounds 3&\pounds 3&\pounds 4&\pounds 5&\pounds 6\\ 4&\pounds 4&\pounds 4&\pounds 4&\pounds 4&\pounds 5&\pounds 6\\ 5&\pounds 5&\pounds 5&\pounds 5&\pounds 5&\pounds 5&\pounds 6\\ 6&\pounds 6&\pounds 6&\pounds 6&\pounds 6&\pounds 6&\pounds 6\\ \end{array}

A palavra-chave aqui é ’determinada’: mesmo que o resultado seja aleatório, ele é aleatório apenas porque o resultado ω\omega é aleatório.

Matematicamente, isso significa que o prêmio XX pode ser escrito como uma função do resultado ω\omega. Em geral, uma variável aleatória é uma função

X:ΩX:\Omega\to\mathbb{R}

do espaço amostral para o conjunto dos números reais. Mais formalmente, exigimos que as condições especificadas em termos de XX sejam eventos aleatórios, ou seja, eventos que o observador pode determinar se ocorrem ou não.

Definição 5.1 (Variável Aleatória).

Sejam (Ω,,)(\Omega,\mathcal{F},\mathbb{P}) um espaço de probabilidade. Uma variável aleatória é uma função X:ΩX:\Omega\to\mathbb{R} tal que {ωΩ:X(ω)a}\{\omega\in\Omega:X(\omega)\leqslant a\}\in\mathcal{F} para todo aa\in\mathbb{R}.

No exemplo acima, podemos escrever XX explicitamente como a função que atribui a cada par (ω1,ω2)(\omega_{1},\omega_{2}) o valor máximo entre eles, ou seja, X((x,y))=max{x,y}X((x,y))=\max\{x,y\}.

Usando essa ferramenta, podemos fazer afirmações como

(X=1)=136,(X=5)=14,\mathbb{P}(X=1)=\frac{1}{36},\ \mathbb{P}(X=5)=\frac{1}{4},\ \dots
Notação.

Por conveniência, usaremos a notação simplificada

{X=5}={ωΩ:X(ω)=5}, e (X=5)=({X=5}),etc.\{X=5\}=\{\omega\in\Omega:X(\omega)=5\},\ \ \text{ e }\mathbb{P}(X=5)=\mathbb{% P}(\{X=5\}),\ \ \text{etc.}

É muito útil considerar a medida de probabilidade no conjunto dos números reais induzida por uma variável aleatória. Se estamos interessados apenas no valor de XX, podemos deixar (Ω,,)(\Omega,\mathcal{F},\mathbb{P}) de lado e tomar o espaço amostral como \mathbb{R}.

Definição 5.2 (Distribuição).

A distribuição de uma variável aleatória XX é a medida de probabilidade em \mathbb{R} denotada por X\mathbb{P}_{X} e dada por

X(B)=({ωΩ:X(ω)B})\mathbb{P}_{X}(B)=\mathbb{P}(\{\omega\in\Omega:X(\omega)\in B\})

para subconjuntos BB em algum espaço de eventos no conjunto dos números reais.

No exemplo anterior, X(B)\mathbb{P}_{X}(B) é determinada por seus valores

X({k})=2k136,k=1,2,3,4,5,6,X({1,2,3,4,5,6})=0.\mathbb{P}_{X}(\{k\})=\frac{2k-1}{36},\ k=1,2,3,4,5,6,\quad\mathbb{P}_{X}(% \mathbb{R}\setminus\{1,2,3,4,5,6\})=0.
Notação.

O espaço de eventos em \mathbb{R}, denotado por ()\mathcal{B}(\mathbb{R}), é um espaço de eventos que contém conjuntos como {x}\{x\} e (a,b](a,b]. Não entraremos em detalhes sobre a descrição de ()\mathcal{B}(\mathbb{R}). Você pode pensar nisso como a coleção de todos os conjuntos que podem ser obtidos aplicando um número contável de operações de conjuntos (união, interseção, complemento) a intervalos.

Observação 4.

O espaço Ω\Omega pode ser mais complicado do que \mathbb{R}. Em geral, (,(),X)(\mathbb{R},\mathcal{B}(\mathbb{R}),\mathbb{P}_{X}) pode ser mais simples do que (Ω,,)(\Omega,\mathcal{F},\mathbb{P}). Observe que X\mathbb{P}_{X} foi construído a partir de \mathbb{P} e XX. No entanto, não é possível reconstruir (Ω,,)(\Omega,\mathcal{F},\mathbb{P}) nem XX a partir de X\mathbb{P}_{X}.

Proposição 5.3.

A função X\mathbb{P}_{X} é uma medida de probabilidade em \mathbb{R}.

Demonstração.

Lembrando da Definição 3.11. Verificamos as três condições:

  1. (a)

    X(B)=(XB)[0,1]\mathbb{P}_{X}(B)=\mathbb{P}(X\in B)\in[0,1].

  2. (b)

    X()=({ωΩ:X(ω)})=(Ω)=1\mathbb{P}_{X}(\mathbb{R})=\mathbb{P}(\{\omega\in\Omega:X(\omega)\in\mathbb{R}% \})=\mathbb{P}(\Omega)=1.

  3. (c)

    Se B1,B2,B3,()B_{1},B_{2},B_{3},\dots\in\mathcal{B}(\mathbb{R}) são disjuntos, então

    X(n=1Bn)\displaystyle\mathbb{P}_{X}\left(\bigcup_{n=1}^{\infty}B_{n}\right) =({ω:X(ω)n=1Bn})\displaystyle=\mathbb{P}\left(\{\omega:X(\omega)\in\bigcup_{n=1}^{\infty}B_{n}% \}\right) (5.4)
    =(n=1{ω:X(ω)Bn})\displaystyle=\mathbb{P}\left(\bigcup_{n=1}^{\infty}\{\omega:X(\omega)\in B_{n% }\}\right) (5.5)
    =n=1({ω:X(ω)Bn})\displaystyle=\textstyle\sum_{n=1}^{\infty}\mathbb{P}\left(\{\omega:X(\omega)% \in B_{n}\}\right) (5.6)
    =n=1X(Bn).\displaystyle=\textstyle\sum_{n=1}^{\infty}\mathbb{P}_{X}(B_{n}). (5.7)

    Nas desigualdades acima, usamos: definição de X\mathbb{P}_{X}; que a pré-imagem da união é a união da pré-imagem; que a pré-imagem de conjuntos disjuntos é disjunta, combinada com a aditividade contável de \mathbb{P}; definição de X\mathbb{P}_{X}.

Isso prova a proposição. ∎

5.2 Variáveis Aleatórias Discretas

Definição 5.8 (Variável Aleatória Discreta).

Seja (Ω,,)(\Omega,\mathcal{F},\mathbb{P}) um espaço de probabilidade e XX uma variável aleatória. Dizemos que XX e X\mathbb{P}_{X} são discretos se existir um conjunto finito ou infinito contável SS\subseteq\mathbb{R} tal que (XS)=0\mathbb{P}(X\in\mathbb{R}\setminus S)=0.

Definição 5.9 (Função de Massa de Probabilidade).

Seja (Ω,,)(\Omega,\mathcal{F},\mathbb{P}) um espaço de probabilidade e XX uma variável aleatória discreta. Definimos a função de massa de probabilidade de XX como a função pX:[0,1]p_{X}:\mathbb{R}\to[0,1] dada por

pX(x)=X({x}).p_{X}(x)=\mathbb{P}_{X}(\{x\}).

Observe que pXp_{X} é construído a partir de X\mathbb{P}_{X}, e pXp_{X} é mais simples do que X\mathbb{P}_{X}, porque pXp_{X} recebe como entrada um número e X\mathbb{P}_{X} recebe como entrada um conjunto de números. Veremos abaixo que é possível reconstruir X\mathbb{P}_{X} a partir de pXp_{X} no caso em que X\mathbb{P}_{X} é discreto.

Definição 5.10 (Suporte discreto).

Seja (Ω,,)(\Omega,\mathcal{F},\mathbb{P}) um espaço de probabilidade e XX uma variável aleatória discreta. Definimos o suporte discreto de XX, ou, mais precisamente, o suporte discreto de sua distribuição X\mathbb{P}_{X}, como o conjunto

{x:pX(x)>0}.\{x\in\mathbb{R}:p_{X}(x)>0\}.

Como afirmado acima, para estudar X\mathbb{P}_{X}, é suficiente conhecer pXp_{X}.

Proposição 5.11.

Seja XX uma variável aleatória discreta. Então

X(B)=xBDXpX(x)\mathbb{P}_{X}(B)=\sum_{x\in B\cap D_{X}}p_{X}(x)

para todo B()B\in\mathcal{B}(\mathbb{R}), onde DXD_{X} denota o suporte discreto de XX.

Notação.

Antes de escrever a prova, precisamos explicar o significado de xBD\sum_{x\in B\cap D}. Uma vez que o conjunto BDB\cap D é contável, podemos escrever BD={x1,x2,x3,}B\cap D=\{x_{1},x_{2},x_{3},\dots\}, e podemos considerar xBDpX(x)\sum_{x\in B\cap D}p_{X}(x) como k=1pX(xk)\sum_{k=1}^{\infty}p_{X}(x_{k}). Precisamos ter cuidado aqui, pois usamos uma "enumeração"arbitrária de BDB\cap D. No entanto, uma vez que os termos na soma são não negativos, outra enumeração significaria reordenar os termos, o que não afeta o valor da soma.

Demonstração.

Pela definição de X\mathbb{P}_{X} ser discreta, existe um conjunto contável SS\subseteq\mathbb{R} tal que X(Sc)=0\mathbb{P}_{X}(S^{c})=0. Podemos decompor

X(B)=X(BS)+X(BSc).\mathbb{P}_{X}(B)=\mathbb{P}_{X}(B\cap S)+\mathbb{P}_{X}(B\cap S^{c}).

O segundo termo é zero, porque, uma vez que BScScB\cap S^{c}\subseteq S^{c},

0X(BSc)X(Sc)=0.0\leqslant\mathbb{P}_{X}(B\cap S^{c})\leqslant\mathbb{P}_{X}(S^{c})=0.

Portanto,

X(B)=X(BS)=X(xBS{x})=xBSX({x}).\mathbb{P}_{X}(B)=\mathbb{P}_{X}(B\cap S)=\mathbb{P}_{X}(\cup_{x\in B\cap S}\{% x\})=\sum_{x\in B\cap S}\mathbb{P}_{X}(\{x\}).

Se substituirmos DcD^{c} em vez de BB na fórmula acima, obtemos X(Dc)=xDcSX({x})=0\mathbb{P}_{X}(D^{c})=\sum_{x\in D^{c}\cap S}\mathbb{P}_{X}(\{x\})=0, porque X({x})=pX(x)=0\mathbb{P}_{X}(\{x\})=p_{X}(x)=0 para todo xDcx\in D^{c}.

Pelo mesmo argumento,

X(B)=X(BD)+X(BDc)=X(BD)=xBDpX(x),\mathbb{P}_{X}(B)=\mathbb{P}_{X}(B\cap D)+\mathbb{P}_{X}(B\cap D^{c})=\mathbb{% P}_{X}(B\cap D)=\sum_{x\in B\cap D}p_{X}(x),

o que é o que queríamos provar. ∎

É conveniente especificar a distribuição de uma variável aleatória dizendo o que é pXp_{X}. Quando dizemos "seja XX uma variável aleatória discreta com função de massa de probabilidade tal e tal,"o que queremos dizer? Isso realmente descreve uma variável aleatória? A próxima definição e proposição respondem a essa pergunta.

Definição 5.12 (Função de Massa de Probabilidade).

Uma função f:[0,1]f:\mathbb{R}\to[0,1] é uma função de massa de probabilidade se o conjunto DD dado por D={x:f(x)>0}D=\{x:f(x)>0\} é contável e xDf(x)=1\sum_{x\in D}f(x)=1.

Proposição 5.13.

Seja f:[0,1]f:\mathbb{R}\to[0,1] uma função de massa de probabilidade. Então existe um espaço de probabilidade (Ω,,)(\Omega,\mathcal{F},\mathbb{P}) e uma variável aleatória discreta XX tal que pX(x)=f(x)p_{X}(x)=f(x) para todo xx\in\mathbb{R}.

Demonstração.

Tome D={x:g(x)>0}D=\{x:g(x)>0\}. Tome Ω=\Omega=\mathbb{R}, =()\mathcal{F}=\mathcal{B}(\mathbb{R}) e

(B)=xBDf(x).\mathbb{P}(B)=\sum_{x\in B\cap D}f(x).

Finalmente, tome X(x)=xX(x)=x. Então XX é uma variável aleatória. Além disso,

X(Dc)=xDDcf(x)=0,\mathbb{P}_{X}(D^{c})=\sum_{x\in D\cap D^{c}}f(x)=0,

porque a soma sobre um conjunto vazio sempre é igual a zero. Portanto, XX é uma variável aleatória discreta. Vamos verificar que pX=pp_{X}=p.

Para xDx\in D, temos

pX(x)=X({x})=({x})=z{x}Df(z)=z{x}f(z)=f(x)p_{X}(x)=\mathbb{P}_{X}(\{x\})=\mathbb{P}(\{x\})=\sum_{z\in\{x\}\cap D}f(z)=% \sum_{z\in\{x\}}f(z)=f(x)

porque a soma de um único fator é igual a esse fator.

Por outro lado, para xDcx\in D^{c}, temos f(x)=0f(x)=0 e

pX(x)=zin{x}Df(z)=z∅︀f(z)=0=f(x).p_{X}(x)=\sum_{z\ in\{x\}\cap D}f(z)=\sum_{z\in\emptyset}f(z)=0=f(x).

Portanto, pX=pp_{X}=p, como reivindicado, e isso completa a prova da proposição. ∎

5.3 As distribuições discretas mais comuns

Definição 5.14 (Distibuição de Bernoulli).

Dizemos que uma variável aleatória discreta XX tem uma distribuição de Bernoulli com parâmetro p[0,1]p\in[0,1], denotado XBernoulli(p)X\sim\mathrm{Bernoulli}(p), se sua função de massa de probabilidade for

pX(x)={p,x=1,1p,x=0,0,caso contrário.p_{X}(x)=\begin{cases}p,&x=1,\\ 1-p,&x=0,\\ 0,&\text{caso contr\'{a}rio.}\end{cases}
Exemplo 5.15.

Seja Ω={C,T}\Omega=\{C,\text{T}\} (cara ou coroa para um lançamento de moeda) com (C)=p\mathbb{P}(C)=p(T)=1p\mathbb{P}(\text{T})=1-p, e seja X(C)=1X(C)=1X(T)=0X(\text{T})=0. Então, XBernoulli(p)X\sim\mathrm{Bernoulli}(p).

Definição 5.16 (Distibuição Geométrica).

Dizemos que uma variável aleatória discreta XX tem uma distribuição geométrica com parâmetro p(0,1]p\in(0,1], denotado XGeom(p)X\sim\mathrm{Geom}(p), se sua função de massa de probabilidade for

pX(x)={p(1p)x1,x,0,caso contrário.p_{X}(x)=\begin{cases}p\cdot(1-p)^{x-1},&x\in\mathbb{N},\\ 0,&\text{caso contr\'{a}rio.}\end{cases}

Para ver que pXp_{X} é de fato uma função de massa de probabilidade, observe que

k=0pX(k)=pk=1(1p)k1=p=0(1p)=p11(1p)=p1p=1.\sum_{k=0}^{\infty}p_{X}(k)=p\cdot\sum_{k=1}^{\infty}(1-p)^{k-1}=p\cdot\sum_{% \ell=0}^{\infty}(1-p)^{\ell}=p\cdot\frac{1}{1-(1-p)}=p\cdot\frac{1}{p}=1.

Variáveis aleatórias com distribuição geométrica surgem na seguinte situação. Suponha que realizamos repetidamente ensaios, cada um dos quais pode ser um sucesso ou um fracasso. Assuma que os ensaios são independentes e a probabilidade de sucesso é a mesma em cada um deles, igual a pp. Então, o número de ensaios realizados até obtermos o primeiro sucesso segue uma distribuição geométrica com parâmetro pp.

Observação 5.

Algumas referências menos comuns usam uma definição diferente para a distribuição geométrica com parâmetro pp: eles consideram a distribuição em 0\mathbb{N}_{0} (em vez de \mathbb{N}) e a função de massa de probabilidade p~X(k)=p(1p)k\tilde{p}_{X}(k)=p\cdot(1-p)^{k}, para k0k\in\mathbb{N}_{0}. Uma variável aleatória com função de massa de probabilidade p~X\tilde{p}_{X} conta o número de ensaios fracassados realizados antes de obter o primeiro sucesso. Portanto, no caso de um sucesso já ocorrer no primeiro ensaio, o número de ensaios fracassados é zero.

Exemplo 5.17.

Lançamos um dado repetidamente até obtermos um 6 pela primeira vez. Seja XX o número total de vezes que lançamos o dado. Então, XGeom(16)X\sim\mathrm{Geom}(\frac{1}{6}).

Definição 5.18 (Distribuição binomial).

Dizemos que uma variável aleatória discreta XX tem uma distribuição binomial com parâmetros n0n\in\mathbb{N}_{0} e p[0,1]p\in[0,1], denotado XBinom(n,p)X\sim\mathrm{Binom}(n,p), se sua função de massa de probabilidade for

pX(x)={(nx)px(1p)nx,x{0,1,,n},0,caso contrário.p_{X}(x)=\begin{cases}\binom{n}{x}p^{x}(1-p)^{n-x},&x\in\{0,1,\dots,n\},\\ 0,&\text{caso contr\'{a}rio.}\end{cases}

Observe que pXp_{X} é de fato uma função de massa de probabilidade, pois

1=(p+(1p))n=k=0n(nk)pk(1p)nk.1=(p+(1-p))^{n}=\sum_{k=0}^{n}\binom{n}{k}\cdot p^{k}\cdot(1-p)^{n-k}.
Exemplo 5.19.

Lance um dado dez vezes e seja XX o número de vezes que sai um 5 ou um 6. Então, XBinom(10,13)X\sim\mathrm{Binom}(10,\tfrac{1}{3}).

Lembrando que 00=10^{0}=1 e 0!=10!=1.

Definição 5.20 (Distribuição de Poisson).

Dizemos que uma variável aleatória discreta XX tem uma distribuição de Poisson com parâmetro λ0\lambda\geqslant 0, denotado por XPoisson(n,p)X\sim\mathrm{Poisson}(n,p), se sua função de massa de probabilidade for

pX(x)={eλλxx!,x0,0,caso contrário.p_{X}(x)=\begin{cases}\frac{e^{-\lambda}\lambda^{x}}{x!},&x\in\mathbb{N}_{0},% \\ 0,&\text{caso contr\'{a}rio.}\end{cases}

Para mostrar que pXp_{X} é de fato uma função de massa de probabilidade, calculamos

k=0pX(k)=k=0λkk!eλ=eλk=0λkk!=eλeλ=1.\sum_{k=0}^{\infty}p_{X}(k)=\sum_{k=0}^{\infty}\frac{\lambda^{k}}{k!}\cdot e^{% -\lambda}=e^{-\lambda}\cdot\sum_{k=0}^{\infty}\frac{\lambda^{k}}{k!}=e^{-% \lambda}\cdot e^{\lambda}=1.

Variáveis aleatórias que contam ocorrências raras entre muitos ensaios (como: número de acidentes em uma estrada ao longo de um ano, número de erros de digitação em uma página de livro) normalmente seguem a distribuição de Poisson. Mais precisamente, uma variável aleatória de Poisson pode ser usada para aproximar uma Binomial(n,p)(n,p) quando nn é grande, pp é pequeno e np=λnp=\lambda é fixo. De fato, se XBinom(n,p)X\sim\mathrm{Binom}(n,p) para p=λnp=\frac{\lambda}{n}, então

(X=k)\displaystyle\mathbb{P}(X=k) =(nk)pk(1p)nk\displaystyle={n\choose k}p^{k}(1-p)^{n-k} (5.21)
=n!k!(nk)!(λn)k(1λn)nk\displaystyle=\frac{n!}{k!(n-k)!}\left(\frac{\lambda}{n}\right)^{k}\left(1-% \frac{\lambda}{n}\right)^{n-k} (5.22)
=λkk!n(n1)(nk+1)nk(1λn)n(1λn)k\displaystyle=\frac{\lambda^{k}}{k!}\,\frac{n(n-1)\cdots(n-k+1)}{n^{k}}\,\left% (1-\frac{\lambda}{n}\right)^{n}\,\left(1-\frac{\lambda}{n}\right)^{-k} (5.23)
λkk!eλ,para n grande\displaystyle\to\frac{\lambda^{k}}{k!}e^{-\lambda},\quad\text{para }n\text{ grande} (5.24)

onde a aproximação segue das seguintes aproximações para nn grande:

n(n1)(nk+1)/nk1,(1λn)neλ,λn0.n(n-1)...(n-k+1)/n^{k}\to 1,\quad\left(1-\frac{\lambda}{n}\right)^{n}\to e^{-% \lambda},\quad\frac{\lambda}{n}\to 0\,. (5.25)

Breve revisão de variáveis aleatórias

Variável aleatória:

X:ΩX:\Omega\to\mathbb{R}

com a exigência de que {ω:X(ω)a}\{\omega:X(\omega)\leqslant a\}\in\mathcal{F} para todo aa\in\mathbb{R}.

A distribuição de XX é X:\mathbb{P}_{X}:\mathcal{B}\to\mathbb{R}, dada por

X(B)=({ω:X(ω)B})\mathbb{P}_{X}(B)=\mathbb{P}(\{\omega:X(\omega)\in B\})

é uma medida de probabilidade em \mathbb{R}, onde \mathcal{B} é o espaço de eventos em \mathbb{R}.

Uma variável aleatória XX é discreta se existe um conjunto contável SS tal que X(Sc)=0\mathbb{P}_{X}(S^{c})=0.

Para XX discreto, definimos a função de massa de probabilidade de XX como a função pX:p_{X}:\mathbb{R}\to\mathbb{R} dada por

pX(x)=X({x}).p_{X}(x)=\mathbb{P}_{X}(\{x\}).

e o suporte discreto de XX como o conjunto {x:pX(x)>0}\{x\in\mathbb{R}:p_{X}(x)>0\}.

Se XX é discreto, então

X(B)=xBDXpX(x)\mathbb{P}_{X}(B)=\sum_{x\in B\cap D_{X}}p_{X}(x)

para todo BB\in\mathcal{B}, onde DXD_{X} denota o suporte discreto de XX.

Dizemos que uma função f:f:\mathbb{R}\to\mathbb{R} é uma função de massa de probabilidade se f(x)0f(x)\geqslant 0 para todo xx\in\mathbb{R}, o conjunto {x:f(x)>0}\{x\in\mathbb{R}:f(x)>0\} é contável e

x:f(x)>0f(x)=1.\sum_{x:f(x)>0}f(x)=1.

Dada uma função de massa de probabilidade ff, é possível construir um espaço de probabilidade (Ω,,)(\Omega,\mathcal{F},\mathbb{P}) e uma variável aleatória XX tal que ff seja a função de massa de probabilidade de XX.