4.4 Princípio da substituição

O Teorema 4.3 é bastante poderoso e nos permite definir e calcular diversas probabilidades, como faremos à seguir. Nessa seção construiremos nossa última versão de probabilidade condicional regular que não se restringe a espaços produtos e nos fornecerá o que chamamos de Princípio da Substituição.

{theorem}

Sejam (Ω,,P)(\Omega,\mathcal{F},P) e (E,𝒜)(E,\mathcal{A}) espaços mensuráveis canônicos. Considere também X:ΩEX:\Omega\to E um elemento aleatório, então existe um núcleo de transição KK de EE a Ω\Omega tal que

K(X(ω),F)=E[\1F|X], para todo F.K(X(\omega),F)=E[\1_{F}|X],\text{ para todo $F\in\mathcal{F}$}. (4.42)

Também denotamos esse núcleo como K(x,F)=P[F|X=x]K(x,F)=P[F|X=x], que é único no sentido que se KK^{\prime} também satisfaz (4.42), então K(x,F)=K(x,F)K(x,F)=K^{\prime}(x,F) para (XP)(X\circ P)-quase todo xEx\in E.

Além disso vale o que chamamos de Princípio da Substituição:

K(x,[X=x])=1,XP-quase certamente.K(x,[X=x])=1,\quad\text{$X\circ P$-quase certamente}. (4.43)

Que pode ser dito de maneira estranha: P[X=x|X=x]=1P[X=x|X=x]=1, quase certamente.

Ω\OmegaEExx[X=x][X=x]
Figura 4.1: O gráfico do elemento aleatório XX representado horizontalmente. Os pontos marcados no eixo vertical representam o conjunto [X=x][X=x] que possui medida um segundo P[|X=x]P[\;\cdot\;|X=x] de acordo com o Teorema 4.4
Demonstração.

Defina o elemento aleatório W:ΩE×ΩW:\Omega\to E\times\Omega, dado por W(ω)=(X(ω),ω)W(\omega)=(X(\omega),\omega), que percorre o gráfico de XX (representado horizontalmente). Observe que a medida PW:=WPP_{W}:=W\circ P possui marginais (X1PW)=(XP)(X_{1}\circ P_{W})=(X\circ P) e (X2PW)=P(X_{2}\circ P_{W})=P. Como PWP_{W} satisfaz as condições do Teorema 4.3, existe um núcleo K:E×[0,1]K:E\times\mathcal{F}\to[0,1] tal que para todo A𝒜A\in\mathcal{A}, FF\in\mathcal{F},

PW(A×F)=AK(x,F)PX(x).P_{W}(A\times F)=\int_{A}K(x,F)P_{X}(\d{x}). (4.44)

Fixado FF\in\mathcal{F}, K(X(ω),F)K(X(\omega),F) é obviamente σ(X)\sigma(X) mensurável, por ser uma composição de uma função mensurável em EE com XX. Logo, para provar (4.42), basta mostrar a segunda propriedade de esperanças condicionais. Se Bσ(X)B\in\sigma(X), podemos escrever B=[XA]B=[X\in A] para algum A𝒜A\in\mathcal{A}, donde

E[K(X,F)\1B]=E[K(X,F)\1[XA]]=AK(x,F)PX(x)=PW(A×F)=E[\1XA\1F]=E[\1B\1F],\begin{split}E\big{[}K(X,F)\1_{B}\big{]}&=E\big{[}K(X,F)\1_{[X\in A]}\big{]}=% \int_{A}K(x,F)P_{X}(\d{x})\\ &=P_{W}(A\times F)=E[\1_{X\in A}\1_{F}]=E[\1_{B}\1_{F}],\end{split} (4.45)

concluindo a prova de (4.42).

Para mostrarmos o Princípio da Substituição, vamos usar o seguinte lema.

{lemma}

Se X:ΩEX:\Omega\to E é um elemento aleatódio tomando valores em um espaço EE canônico, então seu gráfico G={(ω,X(ω));ωΩ}G=\{(\omega,X(\omega));\omega\in\Omega\} é mensurável na σ\sigma-álgebra produto 𝒜\mathcal{F}\otimes\mathcal{A}.

Demonstração.

Primeiramente, consideramos o caso (E,𝒜)=(,())(E,\mathcal{A})=(\mathbb{R},\mathcal{B}(\mathbb{R})). Neste caso, vemos que

G=n1j[X(j/2n,(j+1)/2n]]×(j/2n,(j+1l)/2n],G=\bigcap_{n\geq 1}\bigcup_{j\in\mathbb{Z}}[X\in\big{(}j/2^{n},(j+1)/2^{n}\big% {]}]\times\big{(}j/2^{n},(j+1l)/2^{n}\big{]}, (4.46)

que é mensurável.

Caso EE seja outro espaço canônico qualquer, existe ϕ:EB()\phi:E\to B\in\mathcal{B}(\mathbb{R}) bi-mensurável e G=Φ1(GϕX)G=\Phi^{-1}(G_{\phi\circ X}), onde GϕXG_{\phi\circ X} é o gráfico de ϕX\phi\circ X e Φ(ω,x)=(ω,ϕ(x))\Phi(\omega,x)=(\omega,\phi(x)). Logo GG também é mensurável nesse caso. ∎

Retornando à prova de (4.43), já sabemos que G={(X(ω),ω);ωΩ}G^{\prime}=\{(X(\omega),\omega);\omega\in\Omega\} é mensurável. Além disso, por definição PW(G)=P[(X(ω),ω)G]=P(Ω)=1P_{W}(G^{\prime})=P[(X(\omega),\omega)\in G^{\prime}]=P(\Omega)=1, ou seja a medida PWP_{W} tem suporte em GG^{\prime}.

Logo podemos escrever

1=PW(G)=\1G(x,ω)K(x,ω)(XP)(x)=K(x,[X=x])(XP)(x).\begin{split}1=P_{W}(G^{\prime})&=\int\int\1_{G^{\prime}}(x,\omega)K(x,\d{% \omega})(X\circ P)(\d{x})\\ &=\int K(x,[X=x])(X\circ P)(\d{x}).\end{split} (4.47)

Mas como o integrado acima pertence a [0,1][0,1], essa integral só pode ser um se K(x,[X=x])=1K(x,[X=x])=1, (XP)(X\circ P)-quase certamente, como desejado. ∎

{exercise}

Sejam X:ΩEX:\Omega\to E e Y:ΩEY:\Omega\to E^{\prime} elementos aleatórios com EE canônico. Então existe um núcleo de transição KK entre EE e EE^{\prime} tal que

K(X(ω),B)=E[\1YB|X], para todo B𝒜.K(X(\omega),B)=E[\1_{Y\in B}|X],\text{ para todo $B\in\mathcal{A}^{\prime}$}. (4.48)

Poderíamos chamar esse núcleo de K(x,B)=P[YB|X=x]K(x,B)=P[Y\in B|X=x].

{exercise}

Mostre que se K(x,F)=P[F|X=x]K(x,F)=P[F|X=x], então

f(ω)K(X(ω),ω)=E(f|X)(ω), para toda f.\int f(\omega^{\prime})K(X(\omega),\d{\omega}^{\prime})=E(f|X)(\omega),\text{ % para toda $f\in\mathcal{F}$}. (4.49)
{exercise}

Se YY é variável aleatória e X:ΩEX:\Omega\to E é um elemento aleatório canônico, mostre que

E(Y|X)=yP(Yy|X=)X, P-q.c.E(Y|X)=\int yP(Y\in\d{y}|X=\cdot)\circ X,\text{ $P$-q.c.} (4.50)

Vamos agora mostrar uma aplicação do que foi feito acima, tentando justificar o nome Princípio da Substituição.

{lemma}

Se X,YX,Y são variáveis aleatórias independentes, então a função de distribuição acumulada FF de X+YX+Y é dada por

F(z)=P[X+Yz]=FY(zx)(XP)(x),F(z)=P[X+Y\leq z]=\int_{-\infty}^{\infty}F_{Y}(z-x)(X\circ P)(\d{x}), (4.51)

onde FY(y)=P[Yy]F_{Y}(y)=P[Y\leq y].

Esse lema pode ser visto como uma generalização do Exercício 2.5.2 para o caso não absolutamente contínuo. Vale a pena tentar diferenciar (não rigorosamente) a equação acima em zz.

Demonstração.

Vamos calcular

P[X+Yz]=E(E(\1[X+Yz]|X))=E(E(\1[X+Yz]|X))=E(P[X+Yz|X=)X)=E(P[X+Yz,X=x|X=)X)=E(P[Yzx|X=]X),\begin{split}P[X+Y\leq z]&=E\big{(}E(\1_{[X+Y\leq z]}|X)\big{)}\\ &=E\big{(}E(\1_{[X+Y\leq z]}|X)\big{)}\\ &=E\Big{(}P[X+Y\leq z|X=\cdot)\circ X\Big{)}\\ &=E\Big{(}P[X+Y\leq z,X=x|X=\cdot)\circ X\Big{)}\\ &=E\Big{(}P[Y\leq z-x|X=\cdot]\circ X\Big{)},\end{split} (4.52)

onde P[Y+Xz|X=]P[Y+X\leq z|X=\cdot] representa a função xP[Y+Xz|X=x]x\mapsto P[Y+X\leq z|X=x].

Agora vamos usar a hipótese que XX e YY são independentes. Isso equivale a dizer que a distribuição conjunta desse par é igual a PXPYP_{X}\otimes P_{Y} e pela unicidade da probabilidade condicional regular temos que P[YF|X=x]=P[YF]P[Y\in F|X=x]=P[Y\in F], (XP)(X\circ P)-quase certamente, veja Exercício 4.3. Portanto,

P[X+Yz]=E(P[Yz]X)=FY(zx)(XP)(x),P[X+Y\leq z]=E\big{(}P[Y\leq z-\cdot]\circ X\big{)}=\int_{-\infty}^{\infty}F_{% Y}(z-x)(X\circ P)(\d{x}), (4.53)

terminando a prova do lema. ∎

{exercise}

Considere as medidas

μa=δ1+δ12,eμb=𝒩(0,1).\mu_{a}=\frac{\delta_{-1}+\delta_{1}}{2},\qquad\text{e}\qquad\mu_{b}=\mathcal{% N}(0,1). (4.54)

e K:×()[0,1]K:\mathbb{R}\times\mathcal{B}(\mathbb{R})\to[0,1] dada por

K(x,A)={μa(Ax), se x<0,μb(Ax), se x0,K(x,A)=\begin{cases}\mu_{a}(A-x),&\text{ se $x<0$,}\\ \mu_{b}(A-x),&\text{ se $x\geq 0$,}\end{cases} (4.55)

Mostre que

  1.  a)

    KK define um núcleo de transição entre \mathbb{R} em \mathbb{R}.

  2.  b)

    Se X1,X2,X_{1},X_{2},\dots for uma cadeia de Markov em \mathbb{R} com núcleo de transição KK, então calcule

    1.   i)

      E(Xi)E(X_{i}), para todo i1i\geq 1 e

    2.   ii)

      Var(Xi)\text{Var}(X_{i}), para todo i1i\geq 1.

    3.   iii)

      Mostre que

      i=1nXin𝒩(0,1).\frac{\sum_{i=1}^{n}X_{i}}{\sqrt{n}}\Rightarrow\mathcal{N}(0,1). (4.56)