2.9 Núcleos de transição

Já focamos bastante energia em variáveis aleatórias independentes. Por exemplo, estudamos em detalhes o que acontece com a soma de tais variáveis. Agora passaremos a estudar elementos aleatórios dependentes e o primeiro passo para isso é obter um método geral de construí-los.

Definiremos agora um núcleo de transição. Intuitivamente, ele nos dá uma maneira de usar um elemento aleatório em um espaço para induzir uma probabilidade em outro espaço. Um exemplo em que poderíamos utilizar essa construção seria o seguinte.

Digamos que estamos preocupados com a possibilidade de um deslizamento de terra em uma determinada região. A ocorrência desse deslizamento é algo aleatório, mas que certamente depende da quantidade de chuva no período, que também podemos modelar como sendo aleatória.

Após estudarmos alguns trabalhos anteriores, descobrimos uma função F:+[0,1]F:\mathbb{R}_{+}\to[0,1] que nos dá a probabilidade de um deslizamento ocorrer, como função da quantidade de chuva em milímetros.

Lendo o histórico pluvial da região, podemos estimar a distribuição QQ em +\mathbb{R}_{+} correspondente à quantidade de chuva naquele período. A lei FQF_{*}Q (também chamada de QFQ_{F}) é uma lei em [0,1][0,1] que nos dá a distribuição da probabilidade de deslizamento, mas como seguimos em frente para obter a probabilidade de deslizamento (um número entre zero e um)? Saberemos como fazer isso ao terminar essa seção.

Sejam (E1,𝒜1)(E_{1},\mathcal{A}_{1}) e (E2,𝒜2)(E_{2},\mathcal{A}_{2}) espaços mensuráveis. {definition} Um núcleo de transição entre E1E_{1} e E2E_{2} é uma função

K:E1×𝒜2[0,1],K:E_{1}\times\mathcal{A}_{2}\to[0,1], (2.91)

tal que

  1.  a)

    para todo yE1y\in E_{1}, K(y,)K(y,\cdot) é uma probabilidade em (E2,𝒜2)(E_{2},\mathcal{A}_{2}) e

  2.  b)

    para todo A𝒜2A\in\mathcal{A}_{2}, a função K(,A):E1[0,1]K(\cdot,A):E_{1}\to[0,1] é 𝒜1\mathcal{A}_{1}-mensurável.

{example}

Daremos agora o exemplo da probabilidade de deslizamento como função de FF (que será possivelmente uma variável aleatória). Nesse caso, seja E1=[0,1]E_{1}=[0,1] e E2={0,1}E_{2}=\{0,1\} com as σ\sigma-álgebras naturais e defina

K(p,A)=((1p)δ0+pδ1)(A).K(p,A)=\big{(}(1-p)\delta_{0}+p\delta_{1}\big{)}(A). (2.92)

Vamos verificar que KK definido acima é um núcleo de transição. De fato,

  1.  i)

    K(p,)K(p,\cdot) é a distribuição Bernoulli com parâmetro pp, que obviamente é uma probabilidade,

  2.  ii)

    além disso, K(,Ω)=1K(\cdot,\Omega)=1, K(,)=1K(\cdot,\varnothing)=1 e K(,{0})=1p=1K(,{1})K(\cdot,\{0\})=1-p=1-K(\cdot,\{1\}), que obviamente são mensuráveis.

Isso prova que esse KK específico é um núcleo de transição

{example}

[Caso discreto] Sejam E1E_{1} e E2E_{2} espaços finitos ou enumeráveis. Se p:E1×E2[0,1]p:E_{1}\times E_{2}\to[0,1] é tal que para todo yE1y\in E_{1} temos zE2p(y,z)=1\sum_{z\in E_{2}}p(y,z)=1, então

K(y,A):=zAp(y,z) é um núcleo de transição entre E1 e E2.K(y,A):=\sum_{z\in A}p(y,z)\text{ \'{e} um n\'{u}cleo de transi\c{c}\~{a}o % entre $E_{1}$ e $E_{2}$.} (2.93)

Nesse caso p(y,z)p(y,z) representa a probabilidade que a segunda coordenada seja zz, se a primeira é yy.

{exercise}

Mostre que se E1E_{1} e E2E_{2} são enumeráveis então todo núcleo entre E1E_{1} e E2E_{2} pode ser escrito na forma do exemplo acima.

{example}

[Caso absolutamente contínuo] Digamos que E1E_{1} e E2E_{2} sejam dotados de medidas μ1\mu_{1} e μ2\mu_{2} σ\sigma-finitas. Seja ρ:E1×E2+\rho:E_{1}\times E_{2}\to\mathbb{R}_{+} mensurável e tal que para μ1\mu_{1}-quase todo yE1y\in E_{1}, tenhamos E2ρ(y,z)μ2(z)=1\int_{E_{2}}\rho(y,z)\mu_{2}(\d{z})=1. Então

K(y,A):=Aρ(y,z)μ2(z) é um núcleo de transição entre E1 e E2.K(y,A):=\int_{A}\rho(y,z)\mu_{2}(\d{z})\text{ \'{e} um n\'{u}cleo de transi\c{% c}\~{a}o entre $E_{1}$ e $E_{2}$.} (2.94)

Note que K(,A)K(\cdot,A) está bem definido para μ2\mu_{2}-quase todo ponto pelo Teorema de Fubini.

{exercise}

Prove que os dois exemplos acima de fato definem um núcleo.

Tipicamente, definimos os núcleos de transição introduzindo K(y,)K(y,\cdot) como sendo uma medida que depende de yy. Nesse caso, uma das condições para que KK seja um núcleo está automaticamente satisfeita, restando apenas mostrar que K(,A)K(\cdot,A) é mensurável para quaisquer A𝒜2A\in\mathcal{A}_{2}. Mas obviamente o conjunto 𝒜2\mathcal{A}_{2} pode ser muito complexo, então gostaríamos de apenas verificar que K(,A)K(\cdot,A) é mensurável para os conjuntos AA em uma classe rica o suficiente.

{proposition}

Seja K:E1×𝒜2[0,1]K:E_{1}\times\mathcal{A}_{2}\to[0,1], tal que K(y,)K(y,\cdot) é uma medida para todo yE1y\in E_{1}. Se K(,A)K(\cdot,A) é mensurável para todo A𝒢A\in\mathcal{G}, onde 𝒢\mathcal{G} é um π\pi-sistema que gera 𝒜2\mathcal{A}_{2}, então KK é um núcleo de transição.

Demonstração.

Como de costume, vamos definir

={B𝒜2:K(,B) é 𝒜1-mensurável}.\mathcal{B}=\{B\in\mathcal{A}_{2}\,:\,K(\cdot,B)\text{ \'{e} $\mathcal{A}_{1}$% -mensur\'{a}vel}\}. (2.95)

Obviamente, como K(y,)K(y,\cdot) é uma probabilidade, vale que

  1.  a)

    Ω\Omega\in\mathcal{B}, pois a função constante igual a um é mensurável.

  2.  b)

    Se BB\in\mathcal{B}, então BcB^{c}\in\mathcal{B}, pois 1f1-f é mensurável se ff o é.

  3.  c)

    E se B1,B2,,BnB_{1},B_{2},\dots,B_{n}\in\mathcal{B} são disjuntos, então \mcupi=1nBi\mcup_{i=1}^{n}B_{i}\in\mathcal{B}, pois a soma de funções mensuráveis também é mensurável.

A discussão acima mostra que \mathcal{B} é um λ\lambda-sistema que contém o π\pi-sistema 𝒢\mathcal{G}. Daí, vemos pelo Teorema 1.3 que 𝒜2=σ(𝒢)\mathcal{A}_{2}=\sigma(\mathcal{G})\subseteq\mathcal{B}, provando a proposição. ∎

{exercise}

Seja K:×()[0,1]K:\mathbb{R}\times\mathcal{B}(\mathbb{R})\to[0,1] dada por K(y,)=U[y1,y+1]K(y,\cdot)=U_{[y-1,y+1]}. Mostre que KK define um núcleo de transição.

Apesar de interessante, a definição acima ainda não nos permitiu definir espaços de probabilidade novos. Isso será possibilitado pelo próximo resultado, que pode ser visto como uma generalização do Teorema de Fubini.

\chooseoptpar{theorem}

[Fubini para Núcleos de Transição] Dado um núcleo \optde transição KK de (E1,𝒜1)(E_{1},\mathcal{A}_{1}) para (E2,𝒜2)(E_{2},\mathcal{A}_{2}) e uma probabilidade P1P_{1} em E1E_{1}, existe uma única probabilidade PP em (E1×E2,𝒜1𝒜2)(E_{1}\times E_{2},\mathcal{A}_{1}\otimes\mathcal{A}_{2}) tal que

E1×E2f𝑑P=E1E2f(y,z)K(y,z)P1(y),\int_{E_{1}\times E_{2}}fdP=\int_{E_{1}}\int_{E_{2}}f(y,z)K(y,\d{z})P_{1}(\d{y% }), (2.96)

para toda f:E1×E2+f:E_{1}\times E_{2}\to\mathbb{R}_{+}. Em particular, P(A1×A2)=A1K(y,A2)P1(y)P(A_{1}\times A_{2})=\int_{A_{1}}K(y,A_{2})P_{1}(\d{y}). Nesse caso escrevemos P=P1KP=P_{1}\star K.

Antes de iniciar a prova do teorema, vamos ver que as integrais do lado direito de (2.96) estão bem definidas. Para isso, definimos para yE1y\in E_{1} a função fatiadora ϕy:E2E1×E2\phi_{y}:E_{2}\to E_{1}\times E_{2} dada por ϕy(z)=(y,z)\phi_{y}(z)=(y,z). Obviamente essa função é mensurável, pois

ϕy1(A1×A2)={, se yA1 eA2, se yA1.\phi_{y}^{-1}(A_{1}\times A_{2})=\begin{cases}\varnothing,\quad&\text{ se $y% \not\in A_{1}$ e}\\ A_{2},&\text{ se $y\in A_{1}$}.\end{cases} (2.97)

Dessa forma, para definirmos f(y,z)K(y,z)\int f(y,z)K(y,\d{z}), introduzimos fy:A2+f_{y}:A_{2}\to\mathbb{R}_{+} dada por fy(z)=f(y,z)f_{y}(z)=f(y,z), que é mensurável pois fy=fϕyf_{y}=f\circ\phi_{y}.

Assim, gostaríamos de integrar a função yfy(z)K(y,z)y\mapsto\int f_{y}(z)K(y,\d{z}), que está obviamente bem definida. Porém resta a pergunta, será que essa expressão define uma função mensurável de yy?

{lemma}

Se KK é um núcleo de transição, então para toda f:E1×E2+f:E_{1}\times E_{2}\to\mathbb{R}_{+} que seja 𝒜1𝒜2\mathcal{A}_{1}\otimes\mathcal{A}_{2} mensurável, temos que gf:A1+g^{f}:A_{1}\to\mathbb{R}_{+} dada por

gf(y)=fy(z)K(y,z)g^{f}(y)=\int f_{y}(z)K(y,\d{z}) (2.98)

é 𝒜1\mathcal{A}_{1}-mensurável.

Demonstração.

Se f=\1A1×A2f=\1_{A_{1}\times A_{2}} para Ai𝒜iA_{i}\in\mathcal{A}_{i}, i=1,2i=1,2, então temos que gf(y)=K(y,A2)\1A1g^{f}(y)=K(y,A_{2})\1_{A_{1}}, que obviamente é mensurável pois KK é um núcleo.

Definimos 𝒟={B𝒜1𝒜2:g\1B é 𝒜1-mensurável}\mathcal{D}=\{B\in\mathcal{A}_{1}\otimes\mathcal{A}_{2}\,:\,g^{\1_{B}}\text{ % \'{e} $\mathcal{A}_{1}$-mensur\'{a}vel}\}. É fácil ver que 𝒟\mathcal{D} é um λ\lambda-sistema que contém o π\pi-sistema dos retângulos, logo 𝒟=𝒜1𝒜2\mathcal{D}=\mathcal{A}_{1}\otimes\mathcal{A}_{2}.

Acabamos de ver que gfg^{f} é mensurável para toda ff indicadora, donde o mesmo vale para ff simples por linearidade e para toda ff positiva pelo Teorema da Convergência Monótona (lembre que limite de funções mensuráveis é mensurável). ∎

Estamos prontos agora para fornecer a

Demonstração do Teorema 2.9.

Já sabemos que a integral do lado direito de (2.96) está bem definida (assumindo possivelmente o valor infinito). A unicidade vale obviamente pois (2.96) aplicado a funções indicadoras temos necessariamente para todos BB

P(B)=E1E2\1BK(y,z)P1(y).P(B)=\int_{E_{1}}\int_{E_{2}}\1_{B}K(y,\d{z})P_{1}(\d{y}). (2.99)

Só temos que verificar a fórmula acima nos define uma probabilidade em (E1×E2,𝒜1𝒜2)(E_{1}\times E_{2},\mathcal{A}_{1}\otimes\mathcal{A}_{2}).

De fato,

  1.  a)

    obviamente P(Ω)=E1E2K(y,z)P1(y)=1P(\Omega)=\int_{E_{1}}\int_{E_{2}}K(y,\d{z})P_{1}(\d{y})=1 e

  2.  b)

    se (Bi)iI(B_{i})_{i\in I} e uma família finita ou enumerável de eventos disjuntos (em 𝒜1𝒜2\mathcal{A}_{1}\otimes\mathcal{A}_{2}) então \1iIBi=iI\1Bi\1_{\bigcup_{i\in I}B_{i}}=\sum_{i\in I}\1_{B_{i}} a σ\sigma-aditividade de PP segue das propriedades básicas (linearidade e Teorema de convergência monótona) da integração.

Isto demonstra o teorema. ∎

{exercise}

Considere duas probabilidades PiP_{i} em (Ei,𝒜i)(E_{i},\mathcal{A}_{i}) para i=1,2i=1,2 e K:E1×𝒜2[0,1]K:E_{1}\times\mathcal{A}_{2}\to[0,1] dado por K(y,A)=P2(A)K(y,A)=P_{2}(A). Mostre que KK é núcleo e que P1K=P1P2P_{1}\star K=P_{1}\otimes P_{2}. Relacione esse resultado ao Teorema de Fubini clássico para produtos de medidas.

{exercise}

Considere o núcleo do Exemplo 2.9 e calcule:

  1.  a)

    U[0,1]K[X2=1]U_{[0,1]}\star K[X_{2}=1],

  2.  b)

    P1K[X2=1]P_{1}\star K[X_{2}=1], onde P1=2xx\d{P}_{1}=2x\d{x} e

  3.  c)

    encontre a distribuição de (X1)(U[0,1]K[|X2=1])(X_{1})_{*}\big{(}U_{[0,1]}\star K[\;\cdot\;|X_{2}=1]\big{)}. Interprete o resultado.

{exercise}

Seja P=P1KP=P_{1}\star K como acima e Q()=P[|X2=1]Q(\cdot)=P[\cdot|X_{2}=1]. Calcule

[0,1]×{0,1}X1Q\int_{[0,1]\times\{0,1\}}X_{1}\d{Q} (2.100)
{exercise}

Para 0a<b10\leq a<b\leq 1, definimos a probabilidade U[a,b]U_{[a,b]} em ([0,1],([0,1]))([0,1],\mathcal{B}([0,1])) através da seguinte fórmula U[a,b](B)=(B[a,b])/(ba)U_{[a,b]}(B)=\mathcal{L}(B\cap[a,b])/(b-a). Consideramos também a função K:[0,1]×([0,1])[0,1]K:[0,1]\times\mathcal{B}([0,1])\to[0,1] dada por K(x,)=U[0,x]()K(x,\cdot)=U_{[0,x]}(\cdot), se x>0x>0 e K(0,)=δ0()K(0,\cdot)=\delta_{0}(\cdot).

  1.  a)

    Mostre que KK é um núcleo de transição.

  2.  b)

    Calcule U[0,1]K[X1<1/2]U_{[0,1]}\star K[X_{1}<1/2] e U[0,1]K[X2<1/2]U_{[0,1]}\star K[X_{2}<1/2], onde X1X_{1} e X2X_{2} são as projeções canônicas em [0,1]2[0,1]^{2}.

  3.  c)

    Mostre que U[0,1]KU_{[0,1]}\star K é absolutamente contínua com respeito à medida de Lebesgue em [0,1]2[0,1]^{2} e calcule sua densidade.

{exercise}

Considere K:E1×𝒜2[0,1]K:E_{1}\times\mathcal{A}_{2}\to[0,1] dada por K(p,)=\Exp(p)K(p,\cdot)=\Exp(p). Mostre que KK é núcleo de transição e calcule U[0,1]K[X2>1]U_{[0,1]}\star K[X_{2}>1].

{exercise}

Se KK é um núcleo de transição entre E1E_{1} e E2E_{2} e {y}𝒜1\{y\}\in\mathcal{A}_{1} satisfaz P1({y})>0P_{1}(\{y\})>0, mostre que

P1K[X2|X1=y]=K(y,).P_{1}\star K[X_{2}\in\cdot|X_{1}=y]=K(y,\cdot). (2.101)

Ou em outras palavras, KK nos dá a distribuição condicional de X2X_{2} dado X1=yX_{1}=y.

Posteriormente extenderemos o resultado acima para o caso P1({y})=0P_{1}(\{y\})=0, mas isso demandará algum esforço.

Vamos introduzir uma última notação com respeito a núcleos de transição. Muitas vezes, não estamos interessados na distribuição conjunta de P1KP_{1}\star K em E1×E2E_{1}\times E_{2}, mas apenas na distribuição marginal da segunda coordenada. No nosso problema da chuva por exemplo, talvez poderíamos estar interessados apenas na probabilidade final de ocorrer um deslizamento. Nesse caso, é conveniente escrever

P1K:=(X2)(P1K)=(P1K)X2.P_{1}K:=(X_{2})_{*}(P_{1}\star K)=(P_{1}\star K)_{X_{2}}. (2.102)
{exercise}

Seja K:+×(+)[0,1]K:\mathbb{R}_{+}\times\mathcal{B}(\mathbb{R}_{+})\to[0,1] dada pela equação K(x,A)=Axexp{xt}tK(x,A)=\int_{A}x\exp\{-xt\}\d{t}.

  1.  a)

    Prove que KK é um núcleo de transição.

  2.  b)

    Seja PP dada por P=Exp(1)KP=\textnormal{Exp}(1)\star K. Obtenha P[X2>x2]P[X_{2}>x_{2}] para todo x20x_{2}\geq 0 (lembrando que X2X_{2} denota a segunda coordenada no espaço produto onde está definida PP). Compare a probabilidade acima com K(1,[x2,))K(1,[x_{2},\infty)).

  3.  c)

    Mostre que P[X1+X2z]=0zexp{x(zx+1)}x+exp{z}P[X_{1}+X_{2}\geq z]=\int_{0}^{z}\exp\{-x(z-x+1)\}\d{x}+\exp\{-z\}.