Tópico: Urna de Pólya

Um excelente exemplo de como Cadeias de Markov podem gerar interessantes modelos de situações reais são as chamadas Urnas de Pólya. Esse processo modela sistemas de física, biologia, computação e economia que apresentam o que chamamos de reforço.

Tome por exemplo duas empresas que competem pelo mercado de aviões. Inicialmente, não temos nenhuma razão para escolher uma em detrimento da outra, portanto compramos nosso primeiro avião de cada empresa com probabilidade meio. Porém, depois que já compramos diversos aviões de uma determinada empresa, ela já recebeu bastante dinheiro que pode ser reinvestido para gerar melhor tecnologia e aumentar as chances que ela seja escolhida novamente no futuro. Isso é o que chamamos de reforço.

Vamos agora apresentar rigorosamente um modelo para situações desse tipo. O nosso modelo começa com uma urna contendo duas bolas, uma vermelha e uma azul. No cada passo do processo, escolheremos uma bola da urna ao acaso, olharemos sua cor e retornaremos essa bola para dentro urna junto com mais uma bola da mesma cor. Isso pode será formalizado à seguir.

Vamos construir uma medida em {0,1}\{0,1\}^{\mathbb{N}}, dotado da σ\sigma-álgebra produto. Fixada uma sequência finita w1,,wnw_{1},\dots,w_{n} em {0,1}\{0,1\}, definimos

Nx(w1,,wn)=#{j{1,,n}:wj=x}+1,N_{x}(w_{1},\dots,w_{n})=\#\big{\{}j\in\{1,\dots,n\}\,:\,w_{j}=x\big{\}}+1, (2.126)

que nada mais é que o número de bolas do tipo xx que se encontram na urna no tempo nn. Quando tivermos uma sequência infinita de wiw_{i}’s, escreveremos NxnN^{n}_{x} para denotar Nx(w1,,wn)N_{x}(w_{1},\dots,w_{n}).

Para cada n1n\geq 1, definimos Kn:{0,1}n𝒫({0,1})K_{n}:\{0,1\}^{n}\to\mathcal{P}(\{0,1\}) por

Kn(w1,,wn)=\Ber(N1n).K_{n}(w_{1},\dots,w_{n})=\Ber\big{(}\tfrac{N_{1}}{n}\big{)}. (2.127)

Ou seja, dadas cores w1,,wnw_{1},\dots,w_{n}, escolheremos uma bola de cor 11 proporcionalmente ao número N1N_{1} de bolas de cor 11 que já foram sorteadas.

{exercise}

Mostre que todos KnK_{n} acima definem núcleos de transição. Além disso a seguinte sequência de medidas é compatível no sentido de Kolmogorov:

  • P1=\Ber(1/2)P_{1}=\Ber(1/2),

  • P2=P1K1P_{2}=P_{1}\star K_{1},

  • P3=P2K2,P_{3}=P_{2}\star K_{2},\dots

Conclua que existe a medida PP em {0,1}\{0,1\}^{\mathbb{N}} que define o modelo de Pólya.

Podemos agora fazer perguntas como por exemplo: será que escolheremos bolas de ambas as cores para sempre, ou a partir de um certo momento escolheremos bolas de apenas uma cor com certa probabilidade. Mais precisamente, qual é a probabilidade de [Xi=1, infinitas vezes][X_{i}=1,\text{ infinitas vezes}]?

Para responder perguntas desse tipo, iremos mostrar algo muito curioso, que pode ser entendido como uma outra maneira de representar o modelo descrito acima. Mas antes, vamos colecionar alguns fatos sobre o modelo da Urna de Pólya.

Primeiramente vamos olhar para os seguintes eventos. Fixamos n1n\geq 1 e uma sequência w1,,wn{0,1}w_{1},\dots,w_{n}\in\{0,1\} e seja AA o evento {w1}××{wn}×{0,1}×\{w_{1}\}\times\dots\times\{w_{n}\}\times\{0,1\}\times\dots Note que os eventos desse tipo (junto com o evento \varnothing) formam um π\pi-sistema que gera a σ\sigma-álgebra canônica de {0,1}\{0,1\}^{\mathbb{N}}, portanto essa coleção é bastante completa para identificar a distribuição da Urna de Pólya.

Podemos calcular a probabilidade do evento AA acima

P(A)=Nw112Nw123Nwnnn+1=1(n+1)!i=1nNwii=N1n!(nN1n)!(n+1)!=1(n+1)(nN1n)1.\begin{split}P(A)&=\frac{N^{1}_{w_{1}}}{2}\frac{N^{2}_{w_{1}}}{3}\dots\frac{N^% {n}_{w_{n}}}{n+1}=\frac{1}{(n+1)!}\prod_{i=1}^{n}N^{i}_{w_{i}}\\ &=\frac{N^{n}_{1}!(n-N^{n}_{1})!}{(n+1)!}=\frac{1}{(n+1)}\binom{n}{N^{n}_{1}}^% {-1}.\end{split} (2.128)

O que é muito interessante sobre a equação acima é que ela nos remete a problemas combinatórios ao notarmos o fator binomial acima.

Vamos portanto construir um processo completamente diferente que apresenta as mesmas probabilidades que o anterior. Seja 𝒮N\mathcal{S}_{N} o conjunto de todas as permutações σ\sigma de {1,,N}\{1,\dots,N\}. É fácil ver que

1(n+1)(nj)1=U𝒮n+1[σ(n+1)=j+1,σ(i)j se e só se ij].\frac{1}{(n+1)}\binom{n}{j}^{-1}=U_{\mathcal{S}_{n+1}}\Big{[}\sigma(n+1)=j+1,% \sigma(i)\leq j\text{ se e s\'{o} se }\;i\leq j\Big{]}.

Um método muito interessante de se produzir uma permutação uniforme é dado pelos seguintes exercícios.

{exercise}

Seja n1n\geq 1 um inteiro, PP uma probabilidade em (E,𝒜)(E,\mathcal{A}), σ\sigma uma permutação fixa em 𝒮n\mathcal{S}_{n}. Então

(X1,,Xn)\distr(Xσ(1),,Xσ(n)),(X_{1},\dots,X_{n})\distr(X_{\sigma(1)},\dots,X_{\sigma(n)}), (2.129)

onde XiX_{i} como sempre representam as coordenadas canônicas em (En,𝒜n,Pn)(E^{n},\mathcal{A}^{\otimes n},P^{\otimes n}).

Ou em outras palavras, aplicar uma permutação fixa a uma sequência \iidnão altera sua distribuição. Sequências de elementos aleatórios (não necessariamente \iid’s) que satisfazem (2.129) são ditas intercambiáveis.

Um outro exercício interessante nesse tópico é o seguinte {exercise} Seja n1n\geq 1 e F:[0,1]n𝒮nF:[0,1]^{n}\to\mathcal{S}_{n} dada por

F(x1,,xn)={(1,2,,n),se existe ij com xi=xjo único σ tal que xσ(1)<<xσ(n),caso contrário.F(x_{1},\dots,x_{n})=\begin{cases}(1,2,\dots,n),\qquad\text{se existe $i\neq j% $ com $x_{i}=x_{j}$, }\\ \text{o \'{u}nico $\sigma$ tal que $x_{\sigma(1)}<\dots<x_{\sigma(n)}$,}\qquad% \text{caso contr\'{a}rio.}\end{cases}

Mostre que F(U[0,1]n)=U𝒮nF_{*}(U_{[0,1]}^{\otimes n})=U_{\mathcal{S}_{n}}.

Ou seja, ordenar uma sequência de uniformes independentes nos fornece uma permutação uniforme. Como prometido, isso nos dá uma maneira de construir uma permutação uniforme de {1,,n}\{1,\dots,n\} à partir de uma sequência \iid(que é algo que já estamos começando a entender melhor).

Podemos agora escrever nossa probabilidade de observar uma sequência no modelo da Urna de Pólya em termos de uma sequência \iidde variáveis aleatórias.

1(n+1)(nN1n)\mathclap1=FU[0,1]n+1[σ(n+1)=N1n+1,σ(i)N1n se e só se iN1n]=U[0,1]n+1[Xi<Xn+1, para iN1n e Xi>Xn+1, para iN1n+1].\begin{split}\frac{1}{(n+1)}&\binom{n}{N^{n}_{1}}^{\mathclap{\;-1}}=F_{*}U_{[0% ,1]}^{\otimes n+1}\Big{[}\sigma(n+1)=N^{n}_{1}+1,\sigma(i)\leq N^{n}_{1}\text{% se e s\'{o} se }i\leq N^{n}_{1}\Big{]}\\ &=U^{\otimes n+1}_{[0,1]}\Big{[}\text{$X_{i}<X_{n+1}$, para $i\leq N^{n}_{1}$ % e $X_{i}>X_{n+1}$, para $i\geq N^{n}_{1}+1$}\Big{]}.\end{split}

Agora estamos prontos para provar o resultado principal que nos ajudará a calcular probabilidades no modelo da Urna de Pólya.

Dado u[0,1]u\in[0,1], seja Pu=\Ber(u)P_{u}=\Ber(u)^{\otimes\mathbb{N}}, ou seja a probabilidade que nos dá uma sequência infinita de moedas independentes com probabilidade uu de sucesso. Definimos agora \widebarK:[0,1]×(𝒫({0,1}))[0,1]\widebar{K}:[0,1]\times(\mathcal{P}(\{0,1\})^{\otimes\mathbb{N}})\to[0,1] dada por

\widebarK(u,A)=Pu(A).\widebar{K}(u,A)=P_{u}(A). (2.130)
{lemma}

A função \widebarK\widebar{K} definida acima é um núcleo entre [0,1][0,1] e {0,1}\{0,1\}^{\mathbb{N}}.

Demonstração.

Usando a Proposição 2.9, basta ver que {display} para todo k1k\geq 1 e w1,,wk{0,1}w_{1},\dots,w_{k}\in\{0,1\}, temos que Pu(X1=w1,,Xk=wk)P_{u}(X_{1}=w_{1},\dots,X_{k}=w_{k}) é uma função mensurável de u[0,1]u\in[0,1]. Mas é fácil ver que

Pu(X1=w1,,Xk=wk)=uN1(w1,,wk)(1u)N0(w1,,wk),P_{u}(X_{1}=w_{1},\dots,X_{k}=w_{k})=u^{N_{1}(w_{1},\dots,w_{k})}(1-u)^{N_{0}(% w_{1},\dots,w_{k})}, (2.131)

que obviamente é mensurável, provando assim o lema. ∎

O resultado muito curioso a qual nos referimos é o seguinte.

{lemma}

A lei PP definida no Exercício 2 é igual a U[0,1]\widebarKU_{[0,1]}\widebar{K}.

Em outras palavras, digamos que realizamos os seguintes experimentos. Primeiramente João realiza o processo da Urna de Pólya e anota a sequência das cores obtidas. Depois Maria sorteia uma variável aleatória XX de distribuição uniforme em [0,1][0,1] e depois joga infinitas vezes uma moeda com probabilidade XX de obter vermelho e (1X)(1-X) de obter azul, anotando também quais cores foram obtidas. Finalmente, não seríamos capazes de distinguir essas duas sequências (mesmo que pudéssemos repetir várias vezes esse experimento) pois elas tem a mesma distribuição em {0,1}\{0,1\}^{\mathbb{N}}.

Demonstração.

Já sabemos que basta mostrar a igualdade para eventos do tipo A={w1}××{wn}×{0,1}A=\{w_{1}\}\times\dots\times\{w_{n}\}\times\{0,1\}^{\mathbb{N}}. Sabemos pelo Teorema de Fubini para Núcleos que

U[0,1]\widebarK(A)=01K(u,A)u=(2.131)01uN1(w1,,wk)(1u)N0(w1,,wk)u.U_{[0,1]}\widebar{K}(A)=\int_{0}^{1}K(u,A)\d{u}\overset{\eqref{e:Polya_% binomial}}{=}\int_{0}^{1}u^{N_{1}(w_{1},\dots,w_{k})}(1-u)^{N_{0}(w_{1},\dots,% w_{k})}\d{u}. (2.132)

Por outro lado , sabemos (usando simetria entre 0 e 11) que

P(A)=U[0,1]n+1[Xi<Xn+1, para iN0n e Xi>X0, para iN0n+1]P(A)=U^{\otimes n+1}_{[0,1]}\Big{[}\text{$X_{i}<X_{n+1}$, para $i\leq N^{n}_{0% }$ e $X_{i}>X_{0}$, para $i\geq N^{n}_{0}+1$}\Big{]} (2.133)

Se definirmos K~:[0,1]×([0,1]n)\tilde{K}:[0,1]\times\mathcal{B}([0,1]^{n}), dado por K~(u,B)=U[0,1]n\tilde{K}(u,B)=U^{\otimes n}_{[0,1]}, sabemos que isso define um núcleo pelo Exercício 2.9. Mais ainda, esse mesmo exercício nos diz que U[0,1]K~=U[0,1]U_{[0,1]}\star\tilde{K}=U^{\otimes}_{[0,1]}, de forma que

P(A)=U[0,1]K~[Xi<X0, para iN0n e Xi>X0, para iN0n+1]=01U[0,1]n[Xi<u, para iN0n e Xi>u, para iN0n+1]u=01uN0n(1u)nN0nu,\begin{split}P(A)&=U_{[0,1]}\star\tilde{K}\Big{[}\text{$X_{i}<X_{0}$, para $i% \leq N^{n}_{0}$ e $X_{i}>X_{0}$, para $i\geq N^{n}_{0}+1$}\Big{]}\\ &=\int_{0}^{1}U^{\otimes n}_{[0,1]}\Big{[}\text{$X_{i}<u$, para $i\leq N^{n}_{% 0}$ e $X_{i}>u$, para $i\geq N^{n}_{0}+1$}\Big{]}\d{u}\\ &=\int_{0}^{1}u^{N^{n}_{0}}(1-u)^{n-N^{n}_{0}}\d{u},\end{split}

que coincide com U[0,1]\widebarK(A)U_{[0,1]}\widebar{K}(A), provando o lema. ∎

{exercise}

Mostre que a probabilidade, segundo o modelo da Urna de Pólya, de que observemos infinitas bolas de ambas as cores é um.