4 Probabilidade Condicional e Independência
4.1 Probabilidade Condicional
Exemplo 4.1.
Suponha que antes de lançar um dado justo, você faz uma aposta de uma libra que o resultado será . Seu amigo vê o resultado antes de você e lhe diz que o dado mostrou um número par. Você continuaria com a aposta ou desistiria dela? E se você fosse informado de que o resultado é ímpar? Como essas informações parciais sobre o resultado mudam a probabilidade?
Modelamos o espaço de probabilidade correspondente ao lançamento de um dado justo tomando , como o conjunto de todos os subconjuntos e como a probabilidade uniforme sobre ele. Então, o evento que nosso amigo nos diz que ocorreu é
(4.2) |
O evento favorável para nós é
Saber que o resultado é par pode ser interpretado como mudar o espaço amostral de para . Intuitivamente, assumiríamos que a probabilidade no novo espaço amostral permanece uniforme, mas a probabilidade de cada resultado muda de para , pois agora existem apenas resultados possíveis. Dado que nosso resultado preferido, o , não está no novo espaço amostral, esperaríamos que a probabilidade de obter seja e, portanto, faria sentido desistir da aposta. Se, por outro lado, nos dissessem que o resultado é ímpar, poderíamos reformular o espaço de probabilidade como um com espaço amostral e esperaríamos que a probabilidade de vencer a aposta fosse , pois é um dos resultados possíveis.
E se apostássemos em ? Então estaríamos olhando para a quantidade de maneiras pelas quais ainda podemos vencer, dividida pela quantidade de resultados possíveis. Portanto, de acordo com nossa intuição, esperaríamos que a probabilidade atualizada, dada que o evento ocorreu, fosse
Mas isso é uma probabilidade bem definida?
Proposição 4.3.
Seja um espaço de probabilidade e tal que . Seja tal que
Então, é uma medida de probabilidade.
Demonstração.
Precisamos verificar se todas as propriedades das medidas de probabilidade são satisfeitas.
-
(a)
Primeiro, precisamos mostrar que está definido para todo e assume valores em , ou seja, é um mapeamento de para , como deveria ser.
-
•
Seja . Assumimos que e, portanto, , pois o espaço de eventos é fechado sob interseções. Portanto, está bem definido e, como , sua razão está bem definida.
-
•
e, portanto, (proposição 3.25). Segue que . Da mesma forma, como e , segue que . Portanto, .
-
•
-
(b)(4.5)
conforme requerido.
-
(c)
(aditividade contável) Seja para todo , de modo que para todos (eventos disjuntos). Então
(4.6) (4.7)
Agora, como e para todos , segue que para todos . Além disso, os eventos são disjuntos. De fato, para
Uma vez que é uma medida de probabilidade, ela é aditiva contável, o que implica que
∎
Definição 4.10.
Seja um espaço de probabilidade e tal que . Para , a probabilidade condicional de dado é denotada por e é definida como
Exercício 4.1.
Um experimento consiste em lançar uma moeda justa 7 vezes.
-
(a)
Descreva o espaço de probabilidade associado a ele.
-
(b)
Seja o evento correspondente a obter um número primo de caras. Qual é ?
-
(c)
Seja o evento "Cara ocorre pelo menos 6 vezes". Qual é ?
Solução.
-
(a)
, é o conjunto das partes de e é a probabilidade uniforme, ou seja, é tal que
(4.12)Lembrando que
-
(b)
Para , seja o evento "obtemos exatamente caras". Os elementos de podem ser caracterizados de forma única pela posição de H na sequência. Portanto, pelo princípio fundamental da contagem, . Assim,
Agora, observe que para (nenhum resultado tem tanto quanto caras) e
(4.13)Então, pela aditividade finita
(4.14) (4.15) -
(c)
é o evento "H aparece pelo menos 6 vezes", então . Observe que,
(4.16) (4.17) Agora, podemos calcular . Pela definição,
(4.18) Como , temos
Exemplo 4.19.
Um estudante compra 2 maçãs, 3 bananas e 5 cocos. Todos os dias o estudante escolhe uma fruta uniformemente ao acaso e a come.
O espaço amostral é o conjunto de todas as tríades que podem ser construídas com as frutas disponíveis, em que cada resultado corresponde à fruta comida em cada dia. Como no final dos três dias temos todas as informações, o espaço de eventos é o conjunto das partes do espaço amostral. Definimos os eventos o estudante come uma maçã no dia i, o estudante come uma banana no dia i e o estudante come um coco no dia i.
-
(a)
Qual é a probabilidade de o estudante comer um coco no dia 1 e uma banana no dia 2? O evento ’o estudante come um coco no dia 1 e uma banana no dia 2’ corresponde ao evento . Observe que a maneira como a informação sobre a probabilidade é codificada é por meio de probabilidades condicionais: a afirmação ’todos os dias o estudante escolhe uma fruta uniformemente ao acaso e a come’ pode ser interpretada como a probabilidade condicional de escolher qualquer uma das frutas restantes uniformemente ao acaso, então sabemos que
Segue da definição de probabilidade condicional que
Escrever a probabilidade de interseção de dois eventos como um produto de uma probabilidade condicional e uma probabilidade é chamado de ’regra da multiplicação’ e pode ser estendido para interseções de mais de dois eventos. Por exemplo, consideremos a seguinte pergunta.
-
(b)
Qual é a probabilidade de no terceiro dia o estudante comer a última maçã? Como existem exatamente duas maçãs, isso significa que o estudante comerá a primeira maçã no dia 1 ou no dia 2. Portanto, se é o evento ’estudante come a última maçã no terceiro dia’, podemos escrever
(4.20)Observe que os eventos e são disjuntos, portanto
(4.21) (4.22) (4.23) usando a regra da multiplicação duas vezes.
Proposição 4.24 (Regra da Multiplicação).
Seja um espaço de probabilidade e de modo que Então,
Demonstração.
Observe que para , Portanto, pela Proposição 3.25 e pela hipótese
que garante que todas as probabilidades condicionais no lado direito sejam bem definidas. O resultado segue de uma aplicação direta da definição de probabilidade condicional no lado direito:
(4.27) | |||
(4.28) | |||
(4.29) |
4.2 Lei da Probabilidade Total
Exemplo 4.30 (4.19 continuado).
Suponha que agora nos seja perguntado para calcular a probabilidade de o estudante comer um coco no dia 2. Para calcular a probabilidade, precisamos condicionar o que aconteceu no dia 1, percorrendo todas as opções possíveis. Neste caso, existem duas opções que afetam o cálculo da probabilidade condicional: se o estudante também comeu um coco no dia 1 (evento ) ou não (evento ). Portanto,
De onde vem esta fórmula? Nós escrevemos
Assim, a partir da aditividade finita, segue que
Ao aplicar a regra da multiplicação às probabilidades condicionais acima, obtemos a fórmula que é um exemplo específico da lei da probabilidade total.
A lei da probabilidade total nos permite calcular a probabilidade de um evento, condicionando em todas as instâncias possíveis de um ’evento diferente’, ou, de forma mais formal, em todos os conjuntos de uma partição do espaço amostral.
Definição 4.31.
Seja um espaço de probabilidade. Seja para todos (onde é finito ou infinito). Então, a coleção de todos os , , é chamada de partição de se
-
•
.
-
•
-
•
.
Portanto, uma partição é uma coleção de eventos não vazios e disjuntos que abrange todo o espaço.
Proposição 4.32 (Lei da Probabilidade Total).
Seja um espaço de probabilidade e com finito ou infinito, seja uma partição de tal que . Então, para todo
Demonstração.
Observe que, uma vez que forma uma partição de , temos
Além disso, uma vez que os ’s são disjuntos, os conjuntos também são disjuntos, portanto, pela aditividade finita/contável, temos
Na última igualdade, usamos a definição de probabilidade condicional com a suposição de que . ∎
Exemplo 4.36.
Um estudante enfrenta uma pergunta de múltipla escolha, com 4 opções. O estudante ou sabe a resposta ou escolhe uma das respostas de forma uniforme e aleatória. A probabilidade de o estudante saber a resposta é .
-
(a)
O estudante deseja calcular a probabilidade de responder corretamente. Vamos começar definindo os eventos de interesse:
(4.37) (4.38) As informações que temos sobre a probabilidade são que ’o estudante ou sabe a resposta (e, portanto, responde corretamente)’ ou ’escolhe uma das respostas de forma uniforme e aleatória’. Isso pode ser expresso como e . Também nos foi dito que a probabilidade de o estudante saber a resposta é . Portanto, . Dadas essas informações, nos é pedido para encontrar .
Uma vez que e formam uma partição do espaço amostral, aplicando a lei da probabilidade total obtemos
O professor gostaria de saber a probabilidade de o estudante saber a resposta se ele respondeu corretamente, ou seja, . Como podemos usar as informações que temos para calcular isso? Escrevemos
Isso é um exemplo específico do que é conhecido como a fórmula de Bayes.
4.3 Teorema de Bayes
Teorema 4.39 (Teorema de Bayes).
Seja um espaço de probabilidade e , com finito ou infinito, seja uma partição de tal que . Então, para tal que
Demonstração.
Pela definição de probabilidade condicional e como é tal que , então pela definição de probabilidade condicional e pela lei da probabilidade total:
(4.41) |
Exemplo 4.42 (Falsos Positivos).
Uma doença tem uma incidência de em na população. O teste diagnóstico disponível é tal que
-
•
se você tem a doença, o teste é positivo com probabilidade
-
•
se você não tem a doença, o teste é positivo com probabilidade .
Uma pessoa recebe um resultado positivo. Qual é a probabilidade de ela realmente ter a doença?
Os dois eventos de interesse são a pessoa tem a doença e a pessoa tem um teste positivo. Estamos interessados em . As informações que temos são , e . Pelo Teorema de Bayes
(4.43) |
O Teorema de Bayes nos permite calcular a probabilidade condicional de um evento, dado outro, em termos das probabilidades condicionais inversas. É particularmente útil em Estatística, levando a uma área inteira chamada Estatística Bayesiana: enquanto na probabilidade, estamos interessados em calcular probabilidades dadas um ’modelo’ (ou seja, informações suficientes que determinam as probabilidades), na estatística, estamos interessados em escolher um modelo, dadas as observações que fazemos. O Teorema de Bayes nos permite conectar os dois.
4.4 Independência
Definição 4.44.
Seja um espaço de probabilidade. Dizemos que os eventos e são independentes se
Uma maneira de pensar na independência é que o conhecimento sobre a ocorrência de um dos eventos não aumentará nem diminuirá a chance de o outro ocorrer. De fato, assumindo que , você pode verificar que e são independentes se e somente se (exercício!). Em particular, se e são independentes, então e também são independentes.
Observação 3.
As noções de eventos "independentes"e "disjuntos"são muito diferentes. Na verdade, essas noções são normalmente incompatíveis: dois eventos disjuntos são independentes se e somente se a probabilidade de um deles for (exercício!).
Definição 4.45.
Seja um espaço de probabilidade e sejam eventos. Dizemos que os eventos são mutuamente independentes aos pares se e forem independentes para todas as escolhas de e distintos. Dizemos que os eventos são mutuamente independentes, se
para todo e para todas as escolhas de .
No caso em que , independência aos pares é obviamente o mesmo que independência mútua. No caso em que , independência aos pares significa
(4.46) | |||
(4.47) | |||
(4.48) |
enquanto independência mútua significa
(4.49) | |||
(4.50) | |||
(4.51) | |||
(4.52) |
Isso ilustra que a independência mútua é mais forte do que a independência aos pares. É difícil listar as condições para valores maiores de . Por exemplo, se , a independência aos pares envolve condições a serem verificadas, e a independência mútua envolve condições a serem verificadas.
Exemplo 4.53.
Dois dados são lançados. Sejam
(4.54) | ||||
(4.55) | ||||
(4.56) |
Esses eventos são independentes aos pares, pois
(4.57) | |||
(4.58) | |||
(4.59) |
Isso significa que, para cada par de eventos dessa família, o conhecimento sobre a ocorrência de um deles não afetará as chances de que os outros dois ocorram. Em particular, nem nem isoladamente afetarão as chances de . No entanto, saber que e ocorrem aumentará de fato a chance de que ocorra, como
De maneira mais formal,
Exemplo 4.60.
Lance três moedas justas. Considere os eventos:
(4.61) | |||
(4.62) | |||
(4.63) | |||
(4.64) |
Então:
Esses eventos são independentes aos pares.
, e são mutuamente independentes.
, , e não são mutuamente independentes.