2 Contagem
2.1 Fundamentos da Combinatória
Em geral, a fórmula (1.6) afirma que, para calcular probabilidades, precisamos contar. Esta seção aprofunda o problema da contagem.
Exemplo 2.1.
Se houver 30 pessoas em uma sala, qual é a probabilidade de pelo menos duas delas terem a mesma data de aniversário? (Assuma que ninguém nasceu em 29 de fevereiro e que cada dia tem a mesma chance de ser o aniversário de alguém).
Para responder à pergunta no Exemplo 2.1, precisamos calcular a cardinalidade do conjunto de todas as possíveis combinações de datas de aniversário, bem como a cardinalidade do conjunto de todas as possíveis combinações de datas de aniversário em que pelo menos duas são iguais. Como fazemos isso? Precisaremos usar o princípio fundamental da contagem, que nos permite calcular as cardinalidades de conjuntos grandes e complexos, onde a contagem explícita não é possível.
Primeiro, começamos identificando as regras fundamentais da contagem:
- Regra da Correspondência
-
Se e estão em correspondência um-para-um, então .
- Regra da Adição
-
Se são subconjuntos mutuamente disjuntos de algum conjunto, então
(2.2) - Princípio Fundamental da Contagem
-
Suponha que os elementos de um conjunto finito podem ser determinados em etapas sucessivas, com escolhas possíveis na etapa 1, escolhas possíveis na etapa 2, , escolhas possíveis na etapa . Suponha também que escolhas diferentes levam a elementos diferentes. Então,
(2.3)
O conjunto de todas as combinações de datas de aniversário de 30 pessoas, como mostrado no Exemplo 2.1, é um exemplo de um conjunto de -tuplas ordenadas de elementos de um conjunto dado. Mais genericamente, isso é definido da seguinte forma:
Definição 2.4.
Seja um conjunto finito de cardinalidade . Uma sequência de comprimento de elementos de é uma -tupla ordenada tal que , . Denotamos por o conjunto de todas as sequências de comprimento de elementos de .
Por “ordenado”, queremos dizer que a ordem da sequência importa, por exemplo: . Note também que repetições de elementos são permitidas, por exemplo, é uma sequência de comprimento de elementos de .
Proposição 2.5.
Seja um conjunto finito de cardinalidade . O conjunto de todas as sequências de comprimento de elementos de tem cardinalidade , ou seja,
Demonstração.
Para construir um elemento arbitrário de , realizamos as seguintes etapas:
-
(a)
escolher o primeiro valor . Existem maneiras de fazer isso.
-
(b)
escolher o segundo valor . Existem maneiras de fazer isso.
-
.
Escolher o valor do º elemento. Existem maneiras de fazer isso.
Portanto, encontramos
∎
Para completar o Exemplo 2.1, também precisamos calcular a cardinalidade do conjunto de todas as datas de aniversário possíveis em que pelo menos duas são iguais. É mais fácil e equivalente (por quê?) calcular a cardinalidade do conjunto em que nenhum dois aniversários são iguais. Como não pode haver repetições, isso é um exemplo de uma "ordenação de comprimento de elementos de ". Mais genericamente, definimos ordenações de comprimento da seguinte forma:
Definição 2.8.
Seja um conjunto finito de cardinalidade e seja tal que . Uma ordenação de comprimento de elementos de é uma sequência de comprimento de elementos de sem repetições. Denotamos o conjunto de ordenações de comprimento de elementos de por . Assim, temos
Seja um conjunto finito de cardinalidades e . Então
Demonstração.
Determinamos um elemento de pelas seguintes etapas:
-
(a)
Escolhemos . Existem opções para isso.
-
(b)
Escolhemos tal que . Existem opções para isso.
-
(c)
Escolhemos tal que e . Existem opções para isso.
-
.
Escolhemos tal que . Existem opções para isso.
Pelo princípio fundamental da contagem
∎
Exemplo 2.12 (continuação).
Agora podemos responder à questão do Exemplo 2.1. Primeiro, calculamos a probabilidade de que duas pessoas não façam aniversário no mesmo dia, correspondendo ao evento B. Conforme discutido acima, B é uma ordenação de comprimento 30 ( de um conjunto de cardinalidade 365 () , então
O evento de pelo menos duas pessoas fazerem aniversário no mesmo dia é o complemento do evento B, então a probabilidade de pelo menos duas entre 30 pessoas fazerem aniversário no mesmo dia será próxima de 71%.
Observações.
Lemos como fatorial. A seguinte espera:
-
•
é o produto dos primeiros números naturais e por suposição .
-
•
é o número de maneiras pelas quais podemos ordenar os elementos de um conjunto de cardinalidade ou equivalentemente o número de maneiras de colocar os elementos de um conjunto de cardinalidade em uma linha.
-
•
= é o número de maneiras de colocar elementos de um conjunto de cardinalidade consecutivos.
Exemplo 2.14.
Agora consideramos uma questão ligeiramente diferente daquela do Exemplo 2.1: qual é a probabilidade de exatamente duas pessoas na sala fazerem aniversário no mesmo dia? Para construir tal exemplo, precisaríamos
-
1.
Escolha as duas pessoas que fazem aniversário no mesmo dia.
-
2.
Escolha um dia para o aniversário deles.
-
3.
Escolha um dia para o aniversário de todos os outros, para que nenhum outro aniversário seja igual.
De quantas maneiras podemos escolher duas pessoas que fazem aniversário no mesmo dia? Precisamos escolher dois números de – esta será uma sequência de comprimento 2 sem repetição, mas o que é diferente do que tínhamos antes é que a ordem não não importa. Quer seja ou , ainda é o mesmo par de pessoas com a mesma data de aniversário! Para corrigir isso, precisamos dividir por todas as maneiras possíveis pelas quais podemos ordenar os dois elementos - cada forma será uma sequência de comprimento 2 sem repetição, mas agora estamos escolhendo a partir de um conjunto de apenas dois pontos, então o conjunto de todas as possibilidades é . Isto dá
Denotamos isso por . Agora, voltando à nossa questão: calculámos o número de maneiras pelas quais podemos escolher as duas pessoas com o mesmo aniversário. Existem 365 maneiras de escolher o aniversário. Para as 28 pessoas restantes, haverá maneiras de escolher seus aniversários, já que todos precisam ser diferentes. Portanto, o número total de maneiras de selecionar um resultado no evento “exatamente duas pessoas fazem aniversário no mesmo dia” é
Finalmente, para calcular a probabilidade de exatamente duas pessoas fazerem aniversário no mesmo dia, precisamos dividir pela cardinalidade de todas as combinações de aniversários possíveis dada por , o que dá aproximadamente 0,38 ou 38%.
Escolher duas pessoas de um conjunto de 30 é um exemplo de combinação de elementos de . De forma mais geral, podemos perguntar o número de combinações de elementos de um conjunto finito .
Seja um conjunto finito de cardinalidade . Uma combinação de elementos de é um subconjunto de com elementos. Denotamos por o conjunto de combinações de elementos de .
xxx xxx xxx xxx xxx xxx xxx xxx xxx
Proposição 2.16.
Seja um conjunto finito de cardinalidade e . Então
Demonstração.
Observe que uma ordenação de comprimento dos elementos de pode ser obtida unicamente pelos seguintes passos:
-
(a)
Escolher uma combinação de elementos de . Existem escolhas para isso.
-
(b)
Escolher uma permutação desses elementos. Pelo Corolário 2.21, existem escolhas para isso.
Pelo princípio fundamental da contagem,
(2.18) |
A equação acima pode ser resolvida para o único termo desconhecido, resultando em
(2.19) |
Isso conclui a prova. ∎
O número de ordenações de comprimento quando a cardinalidade do conjunto também é é um caso especial importante das ordenações:
Definição 2.20.
Seja um conjunto finito de cardinalidade . Uma ordenação de comprimento dos elementos de é chamada de permutação de .
Corolário 2.21.
Seja um conjunto finito de cardinalidade . Então o número de permutações dos elementos de é .
Demonstração.
É suficiente tomar na Proposição 2.1. ∎
Exercício 2.1.
Um dado justo é lançado 8 vezes. Quantos resultados diferentes podemos obter que contenham o resultado 2 exatamente três vezes e o resultado 3 exatamente cinco vezes?
Solução.
Cada resultado possível é completamente determinado especificando quais lançamentos resultam em um 2 - o restante será 3. Por exemplo, o resultado é determinado pelo subconjunto do conjunto , em que o primeiro corresponde às posições do 2 e o segundo é a numeração de todos os lançamentos. Portanto, para calcular o número de resultados possíveis, é suficiente calcular o número de subconjuntos de tamanho 3 de um conjunto com cardinalidade 8. Isso é exatamente , que é igual a 56. ∎
Exemplo 2.22.
Vamos levar o exercício 2.1 um pouco mais adiante: como calcularíamos o número de resultados de 8 lançamentos de um dado que contenham exatamente três 2, três 4 e dois 5? Como antes, um resultado será completamente determinado especificando as posições de dois dos três possíveis resultados, por exemplo, 2 e 4. Por exemplo, o resultado corresponde aos conjuntos e , onde é o conjunto de posições do resultado 2 e da mesma forma para . Segue-se que , pois essas são as únicas duas posições restantes.
Portanto, para responder à pergunta, precisamos contar quantas maneiras podemos escolher um subconjunto de de tamanho 3 e, em seguida, outro subconjunto de tamanho 3 dos 5 elementos restantes. Temos escolhas para o primeiro conjunto e escolhas para o segundo. Aplicando o princípio fundamental da contagem, obtemos
O exemplo acima ilustra a contagem das maneiras de dividir um conjunto em um número fixo de subconjuntos. Para definir isso formalmente, primeiro precisamos definir uma partição:
Definição 2.24.
Seja um conjunto de cardinalidade e tal que . Uma partição de em subconjuntos é uma família de subconjuntos de tal que
-
(a)
Cada subconjunto na família é não vazio: .
-
(b)
Os subconjuntos na família são mutuamente disjuntos: , .
-
(c)
A união de todos os subconjuntos na família é igual a : .
Proposição 2.25.
Seja um conjunto finito com . Seja , . Então, o número de partições de em subconjuntos , de forma que , , (, ), é dado por
Demonstração.
Toda partição de que satisfaça as suposições pode ser determinada de forma única pelos seguintes passos:
-
(a)
Escolher de modo que . Existem opções para este passo.
-
(b)
Escolher de modo que e (o que implica que ). Existem opções para este passo.
-
(c)
Escolher de modo que , e (o que implica que ). Existem opções para este passo.
-
.
Finalmente, escolher o conjunto restante de modo que e para todos (notamos que ). Existem opções para este passo.
Assim, pelo princípio fundamental da contagem, o número de partições de em subconjuntos de modo que com é
(2.27) | |||
(2.28) | |||
(2.29) |
onde a última igualdade ocorre pela simplificação das frações e observando que ∎
2.2 Amostragem
Selecionar um subconjunto de um conjunto maior também é chamado de amostragem. A amostragem nos permite usar informações sobre um pequeno grupo para fazer inferências sobre as propriedades ou preferências de um grupo maior. É uma ferramenta fundamental em estatísticas. Quando a população é "homogênea"(cada pessoa no grupo provavelmente tem as mesmas propriedades ou preferências), qualquer amostra escolhida aleatoriamente (com probabilidade uniforme) será representativa do grupo - ainda precisamos usar ferramentas matemáticas avançadas para quantificar a incerteza em nossas inferências sobre uma população, dada o tamanho da amostra, mas esse é o assunto de um módulo diferente. O que gostaríamos de entender agora é como a estrutura de probabilidade nas amostras varia quando a população é mista. Para entender a pergunta, considere o seguinte.
Exemplo 2.30.
O professor de ST120 quer saber até que ponto os alunos entenderam o conceito de espaço de probabilidade. Dado o tamanho da turma, não é possível perguntar a cada aluno individualmente. Em vez disso, eles desejam amostrar um pequeno grupo de alunos e perguntar a eles. Como eles devem escolher os alunos?
Uma solução prática é conversar com alguns dos alunos na sala de aula. No entanto, existe um viés - os alunos que frequentam as aulas têm mais probabilidade de entender os conceitos! Portanto, o professor decide escolher aleatoriamente um número de números de identificação de alunos e enviá-los por e-mail, e vamos supor que todos os alunos respondam. Este seria um grupo representativo, se a turma fosse homogênea. No entanto, sabemos que a turma é composta por dois grupos de alunos de Matemática e alunos de Ciência da Computação. Para entender o viés, o professor precisa calcular a probabilidade de o grupo acabar com alunos de Matemática e alunos de Ciência da Computação. Qual seria essa probabilidade?
Existem maneiras de escolher alunos de Matemática e de escolher alunos de Ciência da Computação. Portanto, a cardinalidade do conjunto de todos os grupos de alunos de Matemática e alunos de Ciência da Computação será
A cardinalidade do conjunto de todos os grupos de alunos será . Portanto, a probabilidade de escolher um grupo com alunos de Matemática e alunos de Ciência da Computação é
O próximo passo seria usar essa probabilidade para remover o viés, mas eles precisarão consultar os professores de módulos de estatísticas mais avançados sobre como fazer isso!
O exemplo acima é um caso de amostragem de uma população de tamanho , que tem () indivíduos do tipo 1 e indivíduos do tipo 2. Retiramos uma amostra de tamanho da população inteira ’aleatoriamente’ sem reposição (ou seja, um indivíduo não pode ser escolhido duas vezes). Então, a probabilidade de a amostra conter indivíduos do tipo 1 e indivíduos do tipo 2 é dada por
Exercício 2.2.
Construa o espaço de probabilidade uniforme correspondente à amostragem sem reposição de uma população com dois tipos de indivíduos e prove (2.32). Em outras palavras, forneça o triplo de acordo com a proposição 1.6, de modo que, todas as realizações tenham a mesma probabilidade. O evento de interesse é o conjunto de todas as combinações que contêm números de a e números de a .
Exemplo 2.33.
Agora considere o seguinte problema: um biólogo ambiental está estudando o peso de uma espécie específica de peixe. Para fazer isso, eles retiram uma amostra dessa população de peixes, pesam os peixes e depois os liberam de volta à natureza. Suponha que não há maneira de saber se um peixe já foi amostrado. Além disso, suponha que a população consiste apenas em dois tipos de peixes - machos e fêmeas - que têm pesos médios ligeiramente diferentes e isso precisa ser levado em consideração ao remover o viés.
Se a população inteira de peixes for , com machos e fêmeas e o tamanho da amostra for , qual é a probabilidade de ter machos e fêmeas na amostra?
A diferença entre este exemplo e o exemplo 2.30 é que agora os indivíduos podem ser escolhidos mais de uma vez. Como resultado, não é mais suficiente determinar apenas as posições dos indivíduos do tipo 1 na amostra, mas também precisamos especificar os indivíduos para que possamos acompanhar os escolhidos repetidamente. Portanto, passamos pelo seguinte processo:
-
•
Escolha a posição dos machos (as posições restantes serão ocupadas pelas fêmeas) - há escolhas.
-
•
Escolha os machos que são escolhidos - há escolhas.
-
•
Escolha as fêmeas que são escolhidas - há escolhas.
Portanto, o número de amostras diferentes com machos e fêmeas será
Dado que o número total de amostras possíveis é , a probabilidade de escolher machos e fêmeas será dada por
O acima é um exemplo de amostragem de uma população de tamanho , que possui () indivíduos do tipo 1 e indivíduos do tipo 2. Nós tiramos uma amostra de tamanho da população inteira ’aleatoriamente’ com reposição (ou seja, um indivíduo pode ser escolhido duas vezes). Então, a probabilidade de a amostra conter indivíduos do tipo 1 e indivíduos do tipo 2 é dada por (2.34).
Exercício 2.3.
Construa o espaço de probabilidade uniforme correspondente à amostragem com reposição de uma população com dois tipos de indivíduos e prove (2.34). Agora, o evento de interesse é o conjunto de todas as sequências que contêm números de a e números de a .
Exercício 2.4.
As probabilidades de amostragem não devem ser sensíveis a qual tipo foi considerado ’1’ e qual tipo foi considerado ’2’. De fato,
Supondo que e , verifique a identidade acima.
Revisão de Combinatória
Conjunto finito , .
Sequências de comprimento de elementos de :
pois para especificar um elemento de , precisamos fazer escolhas, e em cada escolha temos opções.
Permutações (ou reorganizações) de elementos de :
pois precisamos fazer escolhas, e a cada escolha o número de opções diminui. (leia-se "fatorial de ")
Ordenação de comprimento de elementos de :
porque podemos obter qualquer elemento de permutando os elementos de , mantendo os primeiros elementos e esquecendo a ordem dos restantes.
Subconjuntos de com cardinalidade :
pois podemos obter qualquer elemento de tomando os primeiros elementos em uma permutação de , mantendo os primeiros elementos e depois esquecendo a ordem desses elementos, assim como os restantes. (leia-se "combinação de escolha ")
Decomposição de em conjuntos rotulados de modo que para , onde .
pois podemos obter a partição primeiro permutando todos os elementos de , tomando como os primeiros elementos dessa permutação, como os próximos elementos e assim por diante, e depois esquecendo a ordem de cada bloco. Este é o número de maneiras pelas quais bolas rotuladas podem ser distribuídas em baldes rotulados sob a restrição de que, para cada , o balde número recebe bolas. As combinações são apenas um caso particular de dois baldes rotulados como "dentro"e "fora".
Para fornecer uma justificação mais rigorosa para os termos no denominador (que chamamos de "esquecer a ordenação"), podemos obter o número raciocinando de trás para frente, como segue. Vamos produzir uma permutação de de duas maneiras. A primeira maneira tem três etapas:
-
(a)
Escolher elementos de para irem primeiro, e deixar os restantes irem depois. Existem possibilidades.
-
(b)
Permutar os primeiros elementos. Existem possibilidades.
-
(c)
Permutar os elementos restantes . Existem possibilidades.
No total, existem possibilidades. A segunda maneira é direta: apenas permutar os elementos já existentes, existem possibilidades. Portanto, , então acabamos de descobrir o que é ! Portanto, .
Revisão de Amostragem
População com indivíduos, onde são indivíduos do Tipo 1 e são indivíduos do Tipo 2.
Se tirarmos uma amostra de indivíduos, sem reposição, então a chance de escolher elementos do Tipo 1 (e, portanto, indivíduos do Tipo 2) é
Isso pode ser obtido assumindo que os indivíduos foram amostrados simultaneamente (então ) ou um após o outro (então ), e ambas as abordagens fornecem a mesma probabilidade (como esperado!). De fato, a segunda abordagem fornece
que se simplifica para a primeira fórmula se expandirmos o primeiro termo.
Se tirarmos uma amostra de indivíduos, com reposição, então a chance de escolher elementos do Tipo 1 (e, portanto, indivíduos do Tipo 2) é
Isso só pode ser alcançado assumindo que os indivíduos foram amostrados um após o outro, para que possamos devolvê-los à população (então ). A fórmula acima é obtida após reescrever
de uma forma mais conveniente (ou significativa).
Observe que, se denota o número de indivíduos do Tipo 1 na amostra com reposição, então
o que pode ser verificado combinando a fórmula acima com a função de massa de probabilidade de uma variável aleatória binomial.