2 Contagem

2.1 Fundamentos da Combinatória

Em geral, a fórmula (1.6) afirma que, para calcular probabilidades, precisamos contar. Esta seção aprofunda o problema da contagem.

Exemplo 2.1.

Se houver 30 pessoas em uma sala, qual é a probabilidade de pelo menos duas delas terem a mesma data de aniversário? (Assuma que ninguém nasceu em 29 de fevereiro e que cada dia tem a mesma chance de ser o aniversário de alguém).

Para responder à pergunta no Exemplo 2.1, precisamos calcular a cardinalidade do conjunto de todas as possíveis combinações de datas de aniversário, bem como a cardinalidade do conjunto de todas as possíveis combinações de datas de aniversário em que pelo menos duas são iguais. Como fazemos isso? Precisaremos usar o princípio fundamental da contagem, que nos permite calcular as cardinalidades de conjuntos grandes e complexos, onde a contagem explícita não é possível.

Primeiro, começamos identificando as regras fundamentais da contagem:

Regra da Correspondência

Se AA e BB estão em correspondência um-para-um, então |A|=|B||A|=|B|.

Regra da Adição

Se A1,,AnA_{1},\dots,A_{n} são subconjuntos mutuamente disjuntos de algum conjunto, então

|i=1nAi|=i=1n|Ai|.\left|\bigcup_{i=1}^{n}A_{i}\right|=\sum_{i=1}^{n}|A_{i}|\,. (2.2)
Princípio Fundamental da Contagem

Suponha que os elementos de um conjunto finito EE podem ser determinados em kk etapas sucessivas, com n1n_{1} escolhas possíveis na etapa 1, n2n_{2} escolhas possíveis na etapa 2, \dots, nkn_{k} escolhas possíveis na etapa kk. Suponha também que escolhas diferentes levam a elementos diferentes. Então,

|E|=n1n2nk.|E|=n_{1}\cdot n_{2}\cdot\dots\cdot n_{k}\,. (2.3)

O conjunto de todas as combinações de datas de aniversário de 30 pessoas, como mostrado no Exemplo 2.1, é um exemplo de um conjunto de kk-tuplas ordenadas de elementos de um conjunto dado. Mais genericamente, isso é definido da seguinte forma:

Definição 2.4.

Seja AA um conjunto finito de cardinalidade nn\in\mathbb{N}. Uma sequência de comprimento kk\in\mathbb{N} de elementos de AA é uma kk-tupla ordenada (a1,,ak)(a_{1},\dots,a_{k}) tal que aiAa_{i}\in A, i=1,2,ki=1,2,\dots k. Denotamos por Sn,k(A)S_{n,k}(A) o conjunto de todas as sequências de comprimento kk de elementos de AA.

Por “ordenado”, queremos dizer que a ordem da sequência importa, por exemplo: (a1,a2)(a2,a1)(a_{1},a_{2})\neq(a_{2},a_{1}). Note também que repetições de elementos são permitidas, por exemplo, (1,1)(1,1) é uma sequência de comprimento 22 de elementos de {1}\{1\}.

Proposição 2.5.

Seja AA um conjunto finito de cardinalidade nn\in\mathbb{N}. O conjunto Sn,k(A)S_{n,k}(A) de todas as sequências de comprimento kk\in\mathbb{N} de elementos de AA tem cardinalidade nkn^{k}, ou seja,

|Sn,k(A)|=nk|S_{n,k}(A)|=n^{k} (2.6)
Demonstração.

Para construir um elemento arbitrário (a1,a2,,ak)(a_{1},a_{2},\dots,a_{k}) de Sn,k(A)S_{n,k}(A), realizamos as seguintes etapas:

  1. (a)

    escolher o primeiro valor a1a_{1}. Existem n1=|A|=nn_{1}=|A|=n maneiras de fazer isso.

  2. (b)

    escolher o segundo valor a2a_{2}. Existem n2=|A|=nn_{2}=|A|=n maneiras de fazer isso.

    \vdots
  3. kk.

    Escolher o valor aka_{k} do kkº elemento. Existem nk=|A|=nn_{k}=|A|=n maneiras de fazer isso.

Portanto, encontramos

|Sn,k(A)|=n1n2nk=nnnk vezes=nk.|S_{n,k}(A)|=n_{1}\cdot n_{2}\cdot\dots\cdot n_{k}=\underbrace{n\cdot n\cdot% \dots\cdot n}_{k\text{ vezes}}=n^{k}\,. (2.7)

Para completar o Exemplo 2.1, também precisamos calcular a cardinalidade do conjunto de todas as datas de aniversário possíveis em que pelo menos duas são iguais. É mais fácil e equivalente (por quê?) calcular a cardinalidade do conjunto em que nenhum dois aniversários são iguais. Como não pode haver repetições, isso é um exemplo de uma "ordenação de comprimento 3030 de elementos de {1,,365}\{1,\dots,365\}". Mais genericamente, definimos ordenações de comprimento kk da seguinte forma:

Definição 2.8.

Seja AA um conjunto finito de cardinalidade nn\in\mathbb{N} e seja kk\in\mathbb{N} tal que knk\leqslant n. Uma ordenação de comprimento kk de elementos de AA é uma sequência de comprimento kk de elementos de AA sem repetições. Denotamos o conjunto de ordenações de comprimento kk de elementos de AA por On,k(A)O_{n,k}(A). Assim, temos

On,k(A)={(a1,,ak):aiAi=1,,k,aiajij}.O_{n,k}(A)=\{(a_{1},\dots,a_{k}):\,a_{i}\in A\,\forall i=1,\dots,k,\quad a_{i}% \neq a_{j}\,\,\forall i\neq j\}\,. (2.9)
{proposi\cc\~ao}

Seja AA um conjunto finito de cardinalidades nn\in\mathbb{N} e knk\leqslant n. Então

|On,k(A)|=n(n1)(nk+1).|O_{n,k}(A)|=n(n-1)\dots(n-k+1)\,. (2.10)
Demonstração.

Determinamos um elemento de On,k(A)O_{n,k}(A) pelas seguintes etapas:

  1. (a)

    Escolhemos a1a_{1}. Existem n1=|A|=nn_{1}=|A|=n opções para isso.

  2. (b)

    Escolhemos a2a_{2} tal que a2a1a_{2}\neq a_{1}. Existem n2=n1n_{2}=n-1 opções para isso.

  3. (c)

    Escolhemos a3a_{3} tal que a3a2a_{3}\neq a_{2} e a3a1a_{3}\neq a_{1}. Existem n3=n2n_{3}=n-2 opções para isso.

    \vdots
  4. kk.

    Escolhemos aka_{k} tal que akaia_{k}\neq a_{i} i=1,2,,k1\forall\,i=1,2,\dots,k-1. Existem nk=n(k1)n_{k}=n-(k-1) opções para isso.

Pelo princípio fundamental da contagem

|On,k(A)|=n1n2nk=n(n1)(nk+1).|O_{n,k}(A)|=n_{1}n_{2}\dots n_{k}=n(n-1)\dots(n-k+1)\,. (2.11)

Exemplo 2.12 (continuação).

Agora podemos responder à questão do Exemplo 2.1. Primeiro, calculamos a probabilidade de que duas pessoas não façam aniversário no mesmo dia, correspondendo ao evento B. Conforme discutido acima, B é uma ordenação de comprimento 30 (k=30k=30 de um conjunto de cardinalidade 365 (n=365n=365) , então

(B)=|B||Ω|=365××(36530+1)365300,29\mathbb{P}(B)=\frac{|B|}{|\Omega|}=\frac{365\times\cdots\times(365-30+1)}{365^% {30}}\approx 0,29 (2.13)

O evento de pelo menos duas pessoas fazerem aniversário no mesmo dia é o complemento do evento B, então a probabilidade de pelo menos duas entre 30 pessoas fazerem aniversário no mesmo dia será próxima de 71%.

Observações.

Lemos n!n! como nn fatorial. A seguinte espera:

  • n!n! é o produto dos primeiros nn números naturais e por suposição 0!=10!=1.

  • n!n! é o número de maneiras pelas quais podemos ordenar os elementos de um conjunto de cardinalidade nn ou equivalentemente o número de maneiras de colocar os elementos de um conjunto de cardinalidade nn em uma linha.

  • n(n1)(nk+1)n(n-1)\dots(n-k+1) = n!(nk)!\frac{n!}{(n-k)!} é o número de maneiras de colocar kk elementos de um conjunto de cardinalidade nn consecutivos.

Exemplo 2.14.

Agora consideramos uma questão ligeiramente diferente daquela do Exemplo 2.1: qual é a probabilidade de exatamente duas pessoas na sala fazerem aniversário no mesmo dia? Para construir tal exemplo, precisaríamos

  • 1.

    Escolha as duas pessoas que fazem aniversário no mesmo dia.

  • 2.

    Escolha um dia para o aniversário deles.

  • 3.

    Escolha um dia para o aniversário de todos os outros, para que nenhum outro aniversário seja igual.

De quantas maneiras podemos escolher duas pessoas que fazem aniversário no mesmo dia? Precisamos escolher dois números de C={1,,30}C=\{1,\dots,30\} – esta será uma sequência de comprimento 2 sem repetição, mas o que é diferente do que tínhamos antes é que a ordem não não importa. Quer seja (1,2)(1,2) ou (2,1)(2,1), ainda é o mesmo par de pessoas com a mesma data de aniversário! Para corrigir isso, precisamos dividir por todas as maneiras possíveis pelas quais podemos ordenar os dois elementos - cada forma será uma sequência de comprimento 2 sem repetição, mas agora estamos escolhendo a partir de um conjunto de apenas dois pontos, então o conjunto de todas as possibilidades é O2,2O_{2,2}. Isto dá

|O30,2||O2,2|=30×292!=30!28!2!.\frac{|O_{30,2}|}{|O_{2,2}|}=\frac{30\times 29}{2!}=\frac{30!}{28!2!}. (2.15)

Denotamos isso por (302)\binom{30}{2}. Agora, voltando à nossa questão: calculámos o número de maneiras pelas quais podemos escolher as duas pessoas com o mesmo aniversário. Existem 365 maneiras de escolher o aniversário. Para as 28 pessoas restantes, haverá 364××(36528)364\times\cdots\times(365-28) maneiras de escolher seus aniversários, já que todos precisam ser diferentes. Portanto, o número total de maneiras de selecionar um resultado no evento “exatamente duas pessoas fazem aniversário no mesmo dia” é

30!28!2!365×364××(36528).\frac{30!}{28!2!}365\times 364\times\cdots\times(365-28).

Finalmente, para calcular a probabilidade de exatamente duas pessoas fazerem aniversário no mesmo dia, precisamos dividir pela cardinalidade de todas as combinações de aniversários possíveis dada por 36530365^{30}, o que dá aproximadamente 0,38 ou 38%.

Escolher duas pessoas de um conjunto de 30 é um exemplo de combinação de 22 elementos de {1,,30}\{1,\dots,30\}. De forma mais geral, podemos perguntar o número de combinações de kk elementos de um conjunto finito AA.

{defini\cc\~ao}

Seja AA um conjunto finito de cardinalidade nn\in\mathbb{N}. Uma combinação de kk elementos de AA é um subconjunto de AA com kk elementos. Denotamos por Cn,k(A)C_{n,k}(A) o conjunto de combinações de kk elementos de AA.

xxx xxx xxx xxx xxx xxx xxx xxx xxx

Proposição 2.16.

Seja AA um conjunto finito de cardinalidade nn\in\mathbb{N} e knk\leqslant n. Então

|Cn,k(A)|=(nk)=n!k!(nk)!.|C_{n,k}(A)|=\binom{n}{k}=\frac{n!}{k!(n-k)!}\,. (2.17)
Demonstração.

Observe que uma ordenação de comprimento kk dos elementos de AA pode ser obtida unicamente pelos seguintes passos:

  1. (a)

    Escolher uma combinação de kk elementos de AA. Existem n1=|Cn,k(A)|n_{1}=|C_{n,k}(A)| escolhas para isso.

  2. (b)

    Escolher uma permutação desses elementos. Pelo Corolário 2.21, existem n2=k!n_{2}=k! escolhas para isso.

Pelo princípio fundamental da contagem,

|On,k(A)|\displaystyle|O_{n,k}(A)| =|Cn,k(A)|k!.\displaystyle=|C_{n,k}(A)|\cdot k!. (2.18)

A equação acima pode ser resolvida para o único termo desconhecido, resultando em

|Cn,k(A)|=|On,k(A)|k!=n!(nk)!k!=(nk).\displaystyle|C_{n,k}(A)|=\frac{|O_{n,k}(A)|}{k!}=\frac{n!}{(n-k)!k!}=\binom{n% }{k}\,. (2.19)

Isso conclui a prova. ∎

O número de ordenações de comprimento nn quando a cardinalidade do conjunto também é nn é um caso especial importante das ordenações:

Definição 2.20.

Seja AA um conjunto finito de cardinalidade nn\in\mathbb{N}. Uma ordenação de comprimento nn dos elementos de AA é chamada de permutação de AA.

Corolário 2.21.

Seja AA um conjunto finito de cardinalidade nn\in\mathbb{N}. Então o número de permutações dos elementos de AA é n(n1)(n2)1=n!n(n-1)(n-2)\dots 1=n!.

Demonstração.

É suficiente tomar k=nk=n na Proposição 2.1. ∎

Exercício 2.1.

Um dado justo é lançado 8 vezes. Quantos resultados diferentes podemos obter que contenham o resultado 2 exatamente três vezes e o resultado 3 exatamente cinco vezes?

Solução.

Cada resultado possível é completamente determinado especificando quais lançamentos resultam em um 2 - o restante será 3. Por exemplo, o resultado (2,3,2,2,3,3,3,3)(2,3,2,2,3,3,3,3) é determinado pelo subconjunto {1,3,4}\{1,3,4\} do conjunto {1,2,3,4,5,6,7,8}\{1,2,3,4,5,6,7,8\}, em que o primeiro corresponde às posições do 2 e o segundo é a numeração de todos os lançamentos. Portanto, para calcular o número de resultados possíveis, é suficiente calcular o número de subconjuntos de tamanho 3 de um conjunto com cardinalidade 8. Isso é exatamente C8,3C_{8,3}, que é igual a 56. ∎

Exemplo 2.22.

Vamos levar o exercício 2.1 um pouco mais adiante: como calcularíamos o número de resultados de 8 lançamentos de um dado que contenham exatamente três 2, três 4 e dois 5? Como antes, um resultado será completamente determinado especificando as posições de dois dos três possíveis resultados, por exemplo, 2 e 4. Por exemplo, o resultado (2,4,5,2,2,5,4,4)(2,4,5,2,2,5,4,4) corresponde aos conjuntos A2={1,4,5}A_{2}=\{1,4,5\} e A4={2,7,8}A_{4}=\{2,7,8\}, onde A2A_{2} é o conjunto de posições do resultado 2 e da mesma forma para A4A_{4}. Segue-se que A5={3,6}A_{5}=\{3,6\}, pois essas são as únicas duas posições restantes.

Portanto, para responder à pergunta, precisamos contar quantas maneiras podemos escolher um subconjunto de {1,2,3,4,5,6,7,8}\{1,2,3,4,5,6,7,8\} de tamanho 3 e, em seguida, outro subconjunto de tamanho 3 dos 5 elementos restantes. Temos (83)\binom{8}{3} escolhas para o primeiro conjunto e (53)\binom{5}{3} escolhas para o segundo. Aplicando o princípio fundamental da contagem, obtemos

(83)(53)=8!5!3!5!3!2!=8!3!3!2!.\binom{8}{3}\binom{5}{3}=\frac{8!}{5!3!}\frac{5!}{3!2!}=\frac{8!}{3!3!2!}. (2.23)

O exemplo acima ilustra a contagem das maneiras de dividir um conjunto em um número fixo de subconjuntos. Para definir isso formalmente, primeiro precisamos definir uma partição:

Definição 2.24.

Seja AA um conjunto de cardinalidade nn\in\mathbb{N} e rr\in\mathbb{N} tal que rnr\leqslant n. Uma partição de AA em rr subconjuntos é uma família {A1,,Ar}\{A_{1},\dots,A_{r}\} de subconjuntos de AA tal que

  1. (a)

    Cada subconjunto na família é não vazio: Ai∅︀A_{i}\neq\emptyset i=1,2,,r\forall\,i=1,2,\dots,r.

  2. (b)

    Os subconjuntos na família são mutuamente disjuntos: AiAj=∅︀A_{i}\cap A_{j}=\emptyset ij\forall\,i\neq j, i,j=1,2,,ri,j=1,2,\dots,r.

  3. (c)

    A união de todos os subconjuntos na família é igual a AA: i=1rAi=A\bigcup_{i=1}^{r}A_{i}=A.

Proposição 2.25.

Seja AA um conjunto finito com |A|=n|A|=n. Seja rr\in\mathbb{N}, rnr\leqslant n. Então, o número de partições de AA em rr subconjuntos {A1,,Ar}\{A_{1},\dots,A_{r}\}, de forma que |A1|=k1|A_{1}|=k_{1}, |A2|=k2|A_{2}|=k_{2}\dots, |Ar|=kr|A_{r}|=k_{r} (k1+k2++kr=nk_{1}+k_{2}+\dots+k_{r}=n, 1kin1\leqslant k_{i}\leqslant n), é dado por

n!k1!k2!kr!.\frac{n!}{k_{1}!k_{2}!\dots k_{r}!}\,. (2.26)
Demonstração.

Toda partição de AA que satisfaça as suposições pode ser determinada de forma única pelos seguintes passos:

  1. (a)

    Escolher A1AA_{1}\subseteq A de modo que |A1|=k1|A_{1}|=k_{1}. Existem (nk1){n\choose k_{1}} opções para este passo.

  2. (b)

    Escolher A2AA_{2}\subseteq A de modo que |A2|=k2|A_{2}|=k_{2} e A1A2=∅︀A_{1}\cap A_{2}=\emptyset (o que implica que A2AA1A_{2}\subseteq A\setminus A_{1}). Existem (nk1k2){n-k_{1}\choose k_{2}} opções para este passo.

  3. (c)

    Escolher A3AA_{3}\subseteq A de modo que |A3|=k3|A_{3}|=k_{3}, A3A2=∅︀A_{3}\cap A_{2}=\emptyset e A3A1=∅︀A_{3}\cap A_{1}=\emptyset (o que implica que A3A(A1A2)A_{3}\subseteq A\setminus(A_{1}\cup A_{2})). Existem (nk1k2k3){n-k_{1}-k_{2}\choose k_{3}} opções para este passo.

    \vdots
  4. rr.

    Finalmente, escolher o conjunto restante ArAA_{r}\subseteq A de modo que |Ar|=kr|A_{r}|=k_{r} e AiAj=∅︀A_{i}\cap A_{j}=\emptyset para todos i=1,2,,r1i=1,2,\dots,r-1 (notamos que ArA(A1Ar)A_{r}\subseteq A\setminus(A_{1}\cup\dots\cup A_{r})). Existem (n(k1+k2++kr1)kr){n-(k_{1}+k_{2}+\dots+k_{r-1})\choose k_{r}} opções para este passo.

Assim, pelo princípio fundamental da contagem, o número de partições de AA em rr subconjuntos {A1,A2,,Ar}\{A_{1},A_{2},\dots,A_{r}\} de modo que |A1|=k1,,|Ar|=kr|A_{1}|=k_{1},\dots,|A_{r}|=k_{r} com k1+k2++kr=nk_{1}+k_{2}+\dots+k_{r}=n é

(nk1)(nk1k2)(n(k1++kr1)kr)\displaystyle{n\choose k_{1}}{n-k_{1}\choose k_{2}}\dots n-(k_{1}+\dots+k_{r-1% })\choose k_{r} (2.27)
=n!k1!(nk1)!(nk1)!k2!(nk1k2)!(n(k1++kr1))!kr!(n(k1++kr))!\displaystyle\hskip 73.97733pt=\frac{n!}{k_{1}!(n-k_{1})!}\frac{(n-k_{1})!}{k_% {2}!(n-k_{1}-k_{2})!}\dots\frac{(n-(k_{1}+\dots+k_{r-1}))!}{k_{r}!(n-(k_{1}+% \dots+k_{r}))!} (2.28)
=n!k1!k2!kr!,\displaystyle\hskip 73.97733pt=\frac{n!}{k_{1}!k_{2}!\dots k_{r}!}\,, (2.29)

onde a última igualdade ocorre pela simplificação das frações e observando que (n(k1++kr))!=(nn)!=0!=1.(n-(k_{1}+\dots+k_{r}))!=(n-n)!=0!=1.

2.2 Amostragem

Selecionar um subconjunto de um conjunto maior também é chamado de amostragem. A amostragem nos permite usar informações sobre um pequeno grupo para fazer inferências sobre as propriedades ou preferências de um grupo maior. É uma ferramenta fundamental em estatísticas. Quando a população é "homogênea"(cada pessoa no grupo provavelmente tem as mesmas propriedades ou preferências), qualquer amostra escolhida aleatoriamente (com probabilidade uniforme) será representativa do grupo - ainda precisamos usar ferramentas matemáticas avançadas para quantificar a incerteza em nossas inferências sobre uma população, dada o tamanho da amostra, mas esse é o assunto de um módulo diferente. O que gostaríamos de entender agora é como a estrutura de probabilidade nas amostras varia quando a população é mista. Para entender a pergunta, considere o seguinte.

Exemplo 2.30.

O professor de ST120 quer saber até que ponto os alunos entenderam o conceito de espaço de probabilidade. Dado o tamanho da turma, não é possível perguntar a cada aluno individualmente. Em vez disso, eles desejam amostrar um pequeno grupo de alunos e perguntar a eles. Como eles devem escolher os alunos?

Uma solução prática é conversar com alguns dos alunos na sala de aula. No entanto, existe um viés - os alunos que frequentam as aulas têm mais probabilidade de entender os conceitos! Portanto, o professor decide escolher aleatoriamente um número de números de identificação de alunos e enviá-los por e-mail, e vamos supor que todos os alunos respondam. Este seria um grupo representativo, se a turma fosse homogênea. No entanto, sabemos que a turma é composta por dois grupos de n1n_{1} alunos de Matemática e n2n_{2} alunos de Ciência da Computação. Para entender o viés, o professor precisa calcular a probabilidade de o grupo acabar com k1k_{1} alunos de Matemática e k2k_{2} alunos de Ciência da Computação. Qual seria essa probabilidade?

Existem (n1k1)\binom{n_{1}}{k_{1}} maneiras de escolher k1k_{1} alunos de Matemática e (n2k2)\binom{n_{2}}{k_{2}} de escolher k2k_{2} alunos de Ciência da Computação. Portanto, a cardinalidade do conjunto de todos os grupos de k1k_{1} alunos de Matemática e k2k_{2} alunos de Ciência da Computação será

(n1k1)(n2k2)\binom{n_{1}}{k_{1}}\binom{n_{2}}{k_{2}}

A cardinalidade do conjunto de todos os grupos de k1+k2k_{1}+k_{2} alunos será (n1+n2k1+k2)\binom{n_{1}+n_{2}}{k_{1}+k_{2}}. Portanto, a probabilidade de escolher um grupo com k1k_{1} alunos de Matemática e k2k_{2} alunos de Ciência da Computação é

(n1k1)(n2k2)(n1+n2k1+k2).\frac{\binom{n_{1}}{k_{1}}\binom{n_{2}}{k_{2}}}{\binom{n_{1}+n_{2}}{k_{1}+k_{2% }}}. (2.31)

O próximo passo seria usar essa probabilidade para remover o viés, mas eles precisarão consultar os professores de módulos de estatísticas mais avançados sobre como fazer isso!

O exemplo acima é um caso de amostragem de uma população de tamanho nn\in\mathbb{N}, que tem n1n_{1}\in\mathbb{N} (n1nn_{1}\leqslant n) indivíduos do tipo 1 e n2=nn1n_{2}=n-n_{1} indivíduos do tipo 2. Retiramos uma amostra de tamanho k<Nk<N da população inteira ’aleatoriamente’ sem reposição (ou seja, um indivíduo não pode ser escolhido duas vezes). Então, a probabilidade de a amostra conter k1k_{1} indivíduos do tipo 1 e k2k_{2} indivíduos do tipo 2 é dada por

(n1k1)(n2k2)(nk).\frac{\binom{n_{1}}{k_{1}}\binom{n_{2}}{k_{2}}}{\binom{n}{k}}. (2.32)
Exercício 2.2.

Construa o espaço de probabilidade uniforme correspondente à amostragem sem reposição de uma população com dois tipos de indivíduos e prove (2.32). Em outras palavras, forneça o triplo (Ω,,)(\Omega,\mathcal{F},\mathbb{P}) de acordo com a proposição 1.6, de modo que, todas as realizações ωΩ\omega\in\Omega tenham a mesma probabilidade. O evento de interesse ω\omega é o conjunto de todas as combinações que contêm k1k_{1} números de 11 a n1n_{1} e k2=kk1k_{2}=k-k_{1} números de n1+1n_{1}+1 a nn.

Exemplo 2.33.

Agora considere o seguinte problema: um biólogo ambiental está estudando o peso de uma espécie específica de peixe. Para fazer isso, eles retiram uma amostra dessa população de peixes, pesam os peixes e depois os liberam de volta à natureza. Suponha que não há maneira de saber se um peixe já foi amostrado. Além disso, suponha que a população consiste apenas em dois tipos de peixes - machos e fêmeas - que têm pesos médios ligeiramente diferentes e isso precisa ser levado em consideração ao remover o viés.

Se a população inteira de peixes for nn, com n1n_{1} machos e n2=nn1n_{2}=n-n_{1} fêmeas e o tamanho da amostra for kk, qual é a probabilidade de ter k1k_{1} machos e k2k_{2} fêmeas na amostra?

A diferença entre este exemplo e o exemplo 2.30 é que agora os indivíduos podem ser escolhidos mais de uma vez. Como resultado, não é mais suficiente determinar apenas as posições dos indivíduos do tipo 1 na amostra, mas também precisamos especificar os indivíduos para que possamos acompanhar os escolhidos repetidamente. Portanto, passamos pelo seguinte processo:

  • Escolha a posição dos machos (as posições restantes serão ocupadas pelas fêmeas) - há (kk1)\binom{k}{k_{1}} escolhas.

  • Escolha os machos que são escolhidos - há n1k1n_{1}^{k_{1}} escolhas.

  • Escolha as fêmeas que são escolhidas - há n2k2n_{2}^{k_{2}} escolhas.

Portanto, o número de amostras diferentes com k1k_{1} machos e k2k_{2} fêmeas será

(kk1)n1k1n2k2.\binom{k}{k_{1}}n_{1}^{k_{1}}n_{2}^{k_{2}}.

Dado que o número total de amostras possíveis é nkn^{k}, a probabilidade de escolher k1k_{1} machos e k2k_{2} fêmeas será dada por

(kk1)n1k1n2k2nk=(kk1)(n1n)k1(1n1n)kk1.\frac{\binom{k}{k_{1}}n_{1}^{k_{1}}n_{2}^{k_{2}}}{n^{k}}=\binom{k}{k_{1}}\,% \left(\frac{n_{1}}{n}\right)^{k_{1}}\left(1-\frac{n_{1}}{n}\right)^{k-k_{1}}. (2.34)

O acima é um exemplo de amostragem de uma população de tamanho nn\in\mathbb{N}, que possui n1n_{1}\in\mathbb{N} (n1nn_{1}\leqslant n) indivíduos do tipo 1 e n2=nn1n_{2}=n-n_{1} indivíduos do tipo 2. Nós tiramos uma amostra de tamanho k<Nk<N da população inteira ’aleatoriamente’ com reposição (ou seja, um indivíduo pode ser escolhido duas vezes). Então, a probabilidade de a amostra conter k1k_{1} indivíduos do tipo 1 e k2=kk1k_{2}=k-k_{1} indivíduos do tipo 2 é dada por (2.34).

Exercício 2.3.

Construa o espaço de probabilidade uniforme correspondente à amostragem com reposição de uma população com dois tipos de indivíduos e prove (2.34). Agora, o evento de interesse ω\omega é o conjunto de todas as sequências que contêm k1k_{1} números de 11 a n1n_{1} e k2=kk1k_{2}=k-k_{1} números de n1+1n_{1}+1 a nn.

Exercício 2.4.

As probabilidades de amostragem não devem ser sensíveis a qual tipo foi considerado ’1’ e qual tipo foi considerado ’2’. De fato,

(kk1)(n1n)k1(1n1n)kk1=(kk2)(n2n)k2(1n2n)kk2.\binom{k}{k_{1}}\Big{(}\frac{n_{1}}{n}\Big{)}^{k_{1}}\Big{(}1-\frac{n_{1}}{n}% \Big{)}^{k-k_{1}}=\binom{k}{k_{2}}\Big{(}\frac{n_{2}}{n}\Big{)}^{k_{2}}\Big{(}% 1-\frac{n_{2}}{n}\Big{)}^{k-k_{2}}.

Supondo que k1+k2=kk_{1}+k_{2}=k e n1+n2=nn_{1}+n_{2}=n, verifique a identidade acima.

Revisão de Combinatória

Conjunto finito AA, n=|A|n=|A|.

Sequências de comprimento kk de elementos de AA:

|Sn,k(A)|=nk,|S_{n,k}(A)|=n^{k},

pois para especificar um elemento de Sn,k(A)S_{n,k}(A), precisamos fazer kk escolhas, e em cada escolha temos nn opções.

Permutações (ou reorganizações) de elementos de AA:

n!,n!,

pois precisamos fazer nn escolhas, e a cada escolha o número de opções diminui. (leia-se "fatorial de nn")

Ordenação de comprimento kk de elementos de AA:

|On,k(A)|=n!(nm)!,|O_{n,k}(A)|=\frac{n!}{(n-m)!},

porque podemos obter qualquer elemento de On,k(A)O_{n,k}(A) permutando os elementos de AA, mantendo os primeiros mm elementos e esquecendo a ordem dos nmn-m restantes.

Subconjuntos de AA com cardinalidade kk:

|Cn,k(A)|=(nk)=n!k!(nk)!,|C_{n,k}(A)|=\binom{n}{k}=\frac{n!}{k!(n-k)!},

pois podemos obter qualquer elemento de Cn,k(A)C_{n,k}(A) tomando os primeiros mm elementos em uma permutação de AA, mantendo os primeiros mm elementos e depois esquecendo a ordem desses mm elementos, assim como os nmn-m restantes. (leia-se "combinação de nn escolha kk")

Decomposição de AA em conjuntos rotulados A1,,ArA_{1},\dots,A_{r} de modo que |Aj|=kj|A_{j}|=k_{j} para j=1,,rj=1,\dots,r, onde k1++kr=nk_{1}+\dots+k_{r}=n.

n!k1!k2!kr!,\frac{n!}{k_{1}!k_{2}!\cdots k_{r}!},

pois podemos obter a partição primeiro permutando todos os elementos de AA, tomando A1A_{1} como os primeiros k1k_{1} elementos dessa permutação, A2A_{2} como os próximos k2k_{2} elementos e assim por diante, e depois esquecendo a ordem de cada bloco. Este é o número de maneiras pelas quais nn bolas rotuladas podem ser distribuídas em rr baldes rotulados sob a restrição de que, para cada j=1,,rj=1,\dots,r, o balde número jj recebe kjk_{j} bolas. As combinações Cn,k(A)C_{n,k}(A) são apenas um caso particular de dois baldes rotulados como "dentro"e "fora".

Para fornecer uma justificação mais rigorosa para os termos no denominador (que chamamos de "esquecer a ordenação"), podemos obter o número raciocinando de trás para frente, como segue. Vamos produzir uma permutação de A={1,,n}A=\{1,\dots,n\} de duas maneiras. A primeira maneira tem três etapas:

  1. (a)

    Escolher kk elementos de AA para irem primeiro, e deixar os nkn-k restantes irem depois. Existem xx possibilidades.

  2. (b)

    Permutar os primeiros kk elementos. Existem k!k! possibilidades.

  3. (c)

    Permutar os elementos restantes nkn-k. Existem (nk)!(n-k)! possibilidades.

No total, existem xk!(nk)!x\cdot k!\cdot(n-k)! possibilidades. A segunda maneira é direta: apenas permutar os nn elementos já existentes, existem n!n! possibilidades. Portanto, n!=xk!(nk)!n!=x\cdot k!\cdot(n-k)!, então acabamos de descobrir o que é xx! Portanto, |Cn,k(A)|=n!k!(nk)!|C_{n,k}(A)|=\frac{n!}{k!(n-k)!}.

Revisão de Amostragem

População com n=n1+n2n=n_{1}+n_{2} indivíduos, onde n1n_{1} são indivíduos do Tipo 1 e n2n_{2} são indivíduos do Tipo 2.

Se tirarmos uma amostra de kk indivíduos, sem reposição, então a chance de escolher k1k_{1} elementos do Tipo 1 (e, portanto, k2=kk1k_{2}=k-k_{1} indivíduos do Tipo 2) é

(n1k1)(n2k2)(nk).\frac{\binom{n_{1}}{k_{1}}\cdot\binom{n_{2}}{k_{2}}}{\binom{n}{k}}.

Isso pode ser obtido assumindo que os indivíduos foram amostrados simultaneamente (então |Ω|=(nk)|\Omega|=\binom{n}{k}) ou um após o outro (então |Ω|=n!(nk)!|\Omega|=\frac{n!}{(n-k)!}), e ambas as abordagens fornecem a mesma probabilidade (como esperado!). De fato, a segunda abordagem fornece

(kk1)n1!(n1k1)!n2!(n2k2)!n!(nk)!\frac{\binom{k}{k_{1}}\frac{n_{1}!}{(n_{1}-k_{1})!}\frac{n_{2}!}{(n_{2}-k_{2})% !}}{\frac{n!}{(n-k)!}}

que se simplifica para a primeira fórmula se expandirmos o primeiro termo.

Se tirarmos uma amostra de kk indivíduos, com reposição, então a chance de escolher k1k_{1} elementos do Tipo 1 (e, portanto, k2=kk1k_{2}=k-k_{1} indivíduos do Tipo 2) é

(kk1)(n1n)k1(1n1n)k2.\binom{k}{k_{1}}\Big{(}\frac{n_{1}}{n}\Big{)}^{k_{1}}\Big{(}1-\frac{n_{1}}{n}% \Big{)}^{k_{2}}.

Isso só pode ser alcançado assumindo que os indivíduos foram amostrados um após o outro, para que possamos devolvê-los à população (então |Ω|=nk|\Omega|=n^{k}). A fórmula acima é obtida após reescrever

(kk1)n1k1n2k2nk\frac{\binom{k}{k_{1}}n_{1}^{k_{1}}n_{2}^{k_{2}}}{n^{k}}

de uma forma mais conveniente (ou significativa).

Observe que, se XX denota o número de indivíduos do Tipo 1 na amostra com reposição, então

XBinom(k,n1n),X\sim\mathrm{Binom}(k,\tfrac{n_{1}}{n}),

o que pode ser verificado combinando a fórmula acima com a função de massa de probabilidade de uma variável aleatória binomial.