3 Independência Condicional e D-separação
Independência condicional é uma forma fundamental de indicar relações entre variáveis aleatórias. Se e são vetores de variáveis aleatórias, definimos que , isto é, são independentes dado , se conhecido o valor de , observar quaisquer valores de não traz informação sobre os demais valores. Nesta seção veremos que as relações de independência condicional em um CM estão diretamente ligadas ao seu grafo.
3.1 Independência Condicional
Definição 2.44.
Dizemos que são independentes dado se, para qualquer e ,
Em particular, são independentes se, para quaiquer ,
Verificar se a Definição 2.44 está satisfeita nem sempre é fácil. A princípio, ela exige obter tanto a distribuição condicional conjunta, , quanto cada uma das marginais, . O Lema 2.45 a seguir apresenta outras condições que são equivalentes a independência condicional:
Lema 2.45.
As seguintes afirmações são equivalentes:
-
1.
são independentes dado ,
-
2.
Existem funções, tais que .
-
3.
Para todo , .
-
4.
Para todo , .
As condições no Lema 2.45 são, em geral, mais fáceis de verificar do que a definição direta de independência condicional. A seguir veremos que, em um SMC, pode ser mais fácil ainda verificar muitas das relações de independência condicional.
3.2 D-separação
Em um CM , é possível indicar as relações de independência incondicional em por meio do grafo associado. Intuitivamente, haverá uma dependência entre e se for possível transmitir a informação de para por um caminho que ligue ambos os vértices. Para entender se a informação pode ser transmitida por um caminho, classificaremos a seguir os vértices que o constituem.
Definição 2.46.
Seja um caminho em um DAG, . Para cada :
-
•
é um colisor em se e , isto é, existem arestas apontando de e de para . Neste caso, desenhamos .
Note que a classificação na Definição 2.46 generaliza os exemplos de DAG’s com 3 vértices na Seção 2.4.
Essa classificação é ilustrada com o DAG na figur 5. Existem dois caminhos que vão de a : e . No primeiro caminho é um colisor, pois o caminho passa por duas arestas que apontam para . Já no segundo caminho é uma cadeia e é um colisor. Note que a classificação do vértice depende do caminho analisado. Enquanto que no primeiro caminho é um colisor, no segundo é uma cadeia

Com base nas conclusões da Seção 2.4, é possível compreender a racionalidade da Definição 2.46. Na Seção 2.4 vimos que, se não é um colisor entre e , então e são independentes dado . Por analogia, podemos intuir que um vértice que não é um colisor num caminho não permite a passagem de informação quando seu valor é conhecido. Similarmente, na Seção 2.4, se é um colisor entre e , então e são independentes. Assim, também podemos intuir que um vértice que é um colisor em um caminho não permite a passagem de informação quando seu valor e o de seus descendentes é desconhecido. Finalmente, a informação não passa pelo caminho quando ela não passa por pelo menos um de seus vértices. Neste caso, dizemos que o caminho está bloqueado:
Definição 2.47.
Seja um caminho em um DAG, . Dizemos que está bloqueado dado , se
-
1.
Existe algum tal que não é um colisor em e , ou
-
2.
Existe algum tal que é um colisor em e .
Finalmente, dizemos que está d-separado de dado se todos os caminhos de a estão bloqueados dado :
Definição 2.48.
Seja um DAG. Para , dizemos que está d-separado de dado se, para todo caminho tal que e , está bloqueado dado . Neste caso, escrevemos .
Intuitivamente, se , então não é possível passar informação de a quando é conhecido. Assim, temos razão para acreditar que é condicionalmente independente de dado , isto é . Esta conclusão é apresentada no Teorema 2.49 a seguir:
Teorema 2.49.
Seja um DAG e um conjunto de variáveis aleatórias. está d-separado de dado se e somente se, para todo compatível com , .
Exemplo 2.50.
Considere o DAG na figur 5. Para avaliar se e são d-separados, precisamos analisar todos os caminhos de um para o outro. Estes caminhos são: , e . No primeiro caminho não é um colisor e, assim, o caminho não está bloqueado marginalmente. Portanto, e não são d-separados marginalmente. Por outro lado, no segundo caminho é um colisor e não o é. Assim, condicionando em , este caminho não está bloqueado. Portanto, e não são d-separados dado . Finalmente, dado e , ambos os caminhos estão bloqueados, pois não é um colisor no primeiro e não é um colisor no segundo. Assim, e são d-separados dado . Para treinar este raciocínio, continue analisando a d-separação entre e .
O algoritmo para testar d-separação está
implementado em diversos pacotes.
Além disso, é possível utilizar o
Teorema 2.49 para enunciar
todas as relações de independência condicional que
são necessárias em um grafo.
Estas implementações estão ilustradas abaixo:
\MakeFramed
# Especificar o grafo
grafo <- "dag{
V1 -> V2 <- V4;
V2 -> V3 <- V4
}"
dseparated(grafo, "V1", "V3", c("V2"))
## [1] FALSE
dseparated(grafo, "V1", "V3", c("V4"))
## [1] FALSE
dseparated(grafo, "V1", "V3", c("V2", "V4"))
## [1] TRUE
impliedConditionalIndependencies(grafo)
## V1 _||_ V3 | V2, V4 ## V1 _||_ V4
Exemplo 2.51.
Considere que e não são d-separados dado . O Teorema 2.49 garante apenas que existe algum compatível com o DAG tal que e são condicionalmente dependentes dado segundo . É possível mostrar que o conjunto de ’s compatíveis com o grafo em que e são condicionalmente independentes dado é relativamente pequeno àquele em que e são condicionalmente dependentes. Estudaremos um caso em que é possível observar esta relação em mais detalhe.
Considere que , e são binárias e formam o grafo , isto é, é um confundidor. Além disso, , . Como é um confundidor, e não são d-separados marginalmente. Para quais valores de temos que e são marginalmente independentes? Para que e sejam independentes, é necessário que . Note que
Assim, para que , temos:
Em outras palavras, dentre todos no quadrado , somente os valores no segmento tem alguma chance de levarem à independência entre e . Se imaginarmos que são equidistribuídos em , então a probabilidade de sortearmos valores em que e são independentes é 0.
Em conclusão, como e não são d-separados, somente para um conjunto pequeno de possíveis ’s temos que e são independentes.
3.3 Exercícios
Exercício 2.52.
Considere que é uma densidade sobre que é compatível com o grafo em figur 6. Além disso, cada , , e , para todo .
-
(a)
e são d-separados dado ?
-
(b)
e são condicionalmente independentes dado ?
-
(c)
e são d-separados dado ?
-
(d)
e são condicionalmente independentes dado ?

Exercício 2.53.
Prove que se um caminho, , está bloqueado dado , então sempre que é um sub-caminho de , isto é, , temos que está bloqueado dado .
Exercício 2.54.
Prove que se e , então .
Exercício 2.55.
Prove que se , então para todo , ou .
Exercício 2.56.
Sejam e grafos tais que . Prove que se em , então em .