11 Identificabilidade na Descoberta Causal
Para contextualizar o problema da identificabilidade na Descoberta Causal, podemos começar com um exemplo simplista. Considere que observamos as variáveis: . Neste caso, há pelo menos duas dificuldades.
Primeiramente, considere que é tal que . Neste caso, apesar de intuitivamente considerarmos o grafo causal, , a densidade também é compatível com . De fato, determina que , o que é verdadeiro mesmo quando e são independentes.
Contudo, ainda que ambos os grafos sejam compatíveis com , o grafo é mais informativo. Somente com base neste grafo podemos deduzir que é independente de . Essa constatação elucida que não buscamos apenas um grafo causal, , compatível com a distribuição geradora dos dados, . Desejamos que permita deduzir o maior número possível de relações de independência condicional presentes em . Uma maneira de lidar com este problema é trocar o objetivo de encontrar compatível com por encontrar fiel a :
Definição 5.1.
Dizemos que é fiel a ou, equivalentemente, que é fiel a , se para quaisquer , se e somente se .
Podemos interpretar a Definição 5.1 à luz do Teorema 2.49. Se é compatível com e , então o Teorema 2.49 indica que . Contudo, em geral não é possível inferir uma d-separação em um grafo compatível a partir de uma relação de independência condicional. Quando é fiel a , toda relação de independência condicional implica uma d-separação em . Isto é, traz a maior informação possível sobre as relações de independência condicional em .
O segundo problema de identificabilidade é que pode haver mais de um grafo causal fiel à distribuição geradora dos dados. Como ilustração, considere novamente que e que é tal que e não são independentes. Neste caso, tanto quanto são fiéis a . Em outras palavras, se não fizermos mais suposições, ambos os grafos explicam igualmente bem .
Com base nesta observação, podemos definir um tipo de não-identificabilidade em descoberta causal. Se dois grafos causais são fiéis às mesmas distribuições, então não importa qual seja a densidade geradora dos dados, não é possível diferenciá-los por meio dos dados. Neste caso, dizemos que os grafos são fielmente indistinguíveis:
Definição 5.2.
Dois grafos, e , são fielmente indistinguíveis () se, para todo ,
A seguir, a Definição 5.4 e o Teorema 5.5 mostram uma operacionalização da relação de indistinguibilidade fiel.
Definição 5.3.
Dizemos que formam um colisor desprotegido em se e e não são adjacentes em .
Definição 5.4.
Os DAGs e tem o mesmo padrão se:
-
1.
Para quaisquer vértices e , e são adjacentes em se e somente se e são adjacentes em .
-
2.
é um colisor desprotegido em se e somente se é um colisor desprotegido em .
Teorema 5.5 (Verma2022).
se e somente se e tem o mesmo padrão.
De forma geral, o Teorema 5.5 mostra que, sem maiores suposições, só é possível aprender o padrão de um grafo a partir dos dados. Isto é, é possível determinar todas as relações de adjacência e, também, os colisores desprotegidos existentes no grafo. A seguir, estudaremos algoritmos que se propõem a descobrir esse padrão.