11 Identificabilidade na Descoberta Causal

Para contextualizar o problema da identificabilidade na Descoberta Causal, podemos começar com um exemplo simplista. Considere que observamos as variáveis: 𝒱={X,Y}{\mathcal{V}}=\{X,Y\}. Neste caso, há pelo menos duas dificuldades.

Primeiramente, considere que ff é tal que XfYX\perp\!\!\!\!\perp^{f}Y. Neste caso, apesar de intuitivamente considerarmos o grafo causal, XYX\hskip 8.53581ptY, a densidade ff também é compatível com XYX\rightarrow Y. De fato, XYX\rightarrow Y determina que f(x,y)=f(x)f(y|x)f(x,y)=f(x)f(y|x), o que é verdadeiro mesmo quando XX e YY são independentes.

Contudo, ainda que ambos os grafos sejam compatíveis com ff, o grafo XYX\hskip 8.53581ptY é mais informativo. Somente com base neste grafo podemos deduzir que XX é independente de YY. Essa constatação elucida que não buscamos apenas um grafo causal, 𝒢{\mathcal{G}}, compatível com a distribuição geradora dos dados, ff. Desejamos que 𝒢{\mathcal{G}} permita deduzir o maior número possível de relações de independência condicional presentes em ff. Uma maneira de lidar com este problema é trocar o objetivo de encontrar 𝒢{\mathcal{G}} compatível com ff por encontrar 𝒢{\mathcal{G}} fiel a ff:

Definição 5.1.

Dizemos que ff é fiel a 𝒢{\mathcal{G}} ou, equivalentemente, que 𝒢{\mathcal{G}} é fiel a ff, se para quaisquer 𝐗,𝐘,𝐙𝒱{\mathbf{X}},{\mathbf{Y}},{\mathbf{Z}}\subseteq{\mathcal{V}}, 𝐗f𝐘|𝐙{\mathbf{X}}\perp\!\!\!\!\perp^{f}{\mathbf{Y}}|{\mathbf{Z}} se e somente se 𝐗𝒢𝐘|𝐙{\mathbf{X}}\perp^{\mathcal{G}}{\mathbf{Y}}|{\mathbf{Z}}.

Podemos interpretar a Definição 5.1 à luz do Teorema 2.49. Se 𝒢{\mathcal{G}} é compatível com ff e 𝐗𝒢𝐘|𝐙{\mathbf{X}}\perp^{\mathcal{G}}{\mathbf{Y}}|{\mathbf{Z}}, então o Teorema 2.49 indica que 𝐗f𝐘|𝐙{\mathbf{X}}\perp\!\!\!\!\perp^{f}{\mathbf{Y}}|{\mathbf{Z}}. Contudo, em geral não é possível inferir uma d-separação em um grafo compatível a partir de uma relação de independência condicional. Quando 𝒢{\mathcal{G}} é fiel a ff, toda relação de independência condicional implica uma d-separação em 𝒢{\mathcal{G}}. Isto é, 𝒢{\mathcal{G}} traz a maior informação possível sobre as relações de independência condicional em ff.

O segundo problema de identificabilidade é que pode haver mais de um grafo causal fiel à distribuição geradora dos dados. Como ilustração, considere novamente que 𝒱={X,Y}{\mathcal{V}}=\{X,Y\} e que ff é tal que XX e YY não são independentes. Neste caso, tanto XYX\rightarrow Y quanto XYX\leftarrow Y são fiéis a ff. Em outras palavras, se não fizermos mais suposições, ambos os grafos explicam igualmente bem ff.

Com base nesta observação, podemos definir um tipo de não-identificabilidade em descoberta causal. Se dois grafos causais são fiéis às mesmas distribuições, então não importa qual seja a densidade geradora dos dados, não é possível diferenciá-los por meio dos dados. Neste caso, dizemos que os grafos são fielmente indistinguíveis:

Definição 5.2.

Dois grafos, 𝒢{\mathcal{G}} e 𝒢{\mathcal{G}}^{*}, são fielmente indistinguíveis (𝒢𝒢{\mathcal{G}}\sim{\mathcal{G}}^{*}) se, para todo ff,

f é fiel a 𝒢 se e somente se f é fiel a 𝒢.\displaystyle\text{$f$ é fiel a ${\mathcal{G}}$ se e somente se $f$ é fiel a ${\mathcal{G}}^{*}$}.

A seguir, a Definição 5.4 e o Teorema 5.5 mostram uma operacionalização da relação de indistinguibilidade fiel.

Definição 5.3.

Dizemos que (V1,V2,V3)(V_{1},V_{2},V_{3}) formam um colisor desprotegido em 𝒢{\mathcal{G}} se V1𝒢V2𝒢V3V_{1}\stackrel{{\scriptstyle{\mathcal{G}}}}{{\rightarrow}}V_{2}\stackrel{{% \scriptstyle{\mathcal{G}}}}{{\leftarrow}}V_{3} e V1V_{1} e V3V_{3} não são adjacentes em 𝒢{\mathcal{G}}.

Definição 5.4.

Os DAGs 𝒢{\mathcal{G}} e 𝒢{\mathcal{G}}^{*} tem o mesmo padrão se:

  1. 1.

    Para quaisquer vértices V1V_{1} e V2V_{2}, V1V_{1} e V2V_{2} são adjacentes em 𝒢{\mathcal{G}} se e somente se V1V_{1} e V2V_{2} são adjacentes em 𝒢{\mathcal{G}}^{*}.

  2. 2.

    (V1,V2,V3)(V_{1},V_{2},V_{3}) é um colisor desprotegido em 𝒢{\mathcal{G}} se e somente se é um colisor desprotegido em 𝒢{\mathcal{G}}^{*}.

Teorema 5.5 (Verma2022).

𝒢𝒢{\mathcal{G}}\sim{\mathcal{G}}^{*} se e somente se 𝒢{\mathcal{G}} e 𝒢{\mathcal{G}}^{*} tem o mesmo padrão.

De forma geral, o Teorema 5.5 mostra que, sem maiores suposições, só é possível aprender o padrão de um grafo a partir dos dados. Isto é, é possível determinar todas as relações de adjacência e, também, os colisores desprotegidos existentes no grafo. A seguir, estudaremos algoritmos que se propõem a descobrir esse padrão.