8 Levando a intuição do SCM ao POM

Ainda que seja uma formalização conveniente, o POM é consideravelmente mais complexo que o SCM original. Para ganhar intuição sobre o POM, alguns lemas de tradução são fundamentais.

Lema 4.9.

Se 𝕍,𝐙𝒱{\mathbb{V}},{\mathbf{Z}}\subseteq{\mathcal{V}} e 𝕍𝐙=∅︀{\mathbb{V}}\cap{\mathbf{Z}}=\emptyset, então (𝒱𝕍=𝐯=𝒱𝐙=𝐳,𝕍=𝐯|𝐙𝕍=𝐯=𝐳)=1{\mathbb{P}}({\mathcal{V}}_{{\mathbb{V}}={\mathbf{v}}}={\mathcal{V}}_{{\mathbf% {Z}}={\mathbf{z}},{\mathbb{V}}={\mathbf{v}}}|{\mathbf{Z}}_{{\mathbb{V}}={% \mathbf{v}}}={\mathbf{z}})=1. Em particular,

(𝒱=𝒱𝐙=𝐳|𝐙=𝐳)\displaystyle{\mathbb{P}}({\mathcal{V}}={\mathcal{V}}_{{\mathbf{Z}}={\mathbf{z% }}}|{\mathbf{Z}}={\mathbf{z}}) =1.\displaystyle=1.

O Lema 4.9 conecta o dado observacional em 𝒱{\mathcal{V}} ao resultado potencial 𝒱𝐙=𝐳{\mathcal{V}}_{{\mathbf{Z}}={\mathbf{z}}}. Mais especificamente, quando observamos que 𝐙=𝐳{\mathbf{Z}}={\mathbf{z}}, então os resultados potenciais dada a intervenção 𝐙=𝐳{\mathbf{Z}}={\mathbf{z}} são idênticos aos resultados observados. Em outras palavras, ao observamos que 𝐙=𝐳{\mathbf{Z}}={\mathbf{z}}, aprendemos que estamos justamente na hipótese de resultados potenciais em que 𝐙=𝐳{\mathbf{Z}}={\mathbf{z}}.

Lema 4.10.

Se 𝕍,𝐙𝒱{\mathbb{V}},{\mathbf{Z}}\subseteq{\mathcal{V}} e 𝕍𝐙=∅︀{\mathbb{V}}\cap{\mathbf{Z}}=\emptyset, então para todo W𝒱W\in{\mathcal{V}},

W𝕍=𝐯𝕀(𝐙𝕍=𝐯=𝐳)\displaystyle W_{{\mathbb{V}}={\mathbf{v}}}{\mathbb{I}}({\mathbf{Z}}_{{\mathbb% {V}}={\mathbf{v}}}={\mathbf{z}}) W𝐙=𝐳,𝕍=𝐯𝕀(𝐙𝕍=𝐯=𝐳)\displaystyle\equiv W_{{\mathbf{Z}}={\mathbf{z}},{\mathbb{V}}={\mathbf{v}}}{% \mathbb{I}}({\mathbf{Z}}_{{\mathbb{V}}={\mathbf{v}}}={\mathbf{z}})

O Lema 4.10 é extremamente útil, ainda que de natureza mais técnica. Ele permite que relacionemos resultados potenciais em que diferentes tipos de intervenção são adotados.

Um outro resultado essencial é o de que 𝒱𝕍=𝐯{\mathcal{V}}_{{\mathbb{V}}={\mathbf{v}}} tem a distribuição de quando realizamos a intervenção do(𝕍=𝐯)do({\mathbb{V}}={\mathbf{v}}). Esta resultado é estabelecido no Lema 4.11.

Lema 4.11.

No modelo de resultados potenciais (Definição 4.7):

f(𝒱𝕍=𝐯)\displaystyle f^{*}({\mathcal{V}}_{{\mathbb{V}}={\mathbf{v}}}) f(𝒱|do(𝕍=𝐯)).\displaystyle\equiv f({\mathcal{V}}|do({\mathbb{V}}={\mathbf{v}})).

O Lema 4.11 fornece uma outra forma de pensar sobre o efeito causal. Decorre do Lema 4.11 que 𝔼[YX=x]=𝔼[Y|do(X=x)]{\mathbb{E}}[Y_{X=x}]={\mathbb{E}}[Y|do(X=x)]. Assim, se por exemplo XX é binário, ACE=𝔼[Y1]𝔼[Y0]{ACE}={\mathbb{E}}[Y_{1}]-{\mathbb{E}}[Y_{0}]. Em outras palavras, como o Definição 4.7 cria variáveis aleatórias que tem a distribuição intervencional, ele permite que imaginemos o efeito causal em termos destas variáveis. Como na capítulo 3 não havia acesso aos resultados potenciais, era necessário imaginar o efeito causal somente em termos da distribuição intervencional. Assim, a Definição 4.7 oferece mais formas de pensar sobre o efeito causal.55 5 Esta outra forma de pensar sobre o efeito causal é tão relevante que outras construções de Inferência Causal, como o Rubin Causal Model (Holland1986) partem diretamente dela.

Uma forma alternativa de pensar sobre identificação causal está na definição de ignorabilidade. Dizemos que XX é ignorável para medir o efeito causal em YY se ele é independente dos resultados potenciais YxY_{x}. Em outras palavras, saber o valor de XX não traz informação sobre o resultado de YY em uma outra realidade em que realizamos uma intervenção sobre XX.

Definição 4.12 (Ignorabilidade).

Dizemos que XX é ignorável para medir o efeito causal em YY se YxdXY_{x}\perp^{d}X.

O critério da ignorabilidade é equivalente a afirmar que XX e YY não tem um ancestral comum. Em outras palavras, XX é ignorável se e somente se ∅︀\emptyset satisfaz o critério backdoor para medir o efeito causal de XX em YY.

Lema 4.13.

As seguintes afirmações são equivalentes:

  1. 1.

    ∅︀\emptyset satisfaz o critério backdoor para medir o efeito causal de XX em YY,

  2. 2.

    Anc(X)Anc(Y)=∅︀Anc(X)\cap Anc(Y)=\emptyset, isto é, XX e YY não tem um ancestral em comum, e

  3. 3.

    XX é ignorável para medir o efeito causal em YY.

Assim, decorre do fato de que XX é ignorável para o efeito causal em YY que a distribuição intervencional de YY dado XX é equivalente à sua distribuição observacional. Em outras palavras, dizer que XX é ignorável tem consequências similares a dizer que XX é atribuído por aleatorização.

Corolário 4.14.

Se XX é ignorável para medir o efeito causal em YY, então

f(y|do(x))\displaystyle f(y|do(x)) =f(y|x).\displaystyle=f(y|x).

A ignorabilidade condicional oferece uma generalização da Definição 4.12. Dizemos que, dado 𝐙{\mathbf{Z}}, XX é ignorável para medir o efeito causal em YY se XX é independente de todo YxY_{x} dado 𝐙{\mathbf{Z}}.

Definição 4.15 (Ignorabilidade condicional).

Dizemos que XX é condicionalmente ignorável para medir o efeito causal em YY dado 𝐙{\mathbf{Z}} se YxdX|𝐙Y_{x}\perp^{d}X|{\mathbf{Z}}.

Se 𝐙{\mathbf{Z}} não tem descendentes de XX, a ignorabilidade condicional é uma restrição mais forte que o critério backdoor, conforme formalizado no Lema 4.16.

Lema 4.16.

Suponha que XAnc(𝐙)X\notin Anc({\mathbf{Z}}). Se XX é condicionalmente ignorável para medir o efeito causal em YY dado 𝐙{\mathbf{Z}}, então 𝐙{\mathbf{Z}} satisfaz o critério backdoor para medir o efeito causal de XX em YY.

Apesar do critério backdoor e das ignorabilidade condicional não serem equivalentes, eles induzem o mesmo tipo de identificação causal.

Lema 4.17.

Se XX é condicionalmente ignorável para medir o efeito causal em YY dado 𝐙{\mathbf{Z}}, então 𝐙{\mathbf{Z}} controla confundidores para medir o efeito causal de XX em YY (Definição 3.18).

Decorre do Lema 4.17 que todas as estratégia de estimação do efeito causal estudadas na Seção 5 também podem ser usadas sob a suposição de ignorabilidade condicional. Em outras palavras, ignorabilidade condicional fornece um critério alternativo para justificar o tipo de identificação causal obtida pelo critério backdoor.

8.1 Exercícios

Exercício 4.18.

Prove o Lema 4.1.

Exercício 4.19.

Mostre que no Exemplo 4.4 a distribuição de (X,Y)(X,Y) no SCM em equações estruturais é igual àquela no SCM original.

Exercício 4.20.

Exiba um exemplo em que XX é condicionalmente ignorável para YY dado 𝐙{\mathbf{Z}} mas 𝐙{\mathbf{Z}} não satisfaz o critério backdoor para medir o efeito causal de XX em YY.

Exercício 4.21.

Exiba um exemplo em que 𝐙{\mathbf{Z}} satisfaz o critério backdoor para medir o efeito causal de XX em YY mas XX não é condicionalmente ignorável para YY dado 𝐙{\mathbf{Z}}.