6 Controlando mediadores (critério frontdoor)

Refer to caption
Figura 14: .

Há casos em que não existem variáveis observadas que satisfazem o critério backdoor. Por exemplo, considere o grafo causal na figur 14 (Glymour2016). Neste grafo, estamos interessados em compreender o efeito causal do fumo (XX) sobre a incidência de câncer (YY). Além disso, fatores genéticos não observáveis (GG) são um potencial confundidor, uma vez que podem ter influência tanto sobre o fumo quanto sobre a incidência de câncer. Assim, como GG não é observado, não é possível implementar os métodos de estimação vistos na última seção. Apesar desta dificuldade, ainda é possível medir o efeito causal de XX em YY na figur 14.

Para tal, primeiramente observe que é possível estimar o efeito causal de XX em PP e de PP em YY. Para medir o efeito causal de XX em PP, note que ∅︀\emptyset satisfaz o critério backdoor. Isso ocorre pois YY é um colisor em XGYPX\leftarrow G\rightarrow Y\leftarrow P. Além disso, como X=Pa(P)X=Pa(P), decorre do Lema 3.17 que XX satisfaz o critério backdoor para medir o efeito causal de PP em YY. Das duas últimas conclusões decorre do Teorema 3.19 que f(P|do(X))=f(P|X)f(P|do(X))=f(P|X) e que f(Y|do(P))=f(Y|P,X)f(X)𝑑Xf(Y|do(P))=\int f(Y|P,X)f(X)dX.

A seguir, o critério frontdoor consiste em observar que PP está no único caminho direcionado de XX a YY, XPYX\rightarrow P\rightarrow Y. Assim, é possível provar a identificação causal

f(Y|do(X))\displaystyle f(Y|do(X)) =f(P|do(X))f(Y|do(P))𝑑P\displaystyle=\int f(P|do(X))f(Y|do(P))dP
=f(P|do(X))f(Y|P,X)f(X)𝑑X.\displaystyle=\int f(P|do(X))\int f(Y|P,X)f(X)dX.

O critério frontdoor é formalizado a seguir:

Definição 3.43.

𝐖{\mathbf{W}} satisfaz o critério frontdoor para medir o efeito causal de XX em YY se:

  1. 1.

    para todo caminho direcionado de XX em YY, CC, existe Ci𝐖C_{i}\in{\mathbf{W}} e, para todo W𝐖W\in{\mathbf{W}}, existe caminho direcionado de XX em YY, CC, e ii tal que Ci=WC_{i}=W.

  2. 2.

    ∅︀\emptyset satisfaz o item 2 do critério backdoor (Definição 3.11) para medir o efeito causal de XX em 𝐖{\mathbf{W}}.

  3. 3.

    XX satisfaz o item 2 do critério backdoor (Definição 3.11) para medir o efeito causal de 𝐖{\mathbf{W}} em YY.

A Definição 3.43 elenca todos os itens que utilizamos na análise da figur 14. O primeiro item do critério identifica que 𝐖{\mathbf{W}} deve interceptar todos os caminhos direcionados de XX a YY. Isto é, 𝐖{\mathbf{W}} capturar a informação de todos os mediadores de XX a YY. O segundo e terceiro itens estabelecem as condições para que seja possível aplicar o critério backdoor para identificar f(𝐖|do(X))f({\mathbf{W}}|do(X)) e f(Y|do(𝐖))f(Y|do({\mathbf{W}})).

6.0.1 Identificação causal

O critério frontdoor possibilita a identificação do efeito causal de XX em YY:

Teorema 3.44.

Se 𝐖{\mathbf{W}} satisfaz o critério frontdoor para medir o efeito causal de XX em YY, então

f(Y|do(X=x))\displaystyle f(Y|do(X=x)) =f(𝐖|x)f(Y|𝐖,X)f(X)𝑑X𝑑𝐖\displaystyle=\int f({\mathbf{W}}|x)\int f(Y|{\mathbf{W}},X)f(X)dXd{\mathbf{W}}
Teorema 3.45.

Se 𝐖{\mathbf{W}} satisfaz o critério frontdoor para estimar o efeito causal de XX em YY, então

𝔼[Y|do(X=x)]\displaystyle{\mathbb{E}}[Y|do(X=x)] =𝔼[Yf(W|x)f(W|X)]\displaystyle={\mathbb{E}}\left[\frac{Y\cdot f(W|x)}{f(W|X)}\right]

6.0.2 Estimação pelo critério frontdoor

A estimação é um tema menos desenvolvido ao aplicar o critério frontdoor. Alguns estimadores não-paramétricos são apresentados em Tchetgen2012. A seguir, desenvolvemos um estimador não-paramétrico mais simples inspirado na estratégia de IPW.

Definição 3.46.

Considere que 𝐖{\mathbf{W}} satisfaz o critério frontdoor para medir o efeito causal de XX em YY e que f^(𝐖|X)\widehat{f}({\mathbf{W}}|X) é um estimador de f(𝐖|X)f({\mathbf{W}}|X). Um estimador do tipo IPW para 𝔼[Y|do(X=x)]{\mathbb{E}}[Y|do(X=x)] é dado por

𝔼^f[Y|do(X=x)]\displaystyle\widehat{{\mathbb{E}}}_{f}[Y|do(X=x)] :=n1i=1nYif^(𝐖i|x)f^(𝐖i|Xi).\displaystyle:=n^{-1}\sum_{i=1}^{n}\frac{Y_{i}\widehat{f}({\mathbf{W}}_{i}|x)}% {\widehat{f}({\mathbf{W}}_{i}|X_{i})}.

Para provar o Teorema 3.44 utilizamos o do calculus, que é discutido na Seção 7.