7 Do-calculus

O do calculus consiste em um conjunto de regras para alterar densidade envolvend o operador “do”. Por exemplo, o do calculus explica como remover o operador do, trocá-lo pelo condicionamento simples, ou remover algum condicionamento simples. Para apresentar o do calculus, é necessário primeiramente definir algumas modificações sobre o grafo causal.

Definição 3.47.

Seja (𝒢,f)({\mathcal{G}},f) um CM tal que 𝒢=(𝒱,){\mathcal{G}}=({\mathcal{V}},{\mathcal{E}}):

𝒢(𝕍¯)\displaystyle{\mathcal{G}}(\bar{{\mathbb{V}}}) :=(𝒱,{E:E2𝕍})\displaystyle:=({\mathcal{V}},\{E\in{\mathcal{E}}:E_{2}\notin{\mathbb{V}}\})
𝒢(𝕍¯1,𝕍¯2)\displaystyle{\mathcal{G}}(\bar{{\mathbb{V}}}_{1},\underline{{\mathbb{V}}}_{2}) :=(𝒱,{E:E2𝕍1 e E1𝕍2})\displaystyle:=({\mathcal{V}},\{E\in{\mathcal{E}}:E_{2}\notin{\mathbb{V}}_{1}% \text{ e }E_{1}\notin{\mathbb{V}}_{2}\})
𝒢(𝕍¯1,𝕍2+)\displaystyle{\mathcal{G}}(\bar{{\mathbb{V}}}_{1},{\mathbb{V}}_{2}^{+}) =(𝒱{IV:V𝕍2},{E:E2𝕍1}{(IV,V):V𝕍2})\displaystyle=({\mathcal{V}}\cup\{I_{V}:V\in{\mathbb{V}}_{2}\},\{E\in{\mathcal% {E}}:E_{2}\notin{\mathbb{V}}_{1}\}\cup\{(I_{V},V):V\in{\mathbb{V}}_{2}\})

Isto é, 𝒢(𝕍¯){\mathcal{G}}(\bar{{\mathbb{V}}}) é o grafo obtido retirando de 𝒢{\mathcal{G}} as arestas que apontam para 𝕍{\mathbb{V}}, 𝒢(𝕍¯1,𝕍¯2){\mathcal{G}}(\bar{{\mathbb{V}}}_{1},\underline{{\mathbb{V}}}_{2}) é o grafo obtido retirando de 𝒢{\mathcal{G}} todas as arestas que apontam para 𝕍1{\mathbb{V}}_{1} ou que saem de 𝕍2{\mathbb{V}}_{2}, e 𝒢(𝕍¯1,𝕍2+){\mathcal{G}}(\bar{{\mathbb{V}}}_{1},{\mathbb{V}}_{2}^{+}) é o grafo obtido adicionando a 𝒢{\mathcal{G}} um novo vértice IVI_{V} e uma aresta IVVI_{V}\rightarrow V, para todo V𝕍2V\in{\mathbb{V}}_{2}, e retirando todas as arestas que apontam para 𝕍1{\mathbb{V}}_{1}.

Com base na Definição 3.47, é possível apresentar o do calculus:

Teorema 3.48.

Seja (𝒢,f)({\mathcal{G}},f) um CM e 𝐗{\mathbf{X}}, 𝐘{\mathbf{Y}}, 𝐖{\mathbf{W}} e 𝐙{\mathbf{Z}} conjuntos de vértices disjuntos:

  1. 1.

    Se 𝐘d𝐙|𝐗𝐖{\mathbf{Y}}\perp^{d}{\mathbf{Z}}|{\mathbf{X}}\cup{\mathbf{W}} em 𝒢(𝐗¯){\mathcal{G}}(\bar{{\mathbf{X}}}), então f(𝐘|do(𝐗),𝐙,𝐖)=f(𝐘|do(𝐗),𝐖)f({\mathbf{Y}}|do({\mathbf{X}}),{\mathbf{Z}},{\mathbf{W}})=f({\mathbf{Y}}|do({% \mathbf{X}}),{\mathbf{W}}).

  2. 2.

    Se 𝐘d𝐖|𝐙𝐗{\mathbf{Y}}\perp^{d}{\mathbf{W}}|{\mathbf{Z}}\cup{\mathbf{X}} em 𝒢(𝐗¯,𝐖¯){\mathcal{G}}(\bar{{\mathbf{X}}},\underline{{\mathbf{W}}}), então f(𝐘|do(𝐗),do(𝐖),𝐙)=f(𝐘|do(𝐗),𝐖,𝐙)f({\mathbf{Y}}|do({\mathbf{X}}),do({\mathbf{W}}),{\mathbf{Z}})=f({\mathbf{Y}}|% do({\mathbf{X}}),{\mathbf{W}},{\mathbf{Z}}).

  3. 3.

    Se 𝐘dI𝐗|𝐙𝐖{\mathbf{Y}}\perp^{d}I_{{\mathbf{X}}}|{\mathbf{Z}}\cup{\mathbf{W}} em 𝒢(𝐖¯,𝐗+){\mathcal{G}}(\bar{{\mathbf{W}}},{\mathbf{X}}^{+}), então f(Y|do(𝐖),do(𝐗),𝐙)=f(Y|do(𝐖),𝐙)f(Y|do({\mathbf{W}}),do({\mathbf{X}}),{\mathbf{Z}})=f(Y|do({\mathbf{W}}),{% \mathbf{Z}}).

O seguinte lema mostra como o do calculus generaliza certos aspectos do critério backdoor:

Lema 3.49.

XX satisfaz o item 2 do critério backdoor para medir o efeito causal de 𝐖{\mathbf{W}} em YY se e somente se Yd𝐖|XY\perp^{d}{\mathbf{W}}|X em 𝒢(𝐖¯){\mathcal{G}}(\underline{{\mathbf{W}}}).

Utilizando o do calculus, é possível obter todas as relações de identificação que são válidas supondo apenas que ff é compatível com o grafo causal (Shpitser2006, Shpitser2008). Contudo, às vezes é razoável fazer mais suposições. Discutiremos este tipo de situação no próximo capítulo.

7.1 Exercícios

Exercício 3.50 (Glymour2016[p.48]).

Considere o modelo estrutural causal em figur 15.

  1. (a)

    Para cada um dos pares de variáveis a seguir, determine um conjunto de outras variáveis que as d-separa: (Z1,W)(Z_{1},W), (Z1,Z2)(Z_{1},Z_{2}), (Z1,Y)(Z_{1},Y), (Z3,W)(Z_{3},W), e (X,Y)(X,Y).

  2. (b)

    Para cada par de variáveis no item anterior, determine se elas são d-separadas dado todas as demais variáveis.

  3. (c)

    Determine conjuntos de variáveis que satisfazem, respectivamente, o critério backdoor e o critério frontdoor para estimar o efeito causal de XX em YY.

  4. (d)

    Considere que para cada variável, VV, temos que VβVPa(V)+ϵVV\equiv\beta_{V}\cdot Pa(V)+\epsilon_{V}, onde os ϵ\epsilon são i.i.d. e normais padrão e βV\beta_{V} são vetores conhecidos. Isto é, a distribuição de cada variável é determinada através de uma regressão linear simples em seus pais. Determine f(Y|do(X=x))f(Y|do(X=x)) utilizando a fórmula do ajuste nos 22 casos abordados no item anterior.

Z1Z_{1}Z3Z_{3}Z2Z_{2}XXW1W_{1}W2W_{2}YY
Figura 15: Modelo estrutural causal do Exercício 3.50
Exercício 3.51.

Considere que 𝒢=(𝒱,){\mathcal{G}}=({\mathcal{V}},{\mathcal{E}}) é um grafo causal e 𝐗,𝐖,𝐘𝒱{\mathbf{X}},{\mathbf{W}},{\mathbf{Y}}\subseteq{\mathcal{V}}. Além disso, para todo caminho, C=(C1,,Cn)C=(C_{1},\ldots,C_{n}), com C1=X𝐗C_{1}=X\in{\mathbf{X}}, Cn=Y𝐘C_{n}=Y\in{\mathbf{Y}}, e com XC2X\rightarrow C_{2}, CC está bloqueado dado 𝐖{\mathbf{W}}. Prove que f(𝐲|do(𝐗))=f(𝐲|𝐰)f(𝐰|do(𝐗))𝑑𝐰f({\mathbf{y}}|do({\mathbf{X}}))=\int f({\mathbf{y}}|{\mathbf{w}})f({\mathbf{w% }}|do({\mathbf{X}}))d{\mathbf{w}} e 𝔼[Y|do(𝐗)]=𝔼[𝔼[Y|𝐖]|do(𝐗)]{\mathbb{E}}[Y|do({\mathbf{X}})]={\mathbb{E}}[{\mathbb{E}}[Y|{\mathbf{W}}]|do(% {\mathbf{X}})].

Exercício 3.52.

Prove que se 𝐖{\mathbf{W}} satisfaz o critério frontdoor para medir o efeito causal de XX em YY, então f(𝐖|do(X))=f(𝐖|X)f({\mathbf{W}}|do(X))=f({\mathbf{W}}|X) e f(Y|do(𝐖))=f(Y|𝐖,X=x)f(X=x)𝑑xf(Y|do({\mathbf{W}}))=\int f(Y|{\mathbf{W}},X=x^{*})f(X=x^{*})dx^{*}.

Exercício 3.53.

Prove o Lema 3.49.