Apêndice 6.E Seção 5 (Controlando confundidores (critério backdoor))

6.E.1 Teorema 3.19

Para realizar a demonstração do Teorema 3.19, consideraremos um SCM aumentado, em que existe uma variável que representa a ocorrência de uma intervenção em X. Uma consequência interessante desta construção será a de que o modelo intervencional é equivalente ao condicionamento usual no SCM aumentado.

Definição 6.6.

Seja (𝒢,f)({\mathcal{G}}_{*},f_{*}) um SCM expandido tal que 𝒢=(𝒱{IX:X𝐗},){\mathcal{G}}_{*}=({\mathcal{V}}\cup\{I_{X}:X\in{\mathbf{X}}\},{\mathcal{E}}_{% *}), e ={(IXX:X𝐗)}{\mathcal{E}}_{*}={\mathcal{E}}\cup\{(I_{X}\rightarrow X:X\in{\mathbf{X}})\}. Isto é, 𝒢{\mathcal{G}}_{*} é uma cópia de 𝒢{\mathcal{G}} em que adicionamos para cada X𝐗X\in{\mathbf{X}} os vértice IX{0,1}I_{X}\in\{0,1\} e arestas de IXI_{X} para XX.

𝒢{\mathcal{G}}^{*} admite uma interpretação intuitiva. IXI_{X} é a indicadora de que fazemos uma intervenção em XX, fazendo que esta assuma o valor xx. Se IX=0I_{X}=0, não há uma intervenção e, assim, XX segue a sua distribuição observacional. Se IX=1I_{X}=1, XX assume o valor xx com probabilidade 11.

Finalmente, considerando Pa(X)Pa(X) como os pais de XX segundo 𝒢{\mathcal{G}}, definimos que:

f(X|Pa(X),IX)\displaystyle f_{*}(X|Pa(X),I_{X}) ={f(X|Pa(X)), se IX=0, e𝕀(X=x), caso contrário.\displaystyle=\begin{cases}f(X|Pa(X))&\text{, se $I_{X}=0$, e}\\ {\mathbb{I}}(X=x)&\text{, caso contrário.}\end{cases}
Lema 6.7.

Se (𝒢,f)({\mathcal{G}}_{*},f_{*}) é tal qual em Definição 6.6, então:

f(𝒱|do(X=x))\displaystyle f({\mathcal{V}}|do(X=x)) =f(𝒱|I𝐗=1)\displaystyle=f_{*}({\mathcal{V}}|I_{{\mathbf{X}}}=1)
Demonstração.
f(𝒱|I𝐗=1)\displaystyle f_{*}({\mathcal{V}}|I_{{\mathbf{X}}}=1) =f(𝒱,I𝐗=1)f(I𝐗=1)\displaystyle=\frac{f_{*}({\mathcal{V}},I_{{\mathbf{X}}}=1)}{f(I_{{\mathbf{X}}% }=1)}
=f(I𝐗=1)X𝐗𝕀(X=x)V𝐗f(V|Pa(V))f(I=1)\displaystyle=\frac{f(I_{{\mathbf{X}}}=1)\prod_{X\in{\mathbf{X}}}{\mathbb{I}}(% X=x)\prod_{V\notin{\mathbf{X}}}f(V|Pa(V))}{f(I=1)}
=X𝐗𝕀(X=x)V𝕍1f(V|Pa(V))\displaystyle=\prod_{X\in{\mathbf{X}}}{\mathbb{I}}(X=x)\cdot\prod_{V\notin{% \mathbb{V}}_{1}}f(V|Pa(V))
=f(𝒱|do(𝐗=𝐱))\displaystyle=f({\mathcal{V}}|do({\mathbf{X}}={\mathbf{x}}))

Lema 6.8.

Se (𝒢,f)({\mathcal{G}}_{*},f_{*}) é tal qual em Definição 6.6, então:

f(𝒱|I𝐗=0)\displaystyle f_{*}({\mathcal{V}}|I_{{\mathbf{X}}}=0) =f(𝒱).\displaystyle=f({\mathcal{V}}).
Demonstração.
f(𝒱|I𝐗=0)\displaystyle f_{*}({\mathcal{V}}|I_{{\mathbf{X}}}=0) =f(𝒱,I𝐗=0)f(I𝐗=0)\displaystyle=\frac{f_{*}({\mathcal{V}},I_{{\mathbf{X}}}=0)}{f_{*}(I_{{\mathbf% {X}}}=0)}
=f(I𝐗=0)X𝐗f(X|Pa(X),IX=0)V𝐗f(V|Pa(V))f(I=0)\displaystyle=\frac{f_{*}(I_{{\mathbf{X}}}=0)\prod_{X\in{\mathbf{X}}}f_{*}(X|% Pa(X),I_{X}=0)\prod_{V\notin{\mathbf{X}}}f(V|Pa(V))}{f_{*}(I=0)}
=X𝐗f(X|Pa(X))V𝐗f(V|Pa(V))\displaystyle=\prod_{X\in{\mathbf{X}}}f(X|Pa(X))\prod_{V\notin{\mathbf{X}}}f(V% |Pa(V))
=V𝒱f(V|Pa(V))\displaystyle=\prod_{V\in{\mathcal{V}}}f(V|Pa(V))
=f(𝒱)\displaystyle=f({\mathcal{V}})

Lema 6.9.

Se (𝒢,f)({\mathcal{G}}_{*},f_{*}) é tal qual em Definição 6.6 e 𝐙{\mathbf{Z}} satisfaz o segundo item do critério backdoor para medir o efeito causal de XX em YY, então IdY|X,𝐙I\perp^{d}Y|X,{\mathbf{Z}}.

Demonstração.

Tome um caminho arbitrário de II em YY, C=(I,C2,,Cn1,Y)C=(I,C_{2},\ldots,C_{n-1},Y). Por definição de II, C2=XC_{2}=X e IXI\rightarrow X. Se XC3X\rightarrow C_{3}, então XX não é um colisor em CC e CC está bloqueado dado XX e 𝐙{\mathbf{Z}}. Se XC3X\leftarrow C_{3}, então (X,C3,,Cn1,Y)(X,C_{3},\ldots,C_{n-1},Y) está bloqueado dado 𝐙{\mathbf{Z}}, uma vez que 𝐙{\mathbf{Z}} satisfaz o segundo item do critério backdoor. Conclua que CC está bloqueado dado XX e 𝐙{\mathbf{Z}}. ∎

Lema 6.10.

Se 𝐙{\mathbf{Z}} satisfaz o segundo item do critério backdoor para medir o efeito causal de XX em YY, então

f(y|do(x),𝐳)\displaystyle f(y|do(x),{\mathbf{z}}) =f(y|x,𝐳).\displaystyle=f(y|x,{\mathbf{z}}).
Demonstração.
f(y|do(x),𝐳)\displaystyle f(y|do(x),{\mathbf{z}}) =f(y|I=1,𝐳)\displaystyle=f_{*}(y|I=1,{\mathbf{z}})
=f(y,X|I=1,𝐳)dX\displaystyle=\int f_{*}(y,X|I=1,{\mathbf{z}})dX
=f(X|I=1,𝐳)f(y|X,I=1,𝐳)𝑑X\displaystyle=\int f_{*}(X|I=1,{\mathbf{z}})f_{*}(y|X,I=1,{\mathbf{z}})dX
=𝕀(X=x)f(y|X,I=1,𝐳)𝑑X\displaystyle=\int{\mathbb{I}}(X=x)f_{*}(y|X,I=1,{\mathbf{z}})dX
=f(y|x,I=1,𝐳)\displaystyle=f_{*}(y|x,I=1,{\mathbf{z}})
=f(y|x,I=0,𝐳)\displaystyle=f_{*}(y|x,I=0,{\mathbf{z}})
=f(y|x,𝐳)\displaystyle=f(y|x,{\mathbf{z}})

Lema 6.11.

Se (𝒢,f)({\mathcal{G}}_{*},f_{*}) é tal qual em Definição 6.6 e 𝐙{\mathbf{Z}} satisfaz o critério backdoor para medir o efeito causal de XX em YY, então Id𝐙I\perp^{d}{\mathbf{Z}}.

Demonstração.

Tome arbitrariamente um Z𝐙Z\in{\mathbf{Z}} e um caminho de II em ZZ, C=(I,C2,,Cn1,Z)C=(I,C_{2},\ldots,C_{n-1},Z). Por definição de II, C2=XC_{2}=X e IXI\rightarrow X. Suponha por absurdo que CC não tem colisor. Como, IXI\rightarrow X, decorre que C=IXCn1ZC=I\rightarrow X\rightarrow\ldots\rightarrow C_{n-1}\rightarrow Z. Assim, ZZ é um descendente de XX, uma contradição com o critério backdoor (Definição 3.11). Conclua que CC tem um colisor. Assim, CC está marginalmente bloqueado (Definição 2.47). ∎

Lema 6.12.

Se 𝐙{\mathbf{Z}} satisfaz o critério backdoor para medir o efeito causal de XX em YY, então f(𝐳|do(x))=f(𝐳)f({\mathbf{z}}|do(x))=f({\mathbf{z}}).

Demonstração.
f(𝐳|do(x))\displaystyle f({\mathbf{z}}|do(x)) =f(𝐳|I=1)\displaystyle=f_{*}({\mathbf{z}}|I=1)
=f(𝐳|I=0)\displaystyle=f_{*}({\mathbf{z}}|I=0)
=f(𝐳)\displaystyle=f({\mathbf{z}})

Prova do Teorema 3.19.

Decorre diretamente dos Lemas 6.10 e 6.12. ∎

Prova do Corolário 3.20.
f(y|do(X=x))\displaystyle f(y|do(X=x)) =f(y,𝐳|do(X=x))𝑑𝐳\displaystyle=\int f(y,{\mathbf{z}}|do(X=x))d{\mathbf{z}}
=f(𝐳|do(X=x))f(y|do(X=x),𝐳)\displaystyle=\int f({\mathbf{z}}|do(X=x))f(y|do(X=x),{\mathbf{z}})
=f(𝐳)f(y|x,𝐳)\displaystyle=\int f({\mathbf{z}})f(y|x,{\mathbf{z}})

6.E.2 Teoremas 3.21 e 3.22

Prova do Teorema 3.21.
𝔼[g(Y)|do(X=x),𝐙]\displaystyle{\mathbb{E}}[g(Y)|do(X=x),{\mathbf{Z}}] =g(y)f(y|do(x),𝐙)𝑑y\displaystyle=\int g(y)f(y|do(x),{\mathbf{Z}})dy
=g(y)f(y|x,𝐙)𝑑y\displaystyle=\int g(y)f(y|x,{\mathbf{Z}})dy
=𝔼[g(Y)|X=x,𝐙]\displaystyle={\mathbb{E}}[g(Y)|X=x,{\mathbf{Z}}] (14)
𝔼[g(Y)|do(X=x)]\displaystyle{\mathbb{E}}[g(Y)|do(X=x)] =𝔼[𝔼[g(Y)|do(X=x),𝐙]]\displaystyle={\mathbb{E}}[{\mathbb{E}}[g(Y)|do(X=x),{\mathbf{Z}}]]
=𝔼[𝔼[g(Y)|X=x,𝐙]]\displaystyle={\mathbb{E}}[{\mathbb{E}}[g(Y)|X=x,{\mathbf{Z}}]]

Prova do Teorema 3.22.
𝔼[g(Y)|do(x),𝐙]\displaystyle{\mathbb{E}}[g(Y)|do(x),{\mathbf{Z}}] =g(y)f(y|do(x),𝐙)𝑑y\displaystyle=\int g(y)f(y|do(x),{\mathbf{Z}})dy
=g(y)f(y|x,𝐙)𝑑y\displaystyle=\int g(y)f(y|x,{\mathbf{Z}})dy
=g(y)f(y,x|𝐙)f(x|𝐙)𝑑y\displaystyle=\int\frac{g(y)f(y,x|{\mathbf{Z}})}{f(x|{\mathbf{Z}})}dy
=g(y)𝕀(x=x)f(y,x|𝐙)f(x|𝐙)d(x,y)\displaystyle=\int\frac{g(y){\mathbb{I}}(x_{*}=x)f(y,x_{*}|{\mathbf{Z}})}{f(x|% {\mathbf{Z}})}d(x_{*},y)
=𝔼[g(Y)𝕀(X=x)f(x|𝐙)|𝐙]\displaystyle={\mathbb{E}}\left[\frac{g(Y){\mathbb{I}}(X=x)}{f(x|{\mathbf{Z}})% }|{\mathbf{Z}}\right]
=𝔼[g(Y)𝕀(X=x)|𝐙]f(x|𝐙)\displaystyle=\frac{{\mathbb{E}}[g(Y){\mathbb{I}}(X=x)|{\mathbf{Z}}]}{f(x|{% \mathbf{Z}})}
𝔼[Y|do(x)]\displaystyle{\mathbb{E}}[Y|do(x)] =𝔼[𝔼[Y|do(X),𝐙]]\displaystyle={\mathbb{E}}[{\mathbb{E}}[Y|do(X),{\mathbf{Z}}]]
=𝔼[𝔼[g(Y)𝕀(X=x)|𝐙]f(x|𝐙)]\displaystyle={\mathbb{E}}\left[\frac{{\mathbb{E}}[g(Y){\mathbb{I}}(X=x)|{% \mathbf{Z}}]}{f(x|{\mathbf{Z}})}\right]
=𝔼[𝔼[g(Y)𝕀(X=x)f(x|𝐙)|𝐙]]\displaystyle={\mathbb{E}}\left[{\mathbb{E}}\left[\frac{g(Y){\mathbb{I}}(X=x)}% {f(x|{\mathbf{Z}})}|{\mathbf{Z}}\right]\right]
=𝔼[g(Y)𝕀(X=x)f(x|𝐙)]\displaystyle={\mathbb{E}}\left[\frac{g(Y){\mathbb{I}}(X=x)}{f(x|{\mathbf{Z}})% }\right]

6.E.3 Teorema 3.26

Lema 6.13.

Se (Wn)n(W_{n})_{n\in\mathbb{N}} é uma sequência de variáveis aleatórias tais que 𝔼[|Wn|]=o(1){\mathbb{E}}[|W_{n}|]=o(1), então Wn0W_{n}\stackrel{{\scriptstyle{\mathbb{P}}}}{{\longrightarrow}}0.

Demonstração.
(|Wn|>ϵ)\displaystyle{\mathbb{P}}(|W_{n}|>\epsilon) 𝔼[|Wn|]ϵ\displaystyle\leq\frac{{\mathbb{E}}[|W_{n}|]}{\epsilon} Markov
=o(1)\displaystyle=o(1)

Prova do Teorema 3.26.

Como 𝔼[|μ(x,𝐙)|]<{\mathbb{E}}[|\mu(x,{\mathbf{Z}})|]<\infty, pela Lei dos Grandes Números,

i=1nμ(x,𝐙i)n\displaystyle\frac{\sum_{i=1}^{n}\mu(x,{\mathbf{Z}}_{i})}{n} 𝔼[μ(x,𝐙)]\displaystyle\stackrel{{\scriptstyle{\mathbb{P}}}}{{\longrightarrow}}{\mathbb{% E}}[\mu(x,{\mathbf{Z}})]

Portanto, pelo Teorema 3.21, é suficiente provar que 𝔼^1[Y|do(X=x)]i=1nμ(x,𝐙i)n0{\widehat{{\mathbb{E}}}}_{1}[Y|do(X=x)]-\frac{\sum_{i=1}^{n}\mu(x,{\mathbf{Z}}% _{i})}{n}\stackrel{{\scriptstyle{\mathbb{P}}}}{{\longrightarrow}}0. Usando o Lema 6.13, é suficiente provar que 𝔼[|𝔼^1[Y|do(X=x)]i=1nμ(x,𝐙i)n|]=o(1){\mathbb{E}}\left[\bigg{|}{\widehat{{\mathbb{E}}}}_{1}[Y|do(X=x)]-\frac{\sum_{% i=1}^{n}\mu(x,{\mathbf{Z}}_{i})}{n}\bigg{|}\right]=o(1).

𝔼[|𝔼^1[Y|do(X=x)]i=1nμ(x,𝐙i)n|]\displaystyle{\mathbb{E}}\left[\bigg{|}{\widehat{{\mathbb{E}}}}_{1}[Y|do(X=x)]% -\frac{\sum_{i=1}^{n}\mu(x,{\mathbf{Z}}_{i})}{n}\bigg{|}\right] =𝔼[|i=1n(μ^(x,𝐙i)μ(x,𝐙i))n|]\displaystyle={\mathbb{E}}\left[\bigg{|}\frac{\sum_{i=1}^{n}(\hat{\mu}(x,{% \mathbf{Z}}_{i})-\mu(x,{\mathbf{Z}}_{i}))}{n}\bigg{|}\right]
n1i=1n𝔼[|μ^(x,𝐙i)μ(x,𝐙i)|]\displaystyle\leq n^{-1}\sum_{i=1}^{n}{\mathbb{E}}\left[|\hat{\mu}(x,{\mathbf{% Z}}_{i})-\mu(x,{\mathbf{Z}}_{i})|\right]
=𝔼[|μ^(x,𝐙)μ(x,𝐙)|]\displaystyle={\mathbb{E}}\left[|\hat{\mu}(x,{\mathbf{Z}})-\mu(x,{\mathbf{Z}})% |\right]
=o(1)]\displaystyle=o(1)]

6.E.4 Teorema 3.29

Prova do Teorema 3.29.

Pela Lei dos Grandes números, n1i=1nYi𝕀(Xi=x)f(x|𝐙i)𝔼[Y𝕀(X=x)f(x|𝐙)]n^{-1}\sum_{i=1}^{n}\frac{Y_{i}{\mathbb{I}}(X_{i}=x)}{f(x|{\mathbf{Z}}_{i})}% \stackrel{{\scriptstyle{\mathbb{P}}}}{{\longrightarrow}}{\mathbb{E}}\left[% \frac{Y{\mathbb{I}}(X=x)}{f(x|{\mathbf{Z}})}\right]. Como pelo Teorema 3.22 temos que 𝔼[Y𝕀(X=x)f(x|𝐙)]=𝔼[Y|do(X=x)]{\mathbb{E}}\left[\frac{Y{\mathbb{I}}(X=x)}{f(x|{\mathbf{Z}})}\right]={\mathbb% {E}}[Y|do(X=x)], usando o Lema 6.13 é suficiente provar que

𝔼[|n1i=1nYi𝕀(Xi=x)f^(x|𝐙i)n1i=1nYi𝕀(Xi=x)f(x|𝐙i)|]\displaystyle{\mathbb{E}}\left[\bigg{|}n^{-1}\sum_{i=1}^{n}\frac{Y_{i}{\mathbb% {I}}(X_{i}=x)}{\widehat{f}(x|{\mathbf{Z}}_{i})}-n^{-1}\sum_{i=1}^{n}\frac{Y_{i% }{\mathbb{I}}(X_{i}=x)}{f(x|{\mathbf{Z}}_{i})}\bigg{|}\right] =o(1).\displaystyle=o(1).
𝔼[|n1i=1nYi𝕀(Xi=x)f^(x|𝐙i)n1i=1nYi𝕀(Xi=x)f(x|𝐙i)|]\displaystyle{\mathbb{E}}\left[\bigg{|}n^{-1}\sum_{i=1}^{n}\frac{Y_{i}{\mathbb% {I}}(X_{i}=x)}{\widehat{f}(x|{\mathbf{Z}}_{i})}-n^{-1}\sum_{i=1}^{n}\frac{Y_{i% }{\mathbb{I}}(X_{i}=x)}{f(x|{\mathbf{Z}}_{i})}\bigg{|}\right]
\displaystyle\leq n1i=1n𝔼[|Yi𝕀(Xi=x)f^(x|𝐙i)Yi𝕀(Xi=x)f(x|𝐙i)|]\displaystyle n^{-1}\sum_{i=1}^{n}{\mathbb{E}}\left[\bigg{|}\frac{Y_{i}{% \mathbb{I}}(X_{i}=x)}{\widehat{f}(x|{\mathbf{Z}}_{i})}-\frac{Y_{i}{\mathbb{I}}% (X_{i}=x)}{f(x|{\mathbf{Z}}_{i})}\bigg{|}\right]
=\displaystyle= 𝔼[|Y1𝕀(X1=x)f^(x|𝐙1)Y1𝕀(X1=x)f(x|𝐙1)|]\displaystyle{\mathbb{E}}\left[\bigg{|}\frac{Y_{1}{\mathbb{I}}(X_{1}=x)}{% \widehat{f}(x|{\mathbf{Z}}_{1})}-\frac{Y_{1}{\mathbb{I}}(X_{1}=x)}{f(x|{% \mathbf{Z}}_{1})}\bigg{|}\right]
=\displaystyle= 𝔼[|Yi𝕀(Xi=x)(f^(x|𝐙i)f(x|𝐙i))f^(x|𝐙i)f(x|𝐙i)|]\displaystyle{\mathbb{E}}\left[\bigg{|}\frac{Y_{i}{\mathbb{I}}(X_{i}=x)(% \widehat{f}(x|{\mathbf{Z}}_{i})-f(x|{\mathbf{Z}}_{i}))}{\widehat{f}(x|{\mathbf% {Z}}_{i})f(x|{\mathbf{Z}}_{i})}\bigg{|}\right]
\displaystyle\leq δ2𝔼[|Yi𝕀(Xi=x)(f^(x|𝐙i)f(x|𝐙i))|]\displaystyle\delta^{-2}{\mathbb{E}}\left[|Y_{i}{\mathbb{I}}(X_{i}=x)(\widehat% {f}(x|{\mathbf{Z}}_{i})-f(x|{\mathbf{Z}}_{i}))|\right] infzmin{f(x|𝐙1),f^(x|𝐙1)}>δ\displaystyle\inf_{z}\min\{f(x|{\mathbf{Z}}_{1}),\widehat{f}(x|{\mathbf{Z}}_{1% })\}>\delta
=\displaystyle= δ2𝔼[|f^(x|𝐙i)f(x|𝐙i)|𝔼[|Yi𝕀(Xi=x)||𝐙]]\displaystyle\delta^{-2}{\mathbb{E}}\left[|\widehat{f}(x|{\mathbf{Z}}_{i})-f(x% |{\mathbf{Z}}_{i})|\cdot{\mathbb{E}}[|Y_{i}{\mathbb{I}}(X_{i}=x)|\big{|}{% \mathbf{Z}}]\right] Lei da esperança total
\displaystyle\leq Mδ2𝔼[|f^(x|𝐙i)f(x|𝐙i)|]\displaystyle M\delta^{-2}{\mathbb{E}}\left[|\widehat{f}(x|{\mathbf{Z}}_{i})-f% (x|{\mathbf{Z}}_{i})|\right] supz𝔼[|Yi𝕀(Xi=x)|𝐙=𝐳]<M\displaystyle\sup_{z}{\mathbb{E}}[|Y_{i}{\mathbb{I}}(X_{i}=x)|{\mathbf{Z}}={% \mathbf{z}}]<M
=\displaystyle= o(1)\displaystyle o(1)

6.E.5 Teorema 3.32

Prova do Teorema 3.32.

Se as condições do Teorema 3.26 estão satisfeitas, então decorre deste resultado que 𝔼^1[Y|do(X=x)]𝔼[Y|do(X=x)]{\widehat{{\mathbb{E}}}}_{1}[Y|do(X=x)]\stackrel{{\scriptstyle{\mathbb{P}}}}{{% \longrightarrow}}{\mathbb{E}}[Y|do(X=x)]. Portanto, usando Lema 6.13, resta demonstrar que

𝔼[|𝔼^2[Y|do(X=x)]i=1n𝕀(Xi=x)μ^(x,𝐙i)nf^(x|𝐙i)|]\displaystyle{\mathbb{E}}\left[\bigg{|}{\widehat{{\mathbb{E}}}}_{2}[Y|do(X=x)]% -\sum_{i=1}^{n}\frac{{\mathbb{I}}(X_{i}=x)\hat{\mu}(x,{\mathbf{Z}}_{i})}{n\hat% {f}(x|{\mathbf{Z}}_{i})}\bigg{|}\right] =o(1)\displaystyle=o(1)
𝔼[|𝔼^2[Y|do(X=x)]i=1n𝕀(Xi=x)μ^(x,𝐙i)nf^(x|𝐙i)|]\displaystyle{\mathbb{E}}\left[\bigg{|}{\widehat{{\mathbb{E}}}}_{2}[Y|do(X=x)]% -\sum_{i=1}^{n}\frac{{\mathbb{I}}(X_{i}=x)\hat{\mu}(x,{\mathbf{Z}}_{i})}{n\hat% {f}(x|{\mathbf{Z}}_{i})}\bigg{|}\right]
=\displaystyle= 𝔼[|i=1n𝕀(Xi=x)(Yiμ^(x,𝐙i))nf^(x|𝐙i)|]\displaystyle{\mathbb{E}}\left[\bigg{|}\sum_{i=1}^{n}\frac{{\mathbb{I}}(X_{i}=% x)(Y_{i}-\hat{\mu}(x,{\mathbf{Z}}_{i}))}{n\hat{f}(x|{\mathbf{Z}}_{i})}\bigg{|}\right]
\displaystyle\leq n1i=1n𝔼[|𝕀(Xi=x)(Yiμ^(x,𝐙i))f^(x|𝐙i)|]\displaystyle n{-1}\sum_{i=1}^{n}{\mathbb{E}}\left[\bigg{|}\frac{{\mathbb{I}}(% X_{i}=x)(Y_{i}-\hat{\mu}(x,{\mathbf{Z}}_{i}))}{\hat{f}(x|{\mathbf{Z}}_{i})}% \bigg{|}\right]
=\displaystyle= 𝔼[|𝕀(X1=x)(Y1μ^(x,𝐙1))f^(x|𝐙1)|]\displaystyle{\mathbb{E}}\left[\bigg{|}\frac{{\mathbb{I}}(X_{1}=x)(Y_{1}-\hat{% \mu}(x,{\mathbf{Z}}_{1}))}{\hat{f}(x|{\mathbf{Z}}_{1})}\bigg{|}\right]
\displaystyle\leq δ1𝔼[|𝕀(X1=x)(Y1μ^(x,𝐙1))|]\displaystyle\delta^{-1}{\mathbb{E}}\left[\big{|}{\mathbb{I}}(X_{1}=x)(Y_{1}-% \hat{\mu}(x,{\mathbf{Z}}_{1}))\big{|}\right] inf𝐳f^(x|𝐳)>δ\displaystyle\inf_{\mathbf{z}}\widehat{f}(x|{\mathbf{z}})>\delta
\displaystyle\leq δ1𝔼[|𝕀(X1=x)(𝔼[Y1|X1,𝐙1]μ^(x,𝐙1))|]\displaystyle\delta^{-1}{\mathbb{E}}\left[\big{|}{\mathbb{I}}(X_{1}=x)({% \mathbb{E}}[Y_{1}|X_{1},{\mathbf{Z}}_{1}]-\hat{\mu}(x,{\mathbf{Z}}_{1}))\big{|% }\right] Lei da esperança total
=\displaystyle= δ1𝔼[|𝕀(X1=x)(𝔼[Y1|X1=x,𝐙1]μ^(x,𝐙1))|]\displaystyle\delta^{-1}{\mathbb{E}}\left[\big{|}{\mathbb{I}}(X_{1}=x)({% \mathbb{E}}[Y_{1}|X_{1}=x,{\mathbf{Z}}_{1}]-\hat{\mu}(x,{\mathbf{Z}}_{1}))\big% {|}\right] 𝕀(X1=x)𝔼[Y1|X1,𝐙1]𝕀(X1=x)𝔼[Y1|X1=x,𝐙1]\displaystyle{\mathbb{I}}(X_{1}=x){\mathbb{E}}[Y_{1}|X_{1},{\mathbf{Z}}_{1}]% \equiv{\mathbb{I}}(X_{1}=x){\mathbb{E}}[Y_{1}|X_{1}=x,{\mathbf{Z}}_{1}]
\displaystyle\leq δ1𝔼[|𝔼[Y1|X1=x,𝐙1]μ^(x,𝐙1)|]\displaystyle\delta^{-1}{\mathbb{E}}\left[\big{|}{\mathbb{E}}[Y_{1}|X_{1}=x,{% \mathbf{Z}}_{1}]-\hat{\mu}(x,{\mathbf{Z}}_{1})\big{|}\right]
=\displaystyle= 𝔼[|μ(x,𝐙1)μ^(x,𝐙1)|]=o(1)\displaystyle{\mathbb{E}}\left[\big{|}\mu(x,{\mathbf{Z}}_{1})-\hat{\mu}(x,{% \mathbf{Z}}_{1})\big{|}\right]=o(1)

A seguir, se as condições do Teorema 3.29 estão satisfeitas, então decorre deste resultado que 𝔼^2[Y|do(X=x)]𝔼[Y|do(X=x)]{\widehat{{\mathbb{E}}}}_{2}[Y|do(X=x)]\stackrel{{\scriptstyle{\mathbb{P}}}}{{% \longrightarrow}}{\mathbb{E}}[Y|do(X=x)]. Portanto, usando Lema 6.13, resta demonstrar que

𝔼[|𝔼^1[Y|do(X=x)]i=1n𝕀(Xi=x)μ^(x,𝐙i)nf^(x|𝐙i)|]\displaystyle{\mathbb{E}}\left[\bigg{|}{\widehat{{\mathbb{E}}}}_{1}[Y|do(X=x)]% -\sum_{i=1}^{n}\frac{{\mathbb{I}}(X_{i}=x)\hat{\mu}(x,{\mathbf{Z}}_{i})}{n\hat% {f}(x|{\mathbf{Z}}_{i})}\bigg{|}\right] =o(1)\displaystyle=o(1)
𝔼[|𝔼^1[Y|do(X=x)]i=1n𝕀(Xi=x)μ^(x,𝐙i)nf^(x|𝐙i)|]\displaystyle{\mathbb{E}}\left[\bigg{|}{\widehat{{\mathbb{E}}}}_{1}[Y|do(X=x)]% -\sum_{i=1}^{n}\frac{{\mathbb{I}}(X_{i}=x)\hat{\mu}(x,{\mathbf{Z}}_{i})}{n\hat% {f}(x|{\mathbf{Z}}_{i})}\bigg{|}\right]
=\displaystyle= 𝔼[|i=1n(f^(x|𝐙i)𝕀(Xi=x))μ^(x,𝐙i)nf^(x|𝐙i)|]\displaystyle{\mathbb{E}}\left[\bigg{|}\sum_{i=1}^{n}\frac{(\widehat{f}(x|{% \mathbf{Z}}_{i})-{\mathbb{I}}(X_{i}=x))\hat{\mu}(x,{\mathbf{Z}}_{i})}{n% \widehat{f}(x|{\mathbf{Z}}_{i})}\bigg{|}\right]
\displaystyle\leq n1i=1n𝔼[|(f^(x|𝐙i)𝕀(Xi=x))μ^(x,𝐙i)f^(x|𝐙i)|]\displaystyle n^{-1}\sum_{i=1}^{n}{\mathbb{E}}\left[\bigg{|}\frac{(\widehat{f}% (x|{\mathbf{Z}}_{i})-{\mathbb{I}}(X_{i}=x))\hat{\mu}(x,{\mathbf{Z}}_{i})}{% \widehat{f}(x|{\mathbf{Z}}_{i})}\bigg{|}\right]
=\displaystyle= 𝔼[|(f^(x|𝐙1)𝕀(X1=x))μ^(x,𝐙1)f^(x|𝐙1)|]\displaystyle{\mathbb{E}}\left[\bigg{|}\frac{(\widehat{f}(x|{\mathbf{Z}}_{1})-% {\mathbb{I}}(X_{1}=x))\hat{\mu}(x,{\mathbf{Z}}_{1})}{\widehat{f}(x|{\mathbf{Z}% }_{1})}\bigg{|}\right]
\displaystyle\leq δ1𝔼[|(f^(x|𝐙1)𝕀(X1=x))μ^(x,𝐙1)|]\displaystyle\delta^{-1}{\mathbb{E}}\left[\big{|}(\widehat{f}(x|{\mathbf{Z}}_{% 1})-{\mathbb{I}}(X_{1}=x))\hat{\mu}(x,{\mathbf{Z}}_{1})\big{|}\right] inf𝐳f^(x|𝐙1)>δ\displaystyle\inf_{\mathbf{z}}\widehat{f}(x|{\mathbf{Z}}_{1})>\delta
\displaystyle\leq δ1M𝔼[|f^(x|𝐙1)𝕀(X1=x)|]\displaystyle\delta^{-1}M{\mathbb{E}}\left[\big{|}\widehat{f}(x|{\mathbf{Z}}_{% 1})-{\mathbb{I}}(X_{1}=x)\big{|}\right] sup𝐳μ^(x,𝐳)<M\displaystyle\sup_{\mathbf{z}}\hat{\mu}(x,{\mathbf{z}})<M
=\displaystyle= δ1M𝔼[|f^(x|𝐙1)𝔼[𝕀(X1=x)|𝐙1]|]\displaystyle\delta^{-1}M{\mathbb{E}}\left[\big{|}\widehat{f}(x|{\mathbf{Z}}_{% 1})-{\mathbb{E}}[{\mathbb{I}}(X_{1}=x)|{\mathbf{Z}}_{1}]\big{|}\right] Lei da esperança total
=\displaystyle= δ1M𝔼[|f^(x|𝐙1)f(x|𝐙1)|]=o(1)\displaystyle\delta^{-1}M{\mathbb{E}}\left[\big{|}\widehat{f}(x|{\mathbf{Z}}_{% 1})-f(x|{\mathbf{Z}}_{1})\big{|}\right]=o(1)

6.E.6 Teorema 3.39

Prova do Teorema 3.39.

Se X𝕀(𝐙𝐳1)X\equiv{\mathbb{I}}({\mathbf{Z}}\geq{\mathbf{z}}_{1}), então:

CACE(𝐙=𝐳1)\displaystyle{CACE}({\mathbf{Z}}={\mathbf{z}}_{1}) =𝔼[Y|do(X=1),𝐙=𝐳1]𝔼[Y|do(X=0),𝐙=𝐳1]\displaystyle={\mathbb{E}}[Y|do(X=1),{\mathbf{Z}}={\mathbf{z}}_{1}]-{\mathbb{E% }}[Y|do(X=0),{\mathbf{Z}}={\mathbf{z}}_{1}]
=lim𝐳𝐳1𝔼[Y|do(X=1),𝐙=𝐳]lim𝐳𝐳1𝔼[Y|do(X=0),𝐙=𝐳]\displaystyle=\lim_{{\mathbf{z}}\downarrow{\mathbf{z}}_{1}}{\mathbb{E}}[Y|do(X% =1),{\mathbf{Z}}={\mathbf{z}}]-\lim_{{\mathbf{z}}\uparrow{\mathbf{z}}_{1}}{% \mathbb{E}}[Y|do(X=0),{\mathbf{Z}}={\mathbf{z}}] continuidade
=lim𝐳𝐳1𝔼[Y|X=1,𝐙=𝐳]lim𝐳𝐳1𝔼[Y|X=0,𝐙=𝐳]\displaystyle=\lim_{{\mathbf{z}}\downarrow{\mathbf{z}}_{1}}{\mathbb{E}}[Y|X=1,% {\mathbf{Z}}={\mathbf{z}}]-\lim_{{\mathbf{z}}\uparrow{\mathbf{z}}_{1}}{\mathbb% {E}}[Y|X=0,{\mathbf{Z}}={\mathbf{z}}]
=lim𝐳𝐳1𝔼[Y|𝐙=𝐳]lim𝐳𝐳1𝔼[Y|𝐙=𝐳]\displaystyle=\lim_{{\mathbf{z}}\downarrow{\mathbf{z}}_{1}}{\mathbb{E}}[Y|{% \mathbf{Z}}={\mathbf{z}}]-\lim_{{\mathbf{z}}\uparrow{\mathbf{z}}_{1}}{\mathbb{% E}}[Y|{\mathbf{Z}}={\mathbf{z}}] X𝕀(𝐙𝐳1)\displaystyle X\equiv{\mathbb{I}}({\mathbf{Z}}\geq{\mathbf{z}}_{1})

A seguir, considere que f(x|𝐙)(0,1)f(x|{\mathbf{Z}})\in(0,1) é contínua exceto em 𝐳1{\mathbf{z}}_{1}. Primeiramente, note que

𝔼[Y|𝐙]\displaystyle{\mathbb{E}}[Y|{\mathbf{Z}}] =𝔼[𝔼[Y|X,𝐙]|𝐙]\displaystyle={\mathbb{E}}[{\mathbb{E}}[Y|X,{\mathbf{Z}}]|{\mathbf{Z}}]
=𝔼[Y|X=1,𝐙]f(X=1|𝐙)+𝔼[Y|X=0,𝐙](1f(X=1|𝐙))\displaystyle={\mathbb{E}}[Y|X=1,{\mathbf{Z}}]f(X=1|{\mathbf{Z}})+{\mathbb{E}}% [Y|X=0,{\mathbf{Z}}](1-f(X=1|{\mathbf{Z}}))
=(𝔼[Y|X=1,𝐙]𝔼[Y|X=0,𝐙])f(X=1|𝐙)+𝔼[Y|X=0,𝐙]\displaystyle=({\mathbb{E}}[Y|X=1,{\mathbf{Z}}]-{\mathbb{E}}[Y|X=0,{\mathbf{Z}% }])f(X=1|{\mathbf{Z}})+{\mathbb{E}}[Y|X=0,{\mathbf{Z}}]
=CACE(𝐙)f(X=1|𝐙)+𝔼[Y|do(X=0),𝐙]\displaystyle={CACE}({\mathbf{Z}})f(X=1|{\mathbf{Z}})+{\mathbb{E}}[Y|do(X=0),{% \mathbf{Z}}] (15)

Como 𝔼[Y|do(X=0),𝐙]{\mathbb{E}}[Y|do(X=0),{\mathbf{Z}}] e 𝔼[Y|do(X=1),𝐙]{\mathbb{E}}[Y|do(X=1),{\mathbf{Z}}] são contínuas em 𝐳1{\mathbf{z}}_{1}, CACE(𝐙){CACE}({\mathbf{Z}}) também é contínua em 𝐳1{\mathbf{z}}_{1}. Assim, decorre da Seção 6.E.6 que

lim𝐳𝐳1𝔼[Y|𝐙=𝐳]\displaystyle\lim_{{\mathbf{z}}\downarrow{\mathbf{z}}_{1}}{\mathbb{E}}[Y|{% \mathbf{Z}}={\mathbf{z}}] =CACE(𝐳1)lim𝐳𝐳1f(X=1|𝐳)+𝔼[Y|do(X=0),𝐙=𝐳1]\displaystyle={CACE}({\mathbf{z}}_{1})\lim_{{\mathbf{z}}\downarrow{\mathbf{z}}% _{1}}f(X=1|{\mathbf{z}})+{\mathbb{E}}[Y|do(X=0),{\mathbf{Z}}={\mathbf{z}}_{1}]
lim𝐳𝐳1𝔼[Y|𝐙=𝐳]\displaystyle\lim_{{\mathbf{z}}\uparrow{\mathbf{z}}_{1}}{\mathbb{E}}[Y|{% \mathbf{Z}}={\mathbf{z}}] =CACE(𝐳1)lim𝐳𝐳1f(X=1|𝐳)+𝔼[Y|do(X=0),𝐙=𝐳1]\displaystyle={CACE}({\mathbf{z}}_{1})\lim_{{\mathbf{z}}\uparrow{\mathbf{z}}_{% 1}}f(X=1|{\mathbf{z}})+{\mathbb{E}}[Y|do(X=0),{\mathbf{Z}}={\mathbf{z}}_{1}]

Finalmente subtraindo as equações acima, obtemos

lim𝐳𝐳1𝔼[Y|𝐙=𝐳]lim𝐳𝐳1𝔼[Y|𝐙=𝐳]\displaystyle\lim_{{\mathbf{z}}\downarrow{\mathbf{z}}_{1}}{\mathbb{E}}[Y|{% \mathbf{Z}}={\mathbf{z}}]-\lim_{{\mathbf{z}}\uparrow{\mathbf{z}}_{1}}{\mathbb{% E}}[Y|{\mathbf{Z}}={\mathbf{z}}] =CACE(𝐳1)(lim𝐳𝐳1f(X=1|𝐳)lim𝐳𝐳1f(X=1|𝐳))\displaystyle={CACE}({\mathbf{z}}_{1})(\lim_{{\mathbf{z}}\downarrow{\mathbf{z}% }_{1}}f(X=1|{\mathbf{z}})-\lim_{{\mathbf{z}}\uparrow{\mathbf{z}}_{1}}f(X=1|{% \mathbf{z}}))
CACE(𝐳1)\displaystyle{CACE}({\mathbf{z}}_{1}) =lim𝐳𝐳1𝔼[Y|𝐙=𝐳]lim𝐳𝐳1𝔼[Y|𝐙=𝐳]lim𝐳𝐳1f(X=1|𝐳)lim𝐳𝐳1f(X=1|𝐳)\displaystyle=\frac{\lim_{{\mathbf{z}}\downarrow{\mathbf{z}}_{1}}{\mathbb{E}}[% Y|{\mathbf{Z}}={\mathbf{z}}]-\lim_{{\mathbf{z}}\uparrow{\mathbf{z}}_{1}}{% \mathbb{E}}[Y|{\mathbf{Z}}={\mathbf{z}}]}{\lim_{{\mathbf{z}}\downarrow{\mathbf% {z}}_{1}}f(X=1|{\mathbf{z}})-\lim_{{\mathbf{z}}\uparrow{\mathbf{z}}_{1}}f(X=1|% {\mathbf{z}})}