Apêndice 6.C Seção 3 (Independência Condicional e D-separação)

6.C.1 Relativas ao Lema 2.45

Prova do Lema 2.45.

A prova consistirá em demonstrar que, para cada ii, a afirmação ii decorre da afirmação i1i-1. Finalmente, a afirmação 11 decorre da afirmação 44. Os símbolos 𝐗{\mathbf{X}} e 𝐱{\mathbf{x}} referem-se a (𝐗1,,𝐗d)({\mathbf{X}}_{1},\ldots,{\mathbf{X}}_{d}) e (𝐱1,,𝐱d)({\mathbf{x}}_{1},\ldots,{\mathbf{x}}_{d}).

  • (12)(1\Longrightarrow 2)

    f(𝐱|𝐲)\displaystyle f({\mathbf{x}}|{\mathbf{y}}) =j=1df(𝐱j|𝐲)\displaystyle=\prod_{j=1}^{d}{f({\mathbf{x}}_{j}|{\mathbf{y}})} (1)\displaystyle(1)
    =j=1dh(𝐱j,𝐲)\displaystyle=\prod_{j=1}^{d}{h({\mathbf{x}}_{j},{\mathbf{y}})} h(𝐱j,𝐲)=f(𝐱j|𝐲)\displaystyle h({\mathbf{x}}_{j},{\mathbf{y}})=f({\mathbf{x}}_{j}|{\mathbf{y}})
  • (23)(2\Longrightarrow 3) Note que,

    f(𝐱i|𝐱i,𝐲)\displaystyle f({\mathbf{x}}_{i}|{\mathbf{x}}_{-i},{\mathbf{y}}) =f(𝐱|𝐲)f(𝐱1,,𝐱i1,𝐱i+1,𝐱d|𝐲)\displaystyle=\frac{f({\mathbf{x}}|{\mathbf{y}})}{f({\mathbf{x}}_{1},\ldots,{% \mathbf{x}}_{i-1},{\mathbf{x}}_{i+1},\ldots{\mathbf{x}}_{d}|{\mathbf{y}})}
    =f(𝐱|𝐲)f(𝐱|𝐲)𝑑𝐱i\displaystyle=\frac{f({\mathbf{x}}|{\mathbf{y}})}{\int_{\mathbb{R}}{f({\mathbf% {x}}|{\mathbf{y}})d{\mathbf{x}}_{i}}}
    =j=1dhj(𝐱j,𝐲)j=1dhj(𝐱j,𝐲)d𝐱i(2)\displaystyle=\frac{\prod_{j=1}^{d}{h_{j}({\mathbf{x}}_{j},{\mathbf{y}})}}{% \int_{\mathbb{R}}{\prod_{j=1}^{d}{h_{j}({\mathbf{x}}_{j},{\mathbf{y}})}d{% \mathbf{x}}_{i}}}(2)
    =j=1dhj(𝐱j,𝐲)jihj(𝐱j,𝐲)hi(𝐱i,𝐲)𝑑𝐱i\displaystyle=\frac{\prod_{j=1}^{d}{h_{j}({\mathbf{x}}_{j},{\mathbf{y}})}}{% \prod_{j\neq i}{h_{j}({\mathbf{x}}_{j},{\mathbf{y}})}\int_{\mathbb{R}}{h_{i}({% \mathbf{x}}_{i},{\mathbf{y}})d{\mathbf{x}}_{i}}}
    =h~i(𝐱i,𝐲)hi(𝐱i,𝐲)𝑑𝐱i\displaystyle=\frac{\tilde{h}_{i}({\mathbf{x}}_{i},{\mathbf{y}})}{\int_{% \mathbb{R}}{h_{i}({\mathbf{x}}_{i},{\mathbf{y}})d{\mathbf{x}}_{i}}}
    =jihj(𝐱j,𝐲)𝑑𝐱jjihj(𝐱j,𝐲)𝑑𝐱jhi(𝐱i,𝐲)hi(𝐱i,𝐲)𝑑𝐱i\displaystyle=\frac{\prod_{j\neq i}{\int_{\mathbb{R}}{h_{j}({\mathbf{x}}_{j},{% \mathbf{y}})d{\mathbf{x}}_{j}}}}{\prod_{j\neq i}{\int_{\mathbb{R}}{h_{j}({% \mathbf{x}}_{j},{\mathbf{y}})d{\mathbf{x}}_{j}}}}\cdot\frac{h_{i}({\mathbf{x}}% _{i},{\mathbf{y}})}{\int_{\mathbb{R}}{h_{i}({\mathbf{x}}_{i},{\mathbf{y}})d{% \mathbf{x}}_{i}}}
    =d1j=1dhj(𝐱j,𝐲)d𝐱idj=1dhj(𝐱j,𝐲)d𝐱\displaystyle=\frac{\int_{\mathbb{R}^{d-1}}{\prod_{j=1}^{d}{h_{j}({\mathbf{x}}% _{j},{\mathbf{y}})}d{\mathbf{x}}_{-i}}}{\int_{\mathbb{R}^{d}}{\prod_{j=1}^{d}{% h_{j}({\mathbf{x}}_{j},{\mathbf{y}})}d{\mathbf{x}}}}
    =d1f(𝐱|𝐲)𝑑𝐱idf(𝐱|𝐲)𝑑𝐱\displaystyle=\frac{\int_{\mathbb{R}^{d-1}}{f({\mathbf{x}}|{\mathbf{y}})d{% \mathbf{x}}_{-i}}}{\int_{\mathbb{R}^{d}}{f({\mathbf{x}}|{\mathbf{y}})d{\mathbf% {x}}}} (2)\displaystyle(2)
    =f(𝐱i|𝐲)\displaystyle=f({\mathbf{x}}_{i}|{\mathbf{y}})
  • (34)(3\Longrightarrow 4)

    f(𝐱i|𝐱1i1,𝐲)\displaystyle f({\mathbf{x}}_{i}|{\mathbf{x}}_{1}^{i-1},{\mathbf{y}}) =f(𝐱1i|𝐲)f(𝐱1i1|𝐲)\displaystyle=\frac{f({\mathbf{x}}_{1}^{i}|{\mathbf{y}})}{f({\mathbf{x}}_{1}^{% i-1}|{\mathbf{y}})}
    =dif(𝐱|𝐲)𝑑𝐱i+1df(𝐱1i1|𝐲)\displaystyle=\frac{\int_{\mathbb{R}^{d-i}}{f({\mathbf{x}}|{\mathbf{y}})}d{% \mathbf{x}}_{i+1}^{d}}{f({\mathbf{x}}_{1}^{i-1}|{\mathbf{y}})}
    =dif(𝐱i|𝐲)f(𝐱i|𝐱i,𝐲)𝑑𝐱i+1df(𝐱1i1|𝐲)\displaystyle=\frac{\int_{\mathbb{R}^{d-i}}{f({\mathbf{x}}_{-i}|{\mathbf{y}})f% ({\mathbf{x}}_{i}|{\mathbf{x}}_{-i},{\mathbf{y}})d{\mathbf{x}}_{i+1}^{d}}}{f({% \mathbf{x}}_{1}^{i-1}|{\mathbf{y}})}
    =f(𝐱i|𝐲)dif(𝐱i|𝐲)𝑑𝐱i+1df(𝐱1i1|𝐲)\displaystyle=\frac{f({\mathbf{x}}_{i}|{\mathbf{y}})\int_{\mathbb{R}^{d-i}}{f(% {\mathbf{x}}_{-i}|{\mathbf{y}})d{\mathbf{x}}_{i+1}^{d}}}{f({\mathbf{x}}_{1}^{i% -1}|{\mathbf{y}})} (3)\displaystyle(3)
    =f(𝐱i|𝐲)f(𝐱1i1|𝐲)f(𝐱1i1|𝐲)\displaystyle=\frac{f({\mathbf{x}}_{i}|{\mathbf{y}})f({\mathbf{x}}_{1}^{i-1}|{% \mathbf{y}})}{f({\mathbf{x}}_{1}^{i-1}|{\mathbf{y}})}
    =f(𝐱i|𝐲)\displaystyle=f({\mathbf{x}}_{i}|{\mathbf{y}})
  • (41)(4\Longrightarrow 1)

    f(𝐱|𝐲)\displaystyle f({\mathbf{x}}|{\mathbf{y}}) =i=1df(𝐱i|𝐱1i1,𝐲)\displaystyle=\prod_{i=1}^{d}{f({\mathbf{x}}_{i}|{\mathbf{x}}_{1}^{i-1},{% \mathbf{y}})}
    =i=1df(𝐱i|𝐲)\displaystyle=\prod_{i=1}^{d}{f({\mathbf{x}}_{i}|{\mathbf{y}})} (4)\displaystyle(4)

6.C.2 Teorema 2.49

Lema 6.1.

Seja 𝒢=(𝒱,){\mathcal{G}}=({\mathcal{V}},{\mathcal{E}}) um DAG. Se 𝒜=𝕍1𝕍2𝕍3{\mathcal{A}}={\mathbb{V}}_{1}\cup{\mathbb{V}}_{2}\cup{\mathbb{V}}_{3} é ancestral e 𝕍1𝕍2|𝕍3{\mathbb{V}}_{1}\perp{\mathbb{V}}_{2}|{\mathbb{V}}_{3}, então, para todo ff compatível com 𝒢{\mathcal{G}}, 𝕍1f𝕍2|𝕍3{\mathbb{V}}_{1}\perp\!\!\!\!\perp^{f}{\mathbb{V}}_{2}|{\mathbb{V}}_{3}.

Demonstração.

Defina 𝕍1={V𝒜:V𝕍1 ou V1V, para algum V1𝕍1}{\mathbb{V}}^{*}_{1}=\{V\in{\mathcal{A}}:V\in{\mathbb{V}}_{1}\text{ ou }V_{1}% \rightarrow V,\text{ para algum }V_{1}\in{\mathbb{V}}_{1}\} e 𝕍2=𝒜𝕍1{\mathbb{V}}^{*}_{2}={\mathcal{A}}-{\mathbb{V}}^{*}_{1}. Como 𝕍1𝕍2|𝕍3{\mathbb{V}}_{1}\perp{\mathbb{V}}_{2}|{\mathbb{V}}_{3}, decorre de Definição 2.48 que não existe V1𝕍1V_{1}\in{\mathbb{V}}_{1} e V2𝕍2V_{2}\in{\mathbb{V}}_{2} tal que V1V2V_{1}\rightarrow V_{2}. Portanto,

𝕍1𝕍1𝕍3 e 𝕍2𝕍2𝕍3\displaystyle{\mathbb{V}}^{*}_{1}\subseteq{\mathbb{V}}_{1}\cup{\mathbb{V}}_{3}% \text{ e }{\mathbb{V}}^{*}_{2}\subseteq{\mathbb{V}}_{2}\cup{\mathbb{V}}_{3} (8)

A seguir, demonstraremos que

i{1,2} e Vi𝕍i:Pa(Vi)𝕍i𝕍3\displaystyle\forall i\in\{1,2\}\text{ e }V^{*}_{i}\in{\mathbb{V}}^{*}_{i}:Pa(% V^{*}_{i})\subseteq{\mathbb{V}}_{i}\cup{\mathbb{V}}_{3} (9)

Tome V1𝕍1V^{*}_{1}\in{\mathbb{V}}^{*}_{1}. Como V1𝒜V^{*}_{1}\in{\mathcal{A}} e 𝒜{\mathcal{A}} é ancestral, decorre da Definição 2.9 que Pa(V1)𝒜Pa(V^{*}_{1})\subseteq{\mathcal{A}}. Assim, basta demonstrar que Pa(V1)𝕍2=∅︀Pa(V^{*}_{1})\cap{\mathbb{V}}_{2}=\emptyset. Se V1𝕍1V^{*}_{1}\in{\mathbb{V}}_{1}, então decorre de Definição 2.48 que não existe V2𝕍2V_{2}\in{\mathbb{V}}_{2} tal que V2V1V_{2}\rightarrow V^{*}_{1}. Caso contrário, se V1𝕍3V^{*}_{1}\in{\mathbb{V}}_{3}, então existe V1𝕍1V_{1}\in{\mathbb{V}}_{1} tal que V1V1V_{1}\rightarrow V^{*}_{1}. Decorre de Definição 2.48 que não existe V1𝕍1V_{1}\in{\mathbb{V}}_{1}, V2𝕍2V_{2}\in{\mathbb{V}}_{2} e V3𝕍3V_{3}\in{\mathbb{V}}_{3} tais que V3V_{3} é um colisor entre V1V_{1} e V2V_{2}, isto é, V1V3V2V_{1}\rightarrow V_{3}\leftarrow V_{2}. Portanto, não existe V2𝕍2V_{2}\in{\mathbb{V}}_{2} tal que V2V1V_{2}\rightarrow V^{*}_{1}. Conclua que Pa(V1)𝕍1𝕍3Pa(V^{*}_{1})\subseteq{\mathbb{V}}_{1}\cup{\mathbb{V}}_{3}.

A seguir, note que pela definição de 𝕍1{\mathbb{V}}^{*}_{1}, se V𝒜V\in{\mathcal{A}} é tal que existe V1𝕍1V_{1}\in{\mathbb{V}}_{1} com V1VV_{1}\rightarrow V, então V𝕍1V\in{\mathbb{V}}^{*}_{1}. Portanto, como 𝕍2=𝒱𝕍1{\mathbb{V}}^{*}_{2}={\mathcal{V}}-{\mathbb{V}}^{*}_{1}, para todo V2𝕍2V^{*}_{2}\in{\mathbb{V}}^{*}_{2}, não existe V1𝕍1V_{1}\in{\mathbb{V}}_{1} tal que V1V2V_{1}\rightarrow V^{*}_{2}. Isto é, Pa(V2)𝒱𝕍1Pa(V^{*}_{2})\subseteq{\mathcal{V}}-{\mathbb{V}}_{1}. Como V2𝒜V^{*}_{2}\in{\mathcal{A}} e 𝒜{\mathcal{A}} é ancestral, conclua da Definição 2.9 que Pa(V2)𝒜Pa(V^{*}_{2})\subseteq{\mathcal{A}}. Combinando as duas últimas frases, Pa(V2)𝕍2𝕍3Pa(V^{*}_{2})\subseteq{\mathbb{V}}_{2}\cup{\mathbb{V}}_{3}.

Decorre da conclusão dos dois últimos parágrafos que likning 9 está demonstrado.

f(𝕍1,𝕍2|𝕍3)\displaystyle f({\mathbb{V}}_{1},{\mathbb{V}}_{2}|{\mathbb{V}}_{3}) =f(𝕍1,𝕍2,𝕍3)f(𝕍3)\displaystyle=\frac{f({\mathbb{V}}_{1},{\mathbb{V}}_{2},{\mathbb{V}}_{3})}{f({% \mathbb{V}}_{3})}
=V𝒜f(V|Pa(V))f(𝕍3)\displaystyle=\frac{\prod_{V\in{\mathcal{A}}}f(V|Pa(V))}{f({\mathbb{V}}_{3})}
=(V1𝕍1f(V1|Pa(V1)))(V2𝕍2f(V2|Pa(V2)))f(𝕍3)\displaystyle=\frac{\left(\prod_{V^{*}_{1}\in{\mathbb{V}}^{*}_{1}}f(V^{*}_{1}|% Pa(V^{*}_{1}))\right)\left(\prod_{V^{*}_{2}\in{\mathbb{V}}^{*}_{2}}f(V^{*}_{2}% |Pa(V^{*}_{2}))\right)}{f({\mathbb{V}}_{3})} 𝕍1 e 𝕍2 particionam 𝒜\displaystyle{\mathbb{V}}^{*}_{1}\text{ e }{\mathbb{V}}^{*}_{2}\text{ % particionam }{\mathcal{A}}
=h1(𝕍1,𝕍3)h2(𝕍2,𝕍3)\displaystyle=h_{1}({\mathbb{V}}_{1},{\mathbb{V}}_{3})h_{2}({\mathbb{V}}_{2},{% \mathbb{V}}_{3}) likningene 8 e 9

Assim, decorre do Lema 2.45 que 𝕍1f𝕍2|𝕍3{\mathbb{V}}_{1}\perp\!\!\!\!\perp^{f}{\mathbb{V}}_{2}|{\mathbb{V}}_{3}. ∎

Lema 6.2.

Se ff é compatível com 𝒢{\mathcal{G}} e 𝕍1𝕍2|𝕍3{\mathbb{V}}_{1}\perp{\mathbb{V}}_{2}|{\mathbb{V}}_{3}, então 𝕍1f𝕍2|𝕍3{\mathbb{V}}_{1}\perp\!\!\!\!\perp^{f}{\mathbb{V}}_{2}|{\mathbb{V}}_{3}.

Demonstração.

Defina 𝒜=Anc(𝕍1𝕍2𝕍3){\mathcal{A}}=Anc({\mathbb{V}}_{1}\cup{\mathbb{V}}_{2}\cup{\mathbb{V}}_{3}), 𝕍1={V𝒜:V não é d-separado de 𝕍1|𝕍3}{\mathbb{V}}^{*}_{1}=\{V\in{\mathcal{A}}:V\text{ não é d-separado de }{\mathbb% {V}}_{1}|{\mathbb{V}}_{3}\}, e 𝕍2=𝒜𝕍1{\mathbb{V}}^{*}_{2}={\mathcal{A}}-{\mathbb{V}}^{*}_{1}. Por definição,

𝕍1𝕍1 e 𝕍2𝕍2\displaystyle{\mathbb{V}}_{1}\subseteq{\mathbb{V}}^{*}_{1}\text{ e }{\mathbb{V% }}_{2}\subseteq{\mathbb{V}}^{*}_{2} (10)

O primeiro é provar que 𝕍1𝕍2|𝕍3{\mathbb{V}}^{*}_{1}\perp{\mathbb{V}}^{*}_{2}|{\mathbb{V}}_{3}. Pela definição de 𝕍2{\mathbb{V}}^{*}_{2}, para todo V1𝕍1V_{1}\in{\mathbb{V}}_{1} e V2𝕍2V^{*}_{2}\in{\mathbb{V}}^{*}_{2}, V1V2|𝕍3V_{1}\perp V^{*}_{2}|{\mathbb{V}}_{3}, isto é,

𝕍1𝕍2|𝕍3\displaystyle{\mathbb{V}}_{1}\perp{\mathbb{V}}^{*}_{2}|{\mathbb{V}}_{3} (11)

Suponha por absurdo que existam V1𝕍1V^{*}_{1}\in{\mathbb{V}}^{*}_{1} e V2𝕍2V^{*}_{2}\in{\mathbb{V}}^{*}_{2} tais que V1V^{*}_{1} e V2V^{*}_{2} não são d-separados dado 𝕍3{\mathbb{V}}_{3}. Portanto, existe um caminho ativo dado 𝕍3{\mathbb{V}}_{3}, (V1,C2,,Cn1,V2)(V^{*}_{1},C_{2},\ldots,C_{n-1},V^{*}_{2}). Pela definição de 𝕍1{\mathbb{V}}^{*}_{1}, existe V1𝕍1V_{1}\in{\mathbb{V}}_{1} e um caminho ativo dado 𝕍3{\mathbb{V}}_{3}, (V1,C2,,Cm1,V1)(V_{1},C^{*}_{2},\ldots,C^{*}_{m-1},V^{*}_{1}). Assim, (V1,C2,,Cm1,V1,C2,,Cn1,V2)(V_{1},C^{*}_{2},\ldots,C^{*}_{m-1},V^{*}_{1},C_{2},\ldots,C_{n-1},V^{*}_{2}) é é um caminho ativo dado 𝕍3{\mathbb{V}}_{3} de V1V_{1} a V2V^{*}_{2}, uma contradição com likning 11. Conclua que 𝕍1𝕍2|𝕍3{\mathbb{V}}^{*}_{1}\perp{\mathbb{V}}^{*}_{2}|{\mathbb{V}}_{3}.

A seguir, provaremos que 𝕍1f𝕍2|𝕍3{\mathbb{V}}^{*}_{1}\perp\!\!\!\!\perp^{f}{\mathbb{V}}^{*}_{2}|{\mathbb{V}}_{3}. Como 𝒜=Anc(𝕍1𝕍2𝕍3){\mathcal{A}}=Anc({\mathbb{V}}_{1}\cup{\mathbb{V}}_{2}\cup{\mathbb{V}}_{3}), decorre do Lema 2.10 que 𝒜{\mathcal{A}} é ancestral. Portanto, como 𝒜=𝕍1𝕍2𝕍3{\mathcal{A}}={\mathbb{V}}^{*}_{1}\cup{\mathbb{V}}^{*}_{2}\cup{\mathbb{V}}_{3} e 𝕍1𝕍2|𝕍3{\mathbb{V}}^{*}_{1}\perp{\mathbb{V}}^{*}_{2}|{\mathbb{V}}_{3}, decorre do Lema 6.1 que 𝕍1f𝕍2|𝕍3{\mathbb{V}}^{*}_{1}\perp\!\!\!\!\perp^{f}{\mathbb{V}}^{*}_{2}|{\mathbb{V}}_{3}.

Como 𝕍1f𝕍2|𝕍3{\mathbb{V}}^{*}_{1}\perp\!\!\!\!\perp^{f}{\mathbb{V}}^{*}_{2}|{\mathbb{V}}_{3}, a conclusão do lema decorre do fato de que 𝕍1𝕍1{\mathbb{V}}_{1}\subseteq{\mathbb{V}}^{*}_{1} e 𝕍2𝕍2{\mathbb{V}}_{2}\subseteq{\mathbb{V}}^{*}_{2}. ∎

Teorema 6.3 (Spirtes2000[p.66).

] Considere que (𝒢,fβ)({\mathcal{G}},f_{\beta}) é um CM linear Gaussiano (Definição 2.25) de parâmetros σ2=1\sigma^{2}=1, β\beta e μ=0\mu=0. Para qualquer distribuição contínua sobre β\beta, tem probabilidade 0 a ocorrência de valores de β\beta tais que existam 𝐗,𝐘,𝐙{\mathbf{X}},{\mathbf{Y}},{\mathbf{Z}} com 𝐗fβ𝐘|𝐙{\mathbf{X}}\perp\!\!\!\!\perp^{f_{\beta}}{\mathbf{Y}}|{\mathbf{Z}} mas 𝐗{\mathbf{X}} e 𝐘{\mathbf{Y}} não serem d-separados dado 𝐙{\mathbf{Z}} em 𝒢{\mathcal{G}}.

Lema 6.4.

Se 𝕍1{\mathbb{V}}_{1} não é d-separado de 𝕍2{\mathbb{V}}_{2} dado 𝕍3{\mathbb{V}}_{3} segundo o DAG 𝒢=(𝒱,){\mathcal{G}}=({\mathcal{V}},{\mathcal{E}}), então existe ff compatível com 𝒢{\mathcal{G}} tal que 𝕍1{\mathbb{V}}_{1} e 𝕍2{\mathbb{V}}_{2} são condicionalmente dependentes dado 𝕍3{\mathbb{V}}_{3} segundo ff

Demonstração.

Decorre do Teorema 6.3. ∎

Prova do Teorema 2.49.

Decorre dos Lemas 6.2 e 6.4. ∎