9 Variáveis Instrumentais

Há situações em que não nos sentimentos confortáveis com a suposição de que observamos todos os confundidores ou todos os mediadores de XX a YY. Nestes casos, não é possível justificar os métodos baseados nos critérios backdoor e frontdoor vistos na capítulo 3. Variáveis instrumentais são um modo de evitar esse tipo de suposição.

Intuitivamente, uma variável instrumental, II, tem todo o seu efeito causal sobre YY mediado por XX. Em outra palavras, a única forma em que II tem efeito sobre YY é na medida em que II tem efeito sobre XX e, por sua vez, XX tem efeito sobre YY. Por exemplo, Angrist1990 estuda como participar da guerra do Vietnam, XX, tem efeito sobre a renda de um indivíduo, YY. Para tal, o estudo considera os sorteios que foram realizados para determinar quem era recrutado para a guerra. O único efeito que o sorteio tem sobre a renda de um indivíduo é indireto, apenas na medida em que afeta a probabilidade de este indivíduo ir para a guerra.

Com base neste tipo de variável, sob certas circunstâncias é possível estimar o efeito causal de XX em YY. A ideia básica é a de que, fazendo intervenções em II, vemos mudanças tanto em XX quanto em YY. Como as mudanças em YY devem-se apenas às mudanças que ocorreram em XX, pode ser possível estimar o efeito causal de XX em YY.

Dada esta intuição, podemos definir formalmente uma variável instrumental. Para tal, iremos seguir de perto a abordagem em Angrist1996.

Definição 4.22.

Dizemos que II é um instrumento para medir o efeito causal de XX em YY se

  1. 1.

    II é ignorável para medir o efeito em YY.

  2. 2.

    YI=i,X=xYX=xY_{I=i,X=x}\equiv Y_{X=x}, para todo ff compatível com 𝒢{\mathcal{G}}.

  3. 3.

    Cov[I,X]0Cov[I,X]\neq 0.

Apesar de as condições na Definição 4.22 terem sido utilizadas originalmente por Angrist1996, é possível reinterpretá-las utilizando o grafo causal. Já vimos no Lema 4.13 que a primeira condição é equivalente a dizer que ∅︀\emptyset satisfaz o critério backdoor para medir o efeito causal de II em YY. Isto é, II e YY não tem ascendentes em comum no grafo causal. Além disso, a segunda condição é equivalente a afirmar que no grafo causal todo caminho direcionado de II a YY passa por XX. Isto é, XX é o mediador do efeito causal de II em YY. Este resultado é apresentado no Lema 4.23.

Lema 4.23.

YI=i,X=xYX=xY_{I=i,X=x}\equiv Y_{X=x}, para todo ff compatível com 𝒢{\mathcal{G}} se e somente se todo caminho direcionado de II a YY, CC, é tal que existe jj com Cj=XC_{j}=X.

Sob algumas circunstâncias, a existência de um instrumento é suficiente para que seja possível identificar o efeito causal. Uma suposição usual é de que estamos analisando um CM linear Gaussiano (Definição 2.25).

Teorema 4.24.

Se (𝒢,f)({\mathcal{G}},f) é um CM linear Gaussiano e II é um instrumento para medir o efeito causal de XX em YY, então

ACE\displaystyle{ACE} =Cov[I,Y]Cov[I,X]\displaystyle=\frac{Cov[I,Y]}{Cov[I,X]}

Caso o modelo causal não seja linear Gaussiano, então mais suposições são necessárias para identificar o efeito causal com base em um instrumento, Uma suposição usual é a de monotonicidade do instrumento. Segundo esta, ao aumentar o valor do instrumento por uma intervenção, o valor de XX necessariamente irá aumentar

Definição 4.25.

II é um instrumento monotônico para medir o efeito causal de XX em YY se, para todo i1>i0i_{1}>i_{0},

(XI=i1>XI=i0)=1.\displaystyle{\mathbb{P}}(X_{I=i_{1}}>X_{I=i_{0}})=1.

O Instrumento monotônico foi originalmente contextualizado em uma aplicação a alistados na Guerra do Vietnam Angrist1990. Pode-se imaginar que a população é dividida em 44 grupos. Pessoas que sempre iriam à guerra (always-taker), que nunca iriam à guerra (never-taker), que iriam à guerra somente se alistados (compliers), e que iriam à guerra somente se não alistados (defiers). Neste caso, o alistamento ser um instrumento monotônico corresponde a afirmar que não existem pessoas no último grupo.

Quando o instrumento é monotônico e XX e II são binários, é possível identificar o efeito causal de XX em YY em uma sub-população. Especificamente, é possível identificar o efeito de XX em YY na sub-população em que o resultado potencial de XX é diferente para cada intervenção em II. No exemplo da Guerra do Vietnam, esta é a sub-população dos compliers, isto é, indivíduos que iriam à guerra somente se alistados. A definição de Local Average Treatment Effect (LATE) é formalizada abaixo:

Definição 4.26.

Se X,I{0,1}X,I\in\{0,1\}, então

LATE\displaystyle{LATE} =𝔼[YX=1YX=0|XI=1XI=0=1].\displaystyle={\mathbb{E}}[Y_{X=1}-Y_{X=0}|X_{I=1}-X_{I=0}=1].

O Teorema 4.27 mostra como identificar o LATE por meio de um instrumento monotônico.

Teorema 4.27.

Se I{0,1}I\in\ \{0,1\} é um instrumento monotônico para o efeito causal de X{0,1}X\in\{0,1\} em YY, então

LATE\displaystyle{LATE} =𝔼[Y|I=1]𝔼[Y|I=0]𝔼[X|I=1]𝔼[X|I=0].\displaystyle=\frac{{\mathbb{E}}[Y|I=1]-{\mathbb{E}}[Y|I=0]}{{\mathbb{E}}[X|I=% 1]-{\mathbb{E}}[X|I=0]}.