4.1. Espaços Normados e com Produto Interno

Seja EE um espaço vetorial sobre 𝕂\mathds{K}, onde 𝕂\mathds{K} denota o corpo dos números reais ou o corpo dos números complexos.

4.1.1 Definição.

Uma semi-norma em EE é uma aplicação:

ExxE\ni x\longmapsto\|x\|\in\mathds{R}

satisfazendo as seguintes condições:

  • (a)

    x0\|x\|\geq 0, para todo xEx\in E;

  • (b)

    λx=|λ|x\|\lambda x\|=|\lambda|\|x\|, para todo λ𝕂\lambda\in\mathds{K} e todo xEx\in E;

  • (c)

    x+yx+y\|x+y\|\leq\|x\|+\|y\|, para todos x,yEx,y\in E (desigualdade triangular).

Uma norma em EE é uma semi-norma que satisfaz a condição adicional:

  • (d)

    x>0\|x\|>0, para todo xEx\in E com x0x\neq 0.

Um espaço vetorial normado sobre 𝕂\mathds{K} (ou, mais abreviadamente, um espaço normado) é um par (E,)(E,\|\cdot\|), onde EE é um espaço vetorial sobre 𝕂\mathds{K} e \|\cdot\| é uma norma em EE.

Note que fazendo λ=0\lambda=0 na condição (b) obtemos:

0=0.\|0\|=0.

Dado um espaço vetorial normado (E,)(E,\|\cdot\|), nós definimos:

d(x,y)=xy,d(x,y)=\|x-y\|, (4.1.1)

para todos x,yEx,y\in E. Temos que d:E×Ed:E\times E\to\mathds{R} é uma métrica em EE; de fato, segue das condições (a) e (d) que, para todos x,yEx,y\in E, d(x,y)0d(x,y)\geq 0 e que d(x,y)=0d(x,y)=0 se e somente x=yx=y. Usando a condição (b), obtemos:

d(x,y)=xy=(1)(yx)=yx=d(y,x),d(x,y)=\|x-y\|=\big{\|}(-1)\cdot(y-x)\big{\|}=\|y-x\|=d(y,x),

e usando a condição (c) obtemos:

d(x,z)=xz=(xy)+(yz)xy+yz=d(x,y)+d(y,z),d(x,z)=\|x-z\|=\big{\|}(x-y)+(y-z)\big{\|}\leq\|x-y\|+\|y-z\|=d(x,y)+d(y,z),

para todos x,y,zEx,y,z\in E. Dizemos que a métrica dd definida em (4.1.1) é a métrica associada à (ou determinada pela) norma \|\cdot\|. Nós sempre assumiremos que um espaço normado (E,)(E,\|\cdot\|) está munido da métrica dd associada a sua norma. Temos então que todo espaço normado é também um espaço métrico (para uma recíproca, veja o Exercício 4.3).

4.1.2 Definição.

Um espaço de Banach sobre 𝕂\mathds{K} é um espaço normado (E,)(E,\|\cdot\|) sobre 𝕂\mathds{K} tal que a métrica associada à norma \|\cdot\| é completa.

4.1.3 Exemplo.

Dado um conjunto arbitrário XX, então o conjunto 𝕂X\mathds{K}^{X} de todas as funções f:X𝕂f:X\to\mathds{K} possui uma estrutura natural de espaço vetorial sobre 𝕂\mathds{K} definida por:

(f+g)(x)=f(x)+g(x),(λf)(x)=λf(x),(f+g)(x)=f(x)+g(x),\quad(\lambda f)(x)=\lambda f(x),

para todos xXx\in X, λ𝕂\lambda\in\mathds{K}, f,g𝕂Xf,g\in\mathds{K}^{X}. O conjunto Bd(X,𝕂)\mathrm{Bd}(X,\mathds{K}) de todas as funções limitadas f:X𝕂f:X\to\mathds{K} é um subespaço de 𝕂X\mathds{K}^{X} e a aplicação sup:Bd(X,𝕂)\|\cdot\|_{\mathrm{sup}}:\mathrm{Bd}(X,\mathds{K})\to\mathds{R} definida por:

fsup=supxX|f(x)|,\|f\|_{\mathrm{sup}}=\sup_{x\in X}\big{|}f(x)\big{|},

para toda fBd(X,𝕂)f\in\mathrm{Bd}(X,\mathds{K}) é uma norma em Bd(X,𝕂)\mathrm{Bd}(X,\mathds{K}). A norma sup\|\cdot\|_{\mathrm{sup}} é chamada a norma do supremo e a métrica dsupd_{\mathrm{sup}} associada a sup\|\cdot\|_{\mathrm{sup}} é chamada a métrica do supremo. Temos que uma seqüência (fn)n1(f_{n})_{n\geq 1} em Bd(X,𝕂)\mathrm{Bd}(X,\mathds{K}) converge para uma função fBd(X,𝕂)f\in\mathrm{Bd}(X,\mathds{K}) (resp., é de Cauchy) com respeito à métrica dsupd_{\mathrm{sup}} se e somente se (fn)n1(f_{n})_{n\geq 1} converge uniformemente para ff (resp., é uniformemente de Cauchy). Se (fn)n1(f_{n})_{n\geq 1} é uma seqüência uniformemente de Cauchy então (fn)n1(f_{n})_{n\geq 1} também é pontualmente de Cauchy e portanto existe f:X𝕂f:X\to\mathds{K} tal que (fn)n1(f_{n})_{n\geq 1} converge para ff pontualmente; segue do resultado do Exercício 2.36 que (fn)n1(f_{n})_{n\geq 1} converge para ff uniformemente. Se todas as funções fnf_{n} são limitadas, é fácil ver que ff também é limitada, e portanto a métrica dsupd_{\mathrm{sup}} é completa e Bd(X,𝕂)\mathrm{Bd}(X,\mathds{K}) é um espaço de Banach. Se XX é um espaço métrico (ou, mais geralmente, um espaço topológico) então o conjunto Cb(X,𝕂)C_{\mathrm{b}}(X,\mathds{K}) de todas as funções contínuas e limitadas f:X𝕂f:X\to\mathds{K} é um subespaço de Bd(X,𝕂)\mathrm{Bd}(X,\mathds{K}); como o limite uniforme de funções contínuas é contínua, segue que Cb(X,𝕂)C_{\mathrm{b}}(X,\mathds{K}) é fechado em Bd(X,𝕂)\mathrm{Bd}(X,\mathds{K}) e portanto também completo com a métrica (induzida por) dsupd_{\mathrm{sup}}. Segue que Cb(X,𝕂)C_{\mathrm{b}}(X,\mathds{K}) também é um espaço de Banach munido da norma (induzida por) sup\|\cdot\|_{\mathrm{sup}}. Note que se XX é compacto então toda função contínua f:X𝕂f:X\to\mathds{K} é limitada, de modo que Cb(X,𝕂)C_{\mathrm{b}}(X,\mathds{K}) coincide com o espaço C(X,𝕂)C(X,\mathds{K}) de todas as funções contínuas f:X𝕂f:X\to\mathds{K}.

4.1.4 Definição.

Seja EE um espaço vetorial sobre 𝕂\mathds{K}. Um produto interno em EE é uma aplicação:

E×E(x,y)x,y𝕂E\times E\ni(x,y)\longmapsto\langle x,y\rangle\in\mathds{K}

satisfazendo as seguintes condições:

  • (a)

    λx+x,y=λx,y+x,y\langle\lambda x+x^{\prime},y\rangle=\lambda\langle x,y\rangle+\langle x^{% \prime},y\rangle e x,λy+y=λ¯x,y+x,y\langle x,\lambda y+y^{\prime}\rangle=\bar{\lambda}\langle x,y\rangle+\langle x% ,y^{\prime}\rangle, para todos x,y,x,yEx,y,x^{\prime},y^{\prime}\in E e todo λ𝕂\lambda\in\mathds{K}, onde λ¯\bar{\lambda} denota o complexo conjugado de λ\lambda;

  • (b)

    x,y=y,x¯\langle x,y\rangle=\overline{\langle y,x\rangle}, para todos x,yEx,y\in E;

  • (c)

    x,x>0\langle x,x\rangle>0, para todo xEx\in E com x0x\neq 0.

Note que a condição (b) implica que x,x\langle x,x\rangle é real, para todo xEx\in E, de modo que faz sentido falar em x,x>0\langle x,x\rangle>0, na condição (c). Quando 𝕂=\mathds{K}=\mathds{R} então λ¯=λ\bar{\lambda}=\lambda para todo λ𝕂\lambda\in\mathds{K}, de modo que as condições (a) e (b) podem ser substituídas respectivamente por:

  • (a’)

    λx+x,y=λx,y+x,y\langle\lambda x+x^{\prime},y\rangle=\lambda\langle x,y\rangle+\langle x^{% \prime},y\rangle e x,λy+y=λx,y+x,y\langle x,\lambda y+y^{\prime}\rangle=\lambda\langle x,y\rangle+\langle x,y^{% \prime}\rangle, para todos x,y,x,yEx,y,x^{\prime},y^{\prime}\in E e todo λ𝕂\lambda\in\mathds{K};

  • (b’)

    x,y=y,x\langle x,y\rangle=\langle y,x\rangle, para todos x,yEx,y\in E.

Fazendo λ=1\lambda=1 na condição (a) obtemos:

x+x,y=x,y+x,y,x,y+y=x,y+x,y,\langle x+x^{\prime},y\rangle=\langle x,y\rangle+\langle x^{\prime},y\rangle,% \quad\langle x,y+y^{\prime}\rangle=\langle x,y\rangle+\langle x,y^{\prime}\rangle,

para todos x,y,x,yEx,y,x^{\prime},y^{\prime}\in E; daí:

0,y=0+0,y=0,y+0,y,x,0=x,0+0=x,0+x,0\langle 0,y\rangle=\langle 0+0,y\rangle=\langle 0,y\rangle+\langle 0,y\rangle,% \quad\langle x,0\rangle=\langle x,0+0\rangle=\langle x,0\rangle+\langle x,0\rangle

e portanto:

x,0=0,0,y=0,\langle x,0\rangle=0,\quad\langle 0,y\rangle=0,

para todos x,yEx,y\in E. Fazendo x=0x^{\prime}=0, y=0y^{\prime}=0 na condição (a) obtemos então:

λx,y=λx,y,x,λy=λ¯x,y,\langle\lambda x,y\rangle=\lambda\langle x,y\rangle,\quad\langle x,\lambda y% \rangle=\bar{\lambda}\langle x,y\rangle,

para todos x,yEx,y\in E e todo λ𝕂\lambda\in\mathds{K}.

O primeiro resultado não trivial sobre produtos internos que provaremos é o seguinte:

4.1.5 Lema (desigualdade de Cauchy–Schwarz).

Seja EE um espaço vetorial sobre 𝕂\mathds{K} e ,\langle\cdot,\cdot\rangle um produto interno em EE. Então:

|x,y|x,x12y,y12,\big{|}\langle x,y\rangle\big{|}\leq\langle x,x\rangle^{\frac{1}{2}}\langle y,% y\rangle^{\frac{1}{2}}, (4.1.2)

para todos x,yEx,y\in E; a igualdade em (4.1.2) vale se e somente se xx e yy são linearmente dependentes.

Demonstração.

Se xx e yy são linearmente dependentes então ou y=λxy=\lambda x ou x=λyx=\lambda y, para algum λ𝕂\lambda\in\mathds{K}; daí é fácil ver que vale a igualdade em (4.1.2). Suponhamos então que xx e yy são linearmente independentes e provemos que vale a desigualdade estrita em (4.1.2). Provemos primeiramente que:

|x,y|<x,x12y,y12,\big{|}\Re\langle x,y\rangle\big{|}<\langle x,x\rangle^{\frac{1}{2}}\langle y,% y\rangle^{\frac{1}{2}}, (4.1.3)

onde λ\Re\lambda denota a parte real de um número complexo λ\lambda. Considere a função p:p:\mathds{R}\to\mathds{R} definida por:

p(t)=x+ty,x+ty,p(t)=\langle x+ty,x+ty\rangle,

para todo tt\in\mathds{R}. Temos:

p(t)=x,x+tx,y+ty,x+t2y,y=x,x+2tx,y+t2y,y,p(t)=\langle x,x\rangle+t\langle x,y\rangle+t\langle y,x\rangle+t^{2}\langle y% ,y\rangle=\langle x,x\rangle+2t\Re\langle x,y\rangle+t^{2}\langle y,y\rangle,

para todo tt\in\mathds{R}. Como xx e yy são linearmente independentes, temos que x+tyx+ty é não nulo, para todo tt\in\mathds{R} e portanto p(t)>0p(t)>0, para todo tt\in\mathds{R}. Mas pp é uma função polinomial do segundo grau e portanto seu discriminante:

Δ=4(x,y)24x,xy,y\Delta=4\big{(}\Re\langle x,y\rangle\big{)}^{2}-4\langle x,x\rangle\langle y,y\rangle

deve ser negativo. Daí (4.1.3) segue diretamente. Seja agora λ𝕂\lambda\in\mathds{K} com |λ|=1|\lambda|=1 tal que λx,y\lambda\langle x,y\rangle é real11 1 Dado um número complexo zz, evidentemente existe um número complexo λ\lambda de módulo 11 tal que λz\lambda z é real; basta tomar λ=z¯|z|\lambda=\frac{\bar{z}}{|z|}, se z0z\neq 0 e λ=1\lambda=1 se z=0z=0.; trocando xx por λx\lambda x em (4.1.3) obtemos:

|λx,y|<λx,λx12y,y12,\big{|}\Re\langle\lambda x,y\rangle\big{|}<\langle\lambda x,\lambda x\rangle^{% \frac{1}{2}}\langle y,y\rangle^{\frac{1}{2}},

donde segue a desigualdade:

|x,y|<x,x12y,y12.\big{|}\langle x,y\rangle\big{|}<\langle x,x\rangle^{\frac{1}{2}}\langle y,y% \rangle^{\frac{1}{2}}.\qed
4.1.6 Corolário.

Seja EE um espaço vetorial sobre 𝕂\mathds{K} e ,\langle\cdot,\cdot\rangle um produto interno em EE. Então a aplicação :E\|\cdot\|:E\to\mathds{R} definida por:

x=x,x12,\|x\|=\langle x,x\rangle^{\frac{1}{2}}, (4.1.4)

para todo xEx\in E, é uma norma em EE.

Demonstração.

Note que, como x,x0\langle x,x\rangle\geq 0 para todo xEx\in E, a aplicação \|\cdot\| está bem definida e x0\|x\|\geq 0, para todo xEx\in E; além do mais, x>0\|x\|>0, para xEx\in E não nulo. Dados λ𝕂\lambda\in\mathds{K}, xEx\in E, temos:

λx=λx,λx12=(λλ¯x,x)12=(|λ|2x,x)12=|λ|x.\|\lambda x\|=\langle\lambda x,\lambda x\rangle^{\frac{1}{2}}=\big{(}\lambda% \bar{\lambda}\langle x,x\rangle\big{)}^{\frac{1}{2}}=\big{(}|\lambda|^{2}% \langle x,x\rangle\big{)}^{\frac{1}{2}}=|\lambda|\|x\|.

Finalmente, a desigualdade triangular é obtida da desigualdade de Cauchy–Schwarz, através dos cálculos abaixo:

x+y2=x+y,x+y=x,x+x,y+y,x+y,y=x2+y2+2x,yx2+y2+2|x,y|x2+y2+2xy=(x+y)2,\|x+y\|^{2}=\langle x+y,x+y\rangle=\langle x,x\rangle+\langle x,y\rangle+% \langle y,x\rangle+\langle y,y\rangle\\ =\|x\|^{2}+\|y\|^{2}+2\Re\langle x,y\rangle\leq\|x\|^{2}+\|y\|^{2}+2\big{|}% \langle x,y\rangle\big{|}\\ \leq\|x\|^{2}+\|y\|^{2}+2\|x\|\|y\|=\big{(}\|x\|+\|y\|\big{)}^{2},

onde x,yEx,y\in E. ∎

A norma definida em (4.1.4) é chamada a norma associada ao (ou determinada pelo) produto interno ,\langle\cdot,\cdot\rangle.

4.1.7 Definição.

Seja EE um espaço vetorial sobre 𝕂\mathds{K} e ,\langle\cdot,\cdot\rangle um produto interno em EE. O par (E,,)(E,\langle\cdot,\cdot\rangle) é chamado um espaço pré-Hilbertiano sobre 𝕂\mathds{K}. Se a métrica associada à norma associada ao produto interno ,\langle\cdot,\cdot\rangle for completa, dizemos que (E,,)(E,\langle\cdot,\cdot\rangle) é um espaço de Hilbert sobre 𝕂\mathds{K}.

Nós sempre assumiremos que um espaço pré-Hilbertiano (E,,)(E,\langle\cdot,\cdot\rangle) está munido da norma (4.1.4) associada ao seu produto interno. Vemos então que todo espaço pré-Hilbertiano é um espaço normado e todo espaço de Hilbert é um espaço de Banach. Nem toda norma está associada a um produto interno, como segue facilmente do seguinte:

4.1.8 Lema (identidade do paralelogramo).

Se EE é um espaço vetorial sobre 𝕂\mathds{K}, ,\langle\cdot,\cdot\rangle é um produto interno em EE e \|\cdot\| é a norma associada a ,\langle\cdot,\cdot\rangle então:

x+y2+xy2=2(x2+y2),\|x+y\|^{2}+\|x-y\|^{2}=2\big{(}\|x\|^{2}+\|y\|^{2}\big{)}, (4.1.5)

para todos x,yEx,y\in E.

Demonstração.

Temos:

x+y2=x+y,x+y=x,x+x,y+y,x+y,y,\|x+y\|^{2}=\langle x+y,x+y\rangle=\langle x,x\rangle+\langle x,y\rangle+% \langle y,x\rangle+\langle y,y\rangle,

donde:

x+y2=x2+y2+2x,y;\|x+y\|^{2}=\|x\|^{2}+\|y\|^{2}+2\Re\langle x,y\rangle; (4.1.6)

similarmente:

xy2=x2+y22x,y.\|x-y\|^{2}=\|x\|^{2}+\|y\|^{2}-2\Re\langle x,y\rangle. (4.1.7)

A conclusão é obtida somando (4.1.6) e (4.1.7). ∎

No Exercício 4.10 pedimos ao leitor para mostrar que a norma do supremo não satisfaz a identidade do paralelogramo (exceto pelo caso trivial, em que o domínio tem um único ponto). Vemos então que nem toda norma está associada a um produto interno. No Exercício 4.14 apresentamos um leitor um roteiro para demonstrar que toda norma que satisfaz a identidade do paralelogramo está associada a um único produto interno.

Se FF é um subconjunto fechado não vazio de n\mathds{R}^{n} e KK é um subconjunto compacto não vazio de n\mathds{R}^{n} então existem pontos xFx\in F, yKy\in K tais que d(x,y)=d(F,K)d(x,y)=d(F,K), ou seja, a distância mínima entre FF e KK é explicitamente realizada22 2 Esse não é o caso se supusermos apenas que FF e KK são fechados. Por exemplo, se F={(x,1x):x>0}F=\big{\{}\big{(}x,\frac{1}{x}\big{)}:x>0\big{\}} e K=×{0}K=\mathds{R}\times\{0\} então FF e KK são fechados e disjuntos em 2\mathds{R}^{2}, mas d(K,F)=0d(K,F)=0.. Como é ilustrado no exemplo a seguir, se (M,d)(M,d) é um espaço métrico arbitrário, F∅︀F\neq\emptyset é fechado em MM e K∅︀K\neq\emptyset é um subconjunto compacto de MM, não é verdade em geral que a distância mínima entre FF e KK é realizada, mesmo sob a hipótese que o espaço métrico MM seja completo (é verdade, no entanto, que se KK e FF são disjuntos então d(K,F)>0d(K,F)>0).

4.1.9 Exemplo.

Seja C([0,1],)C\big{(}[0,1],\mathds{R}\big{)} o espaço de Banach das funções contínuas f:[0,1]f:[0,1]\to\mathds{R} munido da norma do supremo (veja Exemplo 4.1.3) e seja EE o subespaço de C([0,1],)C\big{(}[0,1],\mathds{R}\big{)} constituído pelas funções contínuas f:[0,1]f:[0,1]\to\mathds{R} tais que f(0)=f(1)=0f(0)=f(1)=0. Claramente EE é um subespaço fechado de C([0,1],)C\big{(}[0,1],\mathds{R}\big{)} e portanto é também um espaço de Banach. Seja HH o subconjunto de EE definido por:

H={fE:01fd𝔪=1}.H=\big{\{}f\in E:{\textstyle\int_{0}^{1}f\,\mathrm{d}\mathfrak{m}=1}\big{\}}.

Se uma seqüência (fn)n1(f_{n})_{n\geq 1} em C([0,1],)C\big{(}[0,1],\mathds{R}\big{)} converge uniformemente para ff então (veja Exercício 2.26):

limn01fnd𝔪=01fd𝔪,\lim_{n\to\infty}\int_{0}^{1}f_{n}\,\mathrm{d}\mathfrak{m}=\int_{0}^{1}f\,% \mathrm{d}\mathfrak{m},

donde segue que HH é fechado em EE. Vamos mostrar que a distância

dsup(0,H)=inffHfsupd_{\mathrm{sup}}(0,H)=\inf_{f\in H}\|f\|_{\mathrm{sup}}

da função nula até HH é igual a 11, mas que não existe nenhuma função fHf\in H com dsup(0,f)=fsup=1d_{\mathrm{sup}}(0,f)=\|f\|_{\mathrm{sup}}=1. Em primeiro lugar, mostremos que não existe fHf\in H com fsup1\|f\|_{\mathrm{sup}}\leq 1. De fato, suponha por absurdo que fHf\in H e fsup1\|f\|_{\mathrm{sup}}\leq 1. Daí 1f01-f\geq 0 e 01(1f)d𝔪=0\int_{0}^{1}(1-f)\,\mathrm{d}\mathfrak{m}=0, donde f=1f=1 quase sempre; mas f(0)=f(1)=0f(0)=f(1)=0 e a continuidade de ff implicam que ff é menor que 11 numa vizinhança de {0,1}\{0,1\}, o que nos dá uma contradição. Vamos agora mostrar que para todo ε>0\varepsilon>0 existe fHf\in H com fsup1+ε\|f\|_{\mathrm{sup}}\leq 1+\varepsilon. Obviamente podemos supor sem perda de generalidade que ε1\varepsilon\leq 1; seja η=ε1+ε]0,12]\eta=\frac{\varepsilon}{1+\varepsilon}\in\left]0,\frac{1}{2}\right] e considere a função f:[0,1]f:[0,1]\to\mathds{R} definida por:

f(x)={1+εηx,se 0xη,1+ε,se ηx1η,1+εη(1x),se 1ηx1.f(x)=\begin{cases}\frac{1+\varepsilon}{\eta}\,x,&\text{se $0\leq x\leq\eta$},% \\ 1+\varepsilon,&\text{se $\eta\leq x\leq 1-\eta$},\\ \frac{1+\varepsilon}{\eta}\,(1-x),&\text{se $1-\eta\leq x\leq 1$}.\end{cases}

É fácil ver que fHf\in H e que fsup=1+ε\|f\|_{\mathrm{sup}}=1+\varepsilon. Logo dsup(0,H)=1d_{\mathrm{sup}}(0,H)=1, mas não existe fHf\in H com fsup=1\|f\|_{\mathrm{sup}}=1.

4.1.10 Proposição.

Seja (E,,)(E,\langle\cdot,\cdot\rangle) um espaço pré-Hilbertiano sobre 𝕂\mathds{K} e seja CEC\subset E um subconjunto completo, não vazio, tal que 12(p+q)C\frac{1}{2}(p+q)\in C, para todos p,qCp,q\in C. Então para todo xEx\in E existe um único ponto pCp\in C tal que d(x,p)=d(x,C)d(x,p)=d(x,C).

Demonstração.

Sejam xEx\in E, p,qCp,q\in C. Aplicando a identidade do paralelogramo (4.1.5) aos vetores xpx-p, xqx-q, obtemos:

2xpq2+pq2=2(xp2+xq2),\|2x-p-q\|^{2}+\|p-q\|^{2}=2\big{(}\|x-p\|^{2}+\|x-q\|^{2}\big{)},

e portanto:

pq2=2(xp2+xq22x12(p+q)2).\|p-q\|^{2}=2\big{(}\|x-p\|^{2}+\|x-q\|^{2}-2\big{\|}x-\tfrac{1}{2}(p+q)\big{% \|}^{2}\big{)}. (4.1.8)

Seja c=d(x,C)0c=d(x,C)\geq 0. Provemos primeiramente a unicidade de pp. Se p,qCp,q\in C são tais que d(x,p)=d(x,q)=cd(x,p)=d(x,q)=c então d(x,12(p+q))cd\big{(}x,\frac{1}{2}(p+q)\big{)}\geq c, de modo que (4.1.8) nos dá:

pq22(c2+c22c2)=0,\|p-q\|^{2}\leq 2(c^{2}+c^{2}-2c^{2})=0,

e daí p=qp=q. Para provar a existência de pp, seja (pn)n1(p_{n})_{n\geq 1} uma seqüência em CC tal que d(x,pn)<c+1nd(x,p_{n})<c+\frac{1}{n}, para todo n1n\geq 1. Usando (4.1.8) com p=pnp=p_{n}, q=pmq=p_{m} e observando que d(x,12(pn+pm))cd\big{(}x,\frac{1}{2}(p_{n}+p_{m})\big{)}\geq c, obtemos:

pnpm2<2[(c+1n)2+(c+1m)22c2]=2(2cn+2cm+1n2+1m2),\|p_{n}-p_{m}\|^{2}<2\big{[}\big{(}c+\tfrac{1}{n}\big{)}^{2}+\big{(}c+\tfrac{1% }{m}\big{)}^{2}-2c^{2}\big{]}=2\big{(}\tfrac{2c}{n}+\tfrac{2c}{m}+\tfrac{1}{n^% {2}}+\tfrac{1}{m^{2}}\big{)},

donde segue que (pn)n1(p_{n})_{n\geq 1} é uma seqüência de Cauchy. Já que CC é completo, existe pCp\in C com pnpp_{n}\to p e daí fazendo nn\to\infty em d(x,pn)<c+1nd(x,p_{n})<c+\frac{1}{n} obtemos d(x,p)cd(x,p)\leq c. Como obviamente d(x,p)cd(x,p)\geq c, a conclusão segue. ∎

4.1.11 Definição.

Seja (E,,)(E,\langle\cdot,\cdot\rangle) um espaço pré-Hilbertiano sobre 𝕂\mathds{K}. Dois vetores x,yEx,y\in E são ditos ortogonais se x,y=0\langle x,y\rangle=0. Seja SS um subconjunto de EE. O complemento ortogonal de SS, denotado por SS^{\perp}, é conjunto dos vetores xEx\in E que são ortogonais a todos os vetores de SS, isto é:

S={xE:x,y=0, para todo yS}.S^{\perp}=\big{\{}x\in E:\text{$\langle x,y\rangle=0$, para todo $y\in S$}\big% {\}}.

É fácil ver que o complemento ortogonal de um subconjunto SS de EE coincide com o complemento ortogonal do subespaço vetorial de EE gerado por SS, de modo que a noção de complemento ortogonal é particularmente interessante apenas para subespaços vetoriais. É fácil ver também que o complemento ortogonal de um subconjunto arbitrário de EE é sempre um subespaço de EE.

4.1.12 Lema.

Sejam (E,,)(E,\langle\cdot,\cdot\rangle) um espaço pré-Hilbertiano sobre 𝕂\mathds{K} e SS um subespaço vetorial de EE. Dados xEx\in E, pSp\in S, então d(x,p)=d(x,S)d(x,p)=d(x,S) se e somente se xpSx-p\in S^{\perp}.

Demonstração.

Sejam xEx\in E, pSp\in S e suponha que xpSx-p\in S^{\perp}. Dado qSq\in S então pqSp-q\in S e portanto os vetores xpx-p e pqp-q são ortogonais; pelo Teorema de Pitágoras (veja Exercício 4.15):

xq2=(xp)+(pq)2=xp2+pq2xp2,\|x-q\|^{2}=\big{\|}(x-p)+(p-q)\big{\|}^{2}=\|x-p\|^{2}+\|p-q\|^{2}\geq\|x-p\|% ^{2},

donde d(x,p)d(x,q)d(x,p)\leq d(x,q), para todo qSq\in S. Isso mostra que d(x,p)=d(x,S)d(x,p)=d(x,S). Reciprocamente, suponha que d(x,p)=d(x,S)d(x,p)=d(x,S). Dado vSv\in S, considere a função ϕ:\phi:\mathds{R}\to\mathds{R} definida por:

ϕ(t)=d(x,p+tv)2=(xp)tv2,\phi(t)=d(x,p+tv)^{2}=\|(x-p)-tv\|^{2},

para todo tt\in\mathds{R}. Temos:

ϕ(t)=xp22txp,v+t2v2,\phi(t)=\|x-p\|^{2}-2t\Re\langle x-p,v\rangle+t^{2}\|v\|^{2},

para todo tt\in\mathds{R}. Como d(x,p)=d(x,S)d(x,p)=d(x,S), a função ϕ\phi possui um mínimo global em t=0t=0 e portanto:

ϕ(0)=2xp,v=0.\phi^{\prime}(0)=-2\Re\langle x-p,v\rangle=0.

Concluímos que:

xp,v=0,\Re\langle x-p,v\rangle=0, (4.1.9)

para todo vSv\in S. Se 𝕂=\mathds{K}=\mathds{R}, a demonstração já está completa. Se 𝕂=\mathds{K}=\mathds{C}, podemos trocar vv por iviv em (4.1.9), o que nos dá:

xp,iv=(ixp,v)=xp,v=0,\Re\langle x-p,iv\rangle=-\Re\big{(}i\langle x-p,v\rangle\big{)}=\Im\langle x-% p,v\rangle=0,

onde λ\Im\lambda denota a parte imaginária de um número complexo λ\lambda. Daí:

xp,v=0\langle x-p,v\rangle=0

e a demonstração está completa. ∎

4.1.13 Definição.

Sejam (E,,)(E,\langle\cdot,\cdot\rangle) um espaço pré-Hilbertiano sobre 𝕂\mathds{K} e SS um subespaço vetorial de EE. Dado xEx\in E então um ponto pSp\in S com xpSx-p\in S^{\perp} é dito uma projeção ortogonal de xx em SS.

Temos que a projeção ortogonal de xx em SS é única quando existe; de fato, se p,qSp,q\in S e xp,xqSx-p,x-q\in S^{\perp} então pq=(xq)(xp)Sp-q=(x-q)-(x-p)\in S^{\perp} e pqSp-q\in S, de modo que pq,pq=0\langle p-q,p-q\rangle=0 e pq=0p-q=0.

4.1.14 Corolário.

Sejam (E,,)(E,\langle\cdot,\cdot\rangle) um espaço pré-Hilbertiano sobre 𝕂\mathds{K} e SS um subespaço vetorial de EE. Suponha que SS é completo (esse é o caso, por exemplo, se (E,,)(E,\langle\cdot,\cdot\rangle) é um espaço de Hilbert e SS é fechado em EE). Então todo xEx\in E admite uma (única) projeção ortogonal pSp\in S.

Demonstração.

Segue da Proposição 4.1.10 que existe pSp\in S com d(x,p)=d(x,S)d(x,p)=d(x,S). O Lema 4.1.12 nos diz então que xpSx-p\in S^{\perp}. ∎

4.1.15 Corolário.

Sejam (E,,)(E,\langle\cdot,\cdot\rangle) um espaço pré-Hilbertiano sobre 𝕂\mathds{K} e SS um subespaço vetorial de EE. Suponha que SS é completo (esse é o caso, por exemplo, se (E,,)(E,\langle\cdot,\cdot\rangle) é um espaço de Hilbert e SS é fechado em EE). Então E=SSE=S\oplus S^{\perp}.

Demonstração.

Se vSSv\in S\cap S^{\perp} então v,v=0\langle v,v\rangle=0, de modo que v=0v=0. O Corolário 4.1.14 implica que todo elemento de EE é soma de um elemento de SS com um elemento de SS^{\perp}, i.e., E=S+SE=S+S^{\perp}. A conclusão segue. ∎