4.5. Apêndice à Seção 4.4: funções convexas

4.5.1 Definição.

Seja II\subset\mathds{R} um intervalo. Uma função f:If:I\to\mathds{R} é dita convexa quando para todos x,yIx,y\in I e todo t[0,1]t\in[0,1] vale a desigualdade:

f((1t)x+ty)(1t)f(x)+tf(y).f\big{(}(1-t)x+ty\big{)}\leq(1-t)f(x)+tf(y). (4.5.1)

Dizemos que ff é estritamente convexa quando para todos x,yIx,y\in I com xyx\neq y e todo t]0,1[t\in\left]0,1\right[ vale a desigualdade estrita:

f((1t)x+ty)<(1t)f(x)+tf(y).f\big{(}(1-t)x+ty\big{)}<(1-t)f(x)+tf(y). (4.5.2)

Claramente a igualdade vale em (4.5.1) quando x=yx=y ou t{0,1}t\in\{0,1\}; além do mais, as desigualdades (4.5.1) e (4.5.2) não se alteram quando trocamos xx por yy e tt por 1t1-t. Vemos então que ff é convexa (resp., estritamente convexa) se e somente se a desigualdade (4.5.1) (resp., a desigualdade estrita (4.5.2)) vale para todos x,yIx,y\in I com x<yx<y e para todo t]0,1[t\in\left]0,1\right[. Evidentemente toda função estritamente convexa é convexa.

Geometricamente, a desigualdade (4.5.1) diz que o trecho do gráfico de ff entre os pontos (x,f(x))\big{(}x,f(x)\big{)} e (y,f(y))\big{(}y,f(y)\big{)} está abaixo da correspondente reta secante. Vamos explorar algumas conseqüências da definição de convexidade. Dados x,yIx,y\in I com xyx\neq y, vamos denotar por 𝔠(f;x,y)\mathfrak{c}(f;x,y) o coeficiente angular da reta que passa pelos pontos (x,f(x))\big{(}x,f(x)\big{)} e (y,f(y))\big{(}y,f(y)\big{)}; mais explicitamente:

𝔠(f;x,y)=f(y)f(x)yx=𝔠(f;y,x).\mathfrak{c}(f;x,y)=\frac{f(y)-f(x)}{y-x}=\mathfrak{c}(f;y,x).

Se x,yx,y\in\mathds{R} e x<yx<y, temos uma bijeção estritamente crescente:

[0,1]tw=(1t)x+ty=x+t(yx)[x,y],[0,1]\ni t\longmapsto w=(1-t)x+ty=x+t(y-x)\in[x,y], (4.5.3)

cuja inversa é dada por:

[x,y]wt=wxyx[0,1].[x,y]\ni w\longmapsto t=\frac{w-x}{y-x}\in[0,1].

Se x,yIx,y\in I, x<yx<y e t[0,1]t\in[0,1], w[x,y]w\in[x,y] estão relacionados por (4.5.3) então:

f((1t)x+ty)(1t)f(x)+tf(y)f(w)ywyxf(x)+wxyxf(y).f\big{(}(1-t)x+ty\big{)}\leq(1-t)f(x)+tf(y)\Longleftrightarrow f(w)\leq\frac{y% -w}{y-x}f(x)+\frac{w-x}{y-x}f(y).

Note também que:

ywyxf(x)+wxyxf(y)=f(x)+𝔠(f;x,y)(wx)=f(y)+𝔠(f;x,y)(wy),\frac{y-w}{y-x}f(x)+\frac{w-x}{y-x}f(y)=f(x)+\mathfrak{c}(f;x,y)(w-x)\\ =f(y)+\mathfrak{c}(f;x,y)(w-y), (4.5.4)

para todo ww\in\mathds{R}. Vemos então que:

f((1t)x+ty)(1t)f(x)+tf(y)\displaystyle f\big{(}(1-t)x+ty\big{)}\leq(1-t)f(x)+tf(y) 𝔠(f;x,w)𝔠(f;x,y)\displaystyle\Longleftrightarrow\mathfrak{c}(f;x,w)\leq\mathfrak{c}(f;x,y) (4.5.5)
𝔠(f;x,y)𝔠(f;w,y),\displaystyle\Longleftrightarrow\mathfrak{c}(f;x,y)\leq\mathfrak{c}(f;w,y),

e:

f((1t)x+ty)=(1t)f(x)+tf(y)\displaystyle f\big{(}(1-t)x+ty\big{)}=(1-t)f(x)+tf(y) 𝔠(f;x,w)=𝔠(f;x,y)\displaystyle\Longleftrightarrow\mathfrak{c}(f;x,w)=\mathfrak{c}(f;x,y) (4.5.6)
𝔠(f;x,y)=𝔠(f;w,y),\displaystyle\Longleftrightarrow\mathfrak{c}(f;x,y)=\mathfrak{c}(f;w,y),

onde x,yIx,y\in I, x<yx<y, e t]0,1[t\in\left]0,1\right[, w]x,y[w\in\left]x,y\right[ estão relacionados por (4.5.3). Observamos também que se x,y,wIx,y,w\in I, x<w<yx<w<y então existe θ]0,1[\theta\in\left]0,1\right[ tal que:

𝔠(f;x,y)=(1θ)𝔠(f;x,w)+θ𝔠(f;w,y);\mathfrak{c}(f;x,y)=(1-\theta)\mathfrak{c}(f;x,w)+\theta\mathfrak{c}(f;w,y); (4.5.7)

de fato, basta tomar θ=ywyx\theta=\frac{y-w}{y-x}. Segue de (4.5.7) que 𝔠(f;x,y)\mathfrak{c}(f;x,y) pertence ao intervalo fechado de extremidades 𝔠(f;x,w)\mathfrak{c}(f;x,w) e 𝔠(f;w,y)\mathfrak{c}(f;w,y); levando em conta (4.5.5) e (4.5.6) vemos então também que:

𝔠(f;x,w)𝔠(f;x,y)\displaystyle\mathfrak{c}(f;x,w)\leq\mathfrak{c}(f;x,y) 𝔠(f;x,y)𝔠(f;w,y)\displaystyle\Longleftrightarrow\mathfrak{c}(f;x,y)\leq\mathfrak{c}(f;w,y) (4.5.8)
𝔠(f;x,w)𝔠(f;w,y),\displaystyle\Longleftrightarrow\mathfrak{c}(f;x,w)\leq\mathfrak{c}(f;w,y),

e:

𝔠(f;x,w)=𝔠(f;x,y)\displaystyle\mathfrak{c}(f;x,w)=\mathfrak{c}(f;x,y) 𝔠(f;x,y)=𝔠(f;w,y)\displaystyle\Longleftrightarrow\mathfrak{c}(f;x,y)=\mathfrak{c}(f;w,y) (4.5.9)
𝔠(f;x,w)=𝔠(f;w,y).\displaystyle\Longleftrightarrow\mathfrak{c}(f;x,w)=\mathfrak{c}(f;w,y).

Temos então o seguinte:

4.5.2 Lema.

Seja f:If:I\to\mathds{R} uma função definida num intervalo II\subset\mathds{R}. As seguintes condições são equivalentes:

  • ff é convexa;

  • 𝔠(f;x,w)𝔠(f;x,y)\mathfrak{c}(f;x,w)\leq\mathfrak{c}(f;x,y), para todos x,y,wIx,y,w\in I com x<w<yx<w<y;

  • 𝔠(f;x,y)𝔠(f;w,y)\mathfrak{c}(f;x,y)\leq\mathfrak{c}(f;w,y), para todos x,y,wIx,y,w\in I com x<w<yx<w<y;

  • 𝔠(f;x,w)𝔠(f;w,y)\mathfrak{c}(f;x,w)\leq\mathfrak{c}(f;w,y), para todos x,y,wIx,y,w\in I com x<w<yx<w<y.

Similarmente, são equivalentes as condições:

  • ff é estritamente convexa;

  • 𝔠(f;x,w)<𝔠(f;x,y)\mathfrak{c}(f;x,w)<\mathfrak{c}(f;x,y), para todos x,y,wIx,y,w\in I com x<w<yx<w<y;

  • 𝔠(f;x,y)<𝔠(f;w,y)\mathfrak{c}(f;x,y)<\mathfrak{c}(f;w,y), para todos x,y,wIx,y,w\in I com x<w<yx<w<y;

  • 𝔠(f;x,w)<𝔠(f;w,y)\mathfrak{c}(f;x,w)<\mathfrak{c}(f;w,y), para todos x,y,wIx,y,w\in I com x<w<yx<w<y.

Demonstração.

Segue de (4.5.5), (4.5.6), (4.5.8) e (4.5.9). ∎

Uma função convexa só deixa de ser estritamente convexa se for afim em algum trecho de seu domínio. Esse é o conteúdo do seguinte:

4.5.3 Corolário.

Seja f:If:I\to\mathds{R} uma função convexa num intervalo II\subset\mathds{R}. Dados x,yIx,y\in I com x<yx<y então são equivalentes:

existe t]0,1[t\in\left]0,1\right[ tal que f((1t)x+ty)=(1t)f(x)+tf(y)f\big{(}(1-t)x+ty\big{)}=(1-t)f(x)+tf(y);

ff é afim no intervalo [x,y][x,y], i.e., existem a,ba,b\in\mathds{R} com f(w)=aw+bf(w)=aw+b, para todo w[x,y]w\in[x,y];

f((1t)x+ty)=(1t)f(x)+tf(y)f\big{(}(1-t)x+ty\big{)}=(1-t)f(x)+tf(y), para todo t[0,1]t\in[0,1].

Demonstração.
  • \bullet

    (a)\Rightarrow(b).

    Seja t0]0,1[t_{0}\in\left]0,1\right[ com f((1t0)x+t0y)=(1t0)f(x)+t0f(y)f\big{(}(1-t_{0})x+t_{0}y\big{)}=(1-t_{0})f(x)+t_{0}f(y) e seja w0]x,y[w_{0}\in\left]x,y\right[ relacionado com t0t_{0} pela bijeção (4.5.3). Por (4.5.6), temos:

    𝔠(f;x,w0)=𝔠(f;x,y),𝔠(f;w0,y)=𝔠(f;x,y).\mathfrak{c}(f;x,w_{0})=\mathfrak{c}(f;x,y),\quad\mathfrak{c}(f;w_{0},y)=% \mathfrak{c}(f;x,y). (4.5.10)

    O Lema 4.5.2 nos diz que as funções:

    I]x,+[w𝔠(f;x,w),I],y[w𝔠(f;w,y),I\cap\left]x,+\infty\right[\ni w\longmapsto\mathfrak{c}(f;x,w),\quad I\cap% \left]-\infty,y\right[\ni w\longmapsto\mathfrak{c}(f;w,y),

    são crescentes e portanto (4.5.10) implica que 𝔠(f;x,w)=𝔠(f;x,y)\mathfrak{c}(f;x,w)=\mathfrak{c}(f;x,y), para todo w[w0,y]w\in[w_{0},y] e que 𝔠(f;w,y)=𝔠(f;x,y)\mathfrak{c}(f;w,y)=\mathfrak{c}(f;x,y), para todo w[x,w0]w\in[x,w_{0}]. Daí:

    f(w)=𝔠(f;x,y)(wx)+f(x),f(w)=\mathfrak{c}(f;x,y)(w-x)+f(x),

    para todo w[w0,y]w\in[w_{0},y] e:

    f(w)=𝔠(f;x,y)(wy)+f(y)=(4.5.4)𝔠(f;x,y)(wx)+f(x),f(w)=\mathfrak{c}(f;x,y)(w-y)+f(y)\stackrel{{\scriptstyle\eqref{eq:% igualdadesfaceis}}}{{=}}\mathfrak{c}(f;x,y)(w-x)+f(x),

    para todo w[x,w0]w\in[x,w_{0}].

  • \bullet

    (b)\Rightarrow(c).

    Temos:

    (1t)f(x)+tf(y)=(1t)(ax+b)+t(ay+b)=a((1t)x+ty)+b=f((1t)x+ty).(1-t)f(x)+tf(y)=(1-t)(ax+b)+t(ay+b)=a\big{(}(1-t)x+ty\big{)}+b\\ =f\big{(}(1-t)x+ty\big{)}.
  • \bullet

    (c)\Rightarrow(a).

    Trivial.∎

4.5.4 Corolário.

Seja f:If:I\to\mathds{R} uma função convexa num intervalo II\subset\mathds{R}. Então ff não é estritamente convexa se e somente se existem x,yIx,y\in I e a,ba,b\in\mathds{R} com x<yx<y e f(w)=aw+bf(w)=aw+b, para todo w[x,y]w\in[x,y].∎

Dada uma função f:If:I\to\mathds{R} definida num intervalo II\subset\mathds{R} e xIx\in I um ponto que não é a extremidade direita de II, denotamos por d+f(x)\mathrm{d}^{+}f(x) a derivada à direita de ff no ponto xx, definida por:

d+f(x)=limh0+f(x+h)f(x)h=limyx+𝔠(f;x,y)¯,\mathrm{d}^{+}f(x)=\lim_{h\to 0^{+}}\frac{f(x+h)-f(x)}{h}=\lim_{y\to x^{+}}% \mathfrak{c}(f;x,y)\in\overline{\mathds{R}},

desde que esse limite exista em ¯\overline{\mathds{R}}. Similarmente, se xIx\in I não é a extremidade esquerda de II, denotamos por df(x)\mathrm{d}^{-}f(x) a derivada à esquerda de ff no ponto xx, definida por:

df(x)=limh0f(x+h)f(x)h=limyx𝔠(f;x,y)¯,\mathrm{d}^{-}f(x)=\lim_{h\to 0^{-}}\frac{f(x+h)-f(x)}{h}=\lim_{y\to x^{-}}% \mathfrak{c}(f;x,y)\in\overline{\mathds{R}},

desde que esse limite exista em ¯\overline{\mathds{R}}.

4.5.5 Lema.

Seja f:If:I\to\mathds{R} uma função convexa num intervalo II\subset\mathds{R}. Se xIx\in I não é a extremidade direita então a derivada à direita d+f(x)\mathrm{d}^{+}f(x) existe em ¯\overline{\mathds{R}} e vale a desigualdade:

d+f(x)𝔠(f;x,v)<+,\mathrm{d}^{+}f(x)\leq\mathfrak{c}(f;x,v)<+\infty, (4.5.11)

para todo vIv\in I com v>xv>x. Similarmente, se xIx\in I não é a extremidade esquerda então a derivada à esquerda df(x)\mathrm{d}^{-}f(x) existe em ¯\overline{\mathds{R}} e vale a desigualdade:

<𝔠(f;u,x)df(x),-\infty<\mathfrak{c}(f;u,x)\leq\mathrm{d}^{-}f(x), (4.5.12)

para todo uIu\in I com u<xu<x. Quando xIx\in I é um ponto interior então existem e são finitas ambas as derivadas laterais d+f(x)\mathrm{d}^{+}f(x), df(x)\mathrm{d}^{-}f(x) e vale a desigualdade:

df(x)d+f(x).\mathrm{d}^{-}f(x)\leq\mathrm{d}^{+}f(x). (4.5.13)

Se ff é estritamente convexa então as desigualdades em (4.5.11) e (4.5.12) são estritas.

Demonstração.

Suponha que xIx\in I não é a extremidade direita. O Lema 4.5.2 nos diz que a função:

I]x,+[v𝔠(f;x,v)I\cap\left]x,+\infty\right[\ni v\longmapsto\mathfrak{c}(f;x,v) (4.5.14)

é crescente; segue então que o limite limvx+𝔠(f;x,v)\lim_{v\to x^{+}}\mathfrak{c}(f;x,v) existe em ¯\overline{\mathds{R}} e:

d+f(x)=limvx+𝔠(f;x,v)=infv>xvI𝔠(f;x,v),\mathrm{d}^{+}f(x)=\lim_{v\to x^{+}}\mathfrak{c}(f;x,v)=\inf_{\begin{subarray}% {c}v>x\\ v\in I\end{subarray}}\mathfrak{c}(f;x,v),

o que prova (4.5.11). Similarmente, se xIx\in I não é a extremidade esquerda então o Lema 4.5.2 nos diz que a função:

I],x[u𝔠(f;u,x)I\cap\left]-\infty,x\right[\ni u\longmapsto\mathfrak{c}(f;u,x) (4.5.15)

é crescente, donde o limite limux𝔠(f;u,x)\lim_{u\to x^{-}}\mathfrak{c}(f;u,x) existe em ¯\overline{\mathds{R}} e:

df(x)=limux𝔠(f;u,x)=supu<xuI𝔠(f;u,x),\mathrm{d}^{-}f(x)=\lim_{u\to x^{-}}\mathfrak{c}(f;u,x)=\sup_{\begin{subarray}% {c}u<x\\ u\in I\end{subarray}}\mathfrak{c}(f;u,x),

provando (4.5.12). Se xIx\in I é um ponto interior então o Lema 4.5.2 nos diz que:

𝔠(f;u,x)𝔠(f;x,v),\mathfrak{c}(f;u,x)\leq\mathfrak{c}(f;x,v),

sempre que u,vIu,v\in I, u<x<vu<x<v; daí:

<df(x)=supu<xuI𝔠(f;u,x)infv>xvI𝔠(f;x,v)=d+f(x)<+,-\infty<\mathrm{d}^{-}f(x)=\sup_{\begin{subarray}{c}u<x\\ u\in I\end{subarray}}\mathfrak{c}(f;u,x)\leq\inf_{\begin{subarray}{c}v>x\\ v\in I\end{subarray}}\mathfrak{c}(f;x,v)=\mathrm{d}^{+}f(x)<+\infty,

provando (4.5.13). Finalmente, se ff é estritamente convexa então o Lema 4.5.2 nos diz que as funções (4.5.14) e (4.5.15) são estritamente crescentes, o que prova as desigualdades estritas em (4.5.11) e (4.5.12). ∎

4.5.6 Corolário.

Seja f:If:I\to\mathds{R} uma função convexa num intervalo II\subset\mathds{R}. Dados x,yIx,y\in I com x<yx<y então:

d+f(x)df(y).\mathrm{d}^{+}f(x)\leq\mathrm{d}^{-}f(y).

A desigualdade é estrita se ff é estritamente convexa.

Demonstração.

Os Lemas 4.5.2 e 4.5.5 implicam que para todo ww em ]x,y[\left]x,y\right[, temos:

d+f(x)𝔠(f;x,w)𝔠(f;w,y)df(y).\mathrm{d}^{+}f(x)\leq\mathfrak{c}(f;x,w)\leq\mathfrak{c}(f;w,y)\leq\mathrm{d}% ^{-}f(y).

Se ff é estritamente convexa então:

d+f(x)<𝔠(f;x,w)<𝔠(f;w,y)<df(y).\mathrm{d}^{+}f(x)<\mathfrak{c}(f;x,w)<\mathfrak{c}(f;w,y)<\mathrm{d}^{-}f(y).\qed
4.5.7 Corolário.

Se f:If:I\to\mathds{R} é uma função convexa num intervalo II\subset\mathds{R} então ff é contínua em todos os pontos interiores de II.

Demonstração.

Seja xx um ponto no interior de II. A existência e a finitude das derivadas laterais d+f(x)\mathrm{d}^{+}f(x) e df(x)\mathrm{d}^{-}f(x) implica que os limites laterais limyx+f(y)\lim_{y\to x^{+}}f(y) e limyxf(y)\lim_{y\to x^{-}}f(y) existem e são iguais a f(x)f(x); de fato:

limyx+(f(y)f(x))=limyx+(𝔠(f;x,y)(yx))=d+f(x)0=0,\displaystyle\lim_{y\to x^{+}}\big{(}f(y)-f(x)\big{)}=\lim_{y\to x^{+}}\big{(}% \mathfrak{c}(f;x,y)(y-x)\big{)}=\mathrm{d}^{+}f(x)\cdot 0=0,
limyx(f(y)f(x))=limyx(𝔠(f;x,y)(yx))=df(x)0=0.\displaystyle\lim_{y\to x^{-}}\big{(}f(y)-f(x)\big{)}=\lim_{y\to x^{-}}\big{(}% \mathfrak{c}(f;x,y)(y-x)\big{)}=\mathrm{d}^{-}f(x)\cdot 0=0.

Logo ff é contínua no ponto xx. ∎

4.5.8 Lema.

Seja f:If:I\to\mathds{R} uma função convexa num intervalo II\subset\mathds{R}. Se xIx\in I é um ponto interior e aa\in\mathds{R} é tal que df(x)ad+f(x)\mathrm{d}^{-}f(x)\leq a\leq\mathrm{d}^{+}f(x) então:

f(y)f(x)+a(yx),f(y)\geq f(x)+a(y-x), (4.5.16)

para todo yIy\in I. A desigualdade em (4.5.16) é estrita se ff é estritamente convexa e yxy\neq x.

Demonstração.

Se y=xy=x, vale a igualdade em (4.5.16). Se y>xy>x, a desigualdade (4.5.16) é equivalente a 𝔠(f;x,y)a\mathfrak{c}(f;x,y)\geq a; mas segue do Lema 4.5.5 que:

𝔠(f;x,y)d+f(x)a.\mathfrak{c}(f;x,y)\geq\mathrm{d}^{+}f(x)\geq a.

Similarmente, se y<xy<x, a desigualdade (4.5.16) é equivalente a 𝔠(f;y,x)a\mathfrak{c}(f;y,x)\leq a; mas segue do Lema 4.5.5 que:

𝔠(f;y,x)df(x)a.\mathfrak{c}(f;y,x)\leq\mathrm{d}^{-}f(x)\leq a.

Se ff é estritamente convexa então 𝔠(f;x,y)>d+f(x)a\mathfrak{c}(f;x,y)>\mathrm{d}^{+}f(x)\geq a para y>xy>x e 𝔠(f;y,x)<df(x)a\mathfrak{c}(f;y,x)<\mathrm{d}^{-}f(x)\leq a para y<xy<x. ∎

Dada uma função f:If:I\to\mathds{R} e um ponto xIx\in I, então uma reta:

L:yay+bL:\mathds{R}\ni y\longmapsto ay+b\in\mathds{R}

tal que f(x)=L(x)f(x)=L(x) e f(y)L(y)f(y)\geq L(y) para todo yIy\in I é dita uma reta suporte para ff no ponto xx. O Lema 4.5.8 nos diz então que uma função convexa f:If:I\to\mathds{R} num intervalo II possui uma reta suporte em todo ponto xx do interior do intervalo II.

4.5.9 Lema.

Seja (fλ)λΛ(f_{\lambda})_{\lambda\in\Lambda} uma família não vazia de funções convexas fλ:If_{\lambda}:I\to\mathds{R} num intervalo II. Se para todo xIx\in I o supremo supλΛfλ(x)\sup_{\lambda\in\Lambda}f_{\lambda}(x) é finito então a função f=supλΛfλf=\sup_{\lambda\in\Lambda}f_{\lambda} é convexa em II.

Demonstração.

Sejam x,yIx,y\in I e t[0,1]t\in[0,1]. Para todo λΛ\lambda\in\Lambda, temos:

fλ((1t)x+ty)(1t)fλ(x)+tfλ(y)(1t)f(x)+tf(y);f_{\lambda}\big{(}(1-t)x+ty\big{)}\leq(1-t)f_{\lambda}(x)+tf_{\lambda}(y)\leq(% 1-t)f(x)+tf(y);

tomando o supremo em λ\lambda, obtemos f((1t)x+ty)(1t)f(x)+tf(y)f\big{(}(1-t)x+ty\big{)}\leq(1-t)f(x)+tf(y). ∎

4.5.10 Corolário.

Seja f:If:I\to\mathds{R} uma função definida num intervalo II\subset\mathds{R}. Se ff admite uma reta suporte em todo ponto de II então ff é convexa.

Demonstração.

Para cada xIx\in I, seja Lx:L_{x}:\mathds{R}\to\mathds{R} uma reta suporte para ff. Obviamente:

supxILx(y)f(y),\sup_{x\in I}L_{x}(y)\leq f(y),

para todo yIy\in I. Além do mais:

supxILx(y)Ly(y)=f(y),\sup_{x\in I}L_{x}(y)\geq L_{y}(y)=f(y),

para todo yIy\in I, donde supxILx=f\sup_{x\in I}L_{x}=f. Como cada LxL_{x} é convexa (veja Exercício 4.23), segue do Lema 4.5.9 que ff é convexa. ∎

4.5.11 Proposição.

Seja f:If:I\to\mathds{R} uma função derivável num intervalo II\subset\mathds{R}. As seguintes condições são equivalentes:

  • (a)

    ff é convexa;

  • (b)

    a derivada ff^{\prime} é crescente;

  • (c)

    f(y)f(x)+f(x)(yx)f(y)\geq f(x)+f^{\prime}(x)(y-x), para todos x,yIx,y\in I (o gráfico de ff fica acima de suas retas tangentes).

Demonstração.
  • \bullet

    (a)\Rightarrow(b).

    Segue do Corolário 4.5.6.

  • \bullet

    (b)\Rightarrow(c).

    Seja xIx\in I fixado e considere a função g:Ig:I\to\mathds{R} definida por:

    g(y)=f(y)(f(x)+f(x)(yx)),g(y)=f(y)-\big{(}f(x)+f^{\prime}(x)(y-x)\big{)},

    para todo yIy\in I. Temos g(y)=f(y)f(x)0g^{\prime}(y)=f^{\prime}(y)-f^{\prime}(x)\leq 0, se yI],x]y\in I\cap\left]-\infty,x\right] e g(y)0g^{\prime}(y)\geq 0, se yI[x,+[y\in I\cap\left[x,+\infty\right[; segue que gg é decrescente em I],x]I\cap\left]-\infty,x\right] e crescente em I[x,+[I\cap\left[x,+\infty\right[. Como g(x)=0g(x)=0, concluímos que g(y)0g(y)\geq 0, para todo yIy\in I.

  • \bullet

    (c)\Rightarrow(a).

    Segue do Corolário 4.5.10.∎

4.5.12 Corolário.

Seja f:If:I\to\mathds{R} uma função duas vezes derivável num intervalo II\subset\mathds{R}. Então ff é convexa se e somente se a sua derivada segunda f′′f^{\prime\prime} é não negativa.

Demonstração.

Evidentemente ff^{\prime} é crescente se e somente se f′′f^{\prime\prime} é não negativa. ∎

Temos a seguinte versão da Proposição 4.5.11 para convexidade estrita.

4.5.13 Proposição.

Seja f:If:I\to\mathds{R} uma função derivável num intervalo II\subset\mathds{R}. As seguintes condições são equivalentes:

  • (a)

    ff é estritamente convexa;

  • (b)

    a derivada ff^{\prime} é estritamente crescente;

  • (c)

    f(y)>f(x)+f(x)(yx)f(y)>f(x)+f^{\prime}(x)(y-x), para todos x,yIx,y\in I com xyx\neq y.

Demonstração.
  • \bullet

    (a)\Rightarrow(b).

    Segue do Corolário 4.5.6.

  • \bullet

    (b)\Rightarrow(c).

    Argumentamos como na demonstração da implicação (b)\Rightarrow(c) na Proposição 4.5.11, mas agora temos que g(y)<0g^{\prime}(y)<0 para yIy\in I com y<xy<x e g(y)>0g^{\prime}(y)>0 para yIy\in I com y>xy>x; daí gg é estritamente decrescente em I],x]I\cap\left]-\infty,x\right] e estritamente crescente em I[x,+[I\cap\left[x,+\infty\right[. Concluímos então que g(y)>0g(y)>0, para yIy\in I com yxy\neq x.

  • \bullet

    (c)\Rightarrow(a).

    O Corolário 4.5.10 nos garante que ff é convexa. Se ff não fosse estritamente convexa, existiriam u,vIu,v\in I, a,ba,b\in\mathds{R} com u<vu<v e:

    f(w)=aw+b,f(w)=aw+b,

    para todo w[u,v]w\in[u,v] (Corolário 4.5.4). Daí, para todos x,y[u,v]x,y\in[u,v], teríamos:

    f(x)+f(x)(yx)=ax+b+a(yx)=f(y),f(x)+f^{\prime}(x)(y-x)=ax+b+a(y-x)=f(y),

    contradizendo (c).∎

4.5.14 Corolário.

Seja f:If:I\to\mathds{R} uma função duas vezes derivável num intervalo II\subset\mathds{R}. Se sua derivada segunda f′′f^{\prime\prime} é positiva então ff é estritamente convexa.

Demonstração.

Evidentemente ff^{\prime} é estritamente crescente se f′′f^{\prime\prime} é positiva. ∎

4.5.15 Exemplo.

A recíproca do Corolário 4.5.14 não é verdadeira. De fato, a função f:xx4f:\mathds{R}\ni x\mapsto x^{4}\in\mathds{R} é estritamente convexa, pois sua derivada f(x)=4x3f^{\prime}(x)=4x^{3} é estritamente crescente. No entanto, temos f′′(0)=0f^{\prime\prime}(0)=0.

4.5.16 Proposição.

Seja f:If:I\to\mathds{R} uma função convexa num intervalo II\subset\mathds{R}. Dados x1,,xnIx_{1},\ldots,x_{n}\in I e números reais não negativos α1\alpha_{1}, …, αn\alpha_{n} com α1++αn=1\alpha_{1}+\cdots+\alpha_{n}=1 então α1x1++αnxnI\alpha_{1}x_{1}+\cdots+\alpha_{n}x_{n}\in I e:

f(α1x1++αnxn)α1f(x1)++αnf(xn);f(\alpha_{1}x_{1}+\cdots+\alpha_{n}x_{n})\leq\alpha_{1}f(x_{1})+\cdots+\alpha_% {n}f(x_{n}); (4.5.17)

se ff é estritamente convexa e α1,,αn>0\alpha_{1},\ldots,\alpha_{n}>0 então a igualdade vale em (4.5.17) se e somente se x1==xnx_{1}=\cdots=x_{n}.

Demonstração.

Se a=min{x1,,xn}a=\min\{x_{1},\ldots,x_{n}\} e b=max{x1,,xn}b=\max\{x_{1},\ldots,x_{n}\} então a,bIa,b\in I e:

a=(α1++αn)aα1x1++αnxn(α1++αn)b=b,a=(\alpha_{1}+\cdots+\alpha_{n})a\leq\alpha_{1}x_{1}+\cdots+\alpha_{n}x_{n}% \leq(\alpha_{1}+\cdots+\alpha_{n})b=b,

donde α1x1++αnxnI\alpha_{1}x_{1}+\cdots+\alpha_{n}x_{n}\in I. Para provar o restante da tese, usamos indução em nn. O resultado é óbvio no caso que n=1n=1. Assumindo o resultado válido para um certo n1n\geq 1, sejam x1,,xn+1Ix_{1},\ldots,x_{n+1}\in I e α1,,αn+10\alpha_{1},\ldots,\alpha_{n+1}\geq 0 com α1++αn+1=1\alpha_{1}+\cdots+\alpha_{n+1}=1. Vamos mostrar que:

f(α1x1++αnxn+αn+1xn+1)α1f(x1)++αnf(xn)+αn+1f(xn+1).f(\alpha_{1}x_{1}+\cdots+\alpha_{n}x_{n}+\alpha_{n+1}x_{n+1})\\ \leq\alpha_{1}f(x_{1})+\cdots+\alpha_{n}f(x_{n})+\alpha_{n+1}f(x_{n+1}). (4.5.18)

Se αn+1=1\alpha_{n+1}=1, vale a igualdade em (4.5.18). Suponha que αn+1<1\alpha_{n+1}<1. Seja αi=αi1αn+1\alpha^{\prime}_{i}=\frac{\alpha_{i}}{1-\alpha_{n+1}}, i=1,,ni=1,\ldots,n. Claramente α1,,αn0\alpha^{\prime}_{1},\ldots,\alpha^{\prime}_{n}\geq 0 e α1++αn=1\alpha^{\prime}_{1}+\cdots+\alpha^{\prime}_{n}=1, donde a hipótese de indução nos dá:

f(α1x1++αnxn)α1f(x1)++αnf(xn).f(\alpha^{\prime}_{1}x_{1}+\cdots+\alpha^{\prime}_{n}x_{n})\leq\alpha^{\prime}% _{1}f(x_{1})+\cdots+\alpha^{\prime}_{n}f(x_{n}).

Temos:

f(α1x1++αnxn+αn+1xn+1)=f((1αn+1)(α1x1++αnxn)+αn+1xn+1)(1αn+1)f(α1x1++αnxn)+αn+1f(xn+1)(1αn+1)(α1f(x1)++αnf(xn))+αn+1f(xn+1)=α1f(x1)++αnf(xn)+αn+1f(xn+1),f(\alpha_{1}x_{1}+\cdots+\alpha_{n}x_{n}+\alpha_{n+1}x_{n+1})\\ =f\big{(}(1-\alpha_{n+1})(\alpha^{\prime}_{1}x_{1}+\cdots+\alpha^{\prime}_{n}x% _{n})+\alpha_{n+1}x_{n+1}\big{)}\\ \leq(1-\alpha_{n+1})f(\alpha^{\prime}_{1}x_{1}+\cdots+\alpha^{\prime}_{n}x_{n}% )+\alpha_{n+1}f(x_{n+1})\\ \leq(1-\alpha_{n+1})\big{(}\alpha^{\prime}_{1}f(x_{1})+\cdots+\alpha^{\prime}_% {n}f(x_{n})\big{)}+\alpha_{n+1}f(x_{n+1})\\ =\alpha_{1}f(x_{1})+\cdots+\alpha_{n}f(x_{n})+\alpha_{n+1}f(x_{n+1}), (4.5.19)

onde na primeira desigualdade usamos α1x1++αnxnI\alpha^{\prime}_{1}x_{1}+\cdots+\alpha^{\prime}_{n}x_{n}\in I e a convexidade de ff. Isso prova (4.5.18). Suponha agora que α1,,αn+1>0\alpha_{1},\ldots,\alpha_{n+1}>0, ff é estritamente convexa e vale a igualdade em (4.5.18). Daí todas as desigualdades em (4.5.19) são igualdades e portanto:

α1x1++αnxn=xn+1,\alpha^{\prime}_{1}x_{1}+\cdots+\alpha^{\prime}_{n}x_{n}=x_{n+1}, (4.5.20)

e:

f(α1x1++αnxn)=α1f(x1)++αnf(xn).f(\alpha^{\prime}_{1}x_{1}+\cdots+\alpha^{\prime}_{n}x_{n})=\alpha^{\prime}_{1% }f(x_{1})+\cdots+\alpha^{\prime}_{n}f(x_{n}).

Como α1,,αn>0\alpha^{\prime}_{1},\ldots,\alpha^{\prime}_{n}>0, a hipótese de indução nos dá x1==xnx_{1}=\cdots=x_{n}. Finalmente, (4.5.20) implica que x1==xn=xn+1x_{1}=\cdots=x_{n}=x_{n+1}. ∎