Función convexa

De Wikipedia, la enciclopedia libre
Saltar a: navegación, búsqueda
Función convexa en un intervalo [x,y].

En matemática, una función real f definida en un intervalo (o en cualquier subconjunto convexo de algún espacio vectorial) se llama función convexa o cóncava hacia arriba, si está definida sobre un conjunto convexo C y para cualesquiera dos puntos x, y miembros de C, y para cada t en [0,1], se cumple que:

f(tx+(1-t)y)\leq t f(x)+(1-t)f(y).

En otras palabras, una función es convexa sí y sólo si su epigrafo (el conjunto de puntos situados en o sobre el grafo) es un conjunto convexo.

Una función estrictamente convexa es aquella en que

f(tx+(1-t)y) < t f(x)+(1-t)f(y)\,

para cualquier t en (0,1) y x \neq y.

Una función f es cóncava si la función - f es convexa.

Propiedades[editar]

Una función (en azul) es convexa si y sólo si la región sobre su grafo (en verde) es un conjunto convexo.

Una función convexa f definida en un intervalo abierto C es continua en C y diferenciable en todos los puntos menos en un conjunto numerable. Si C es cerrado, f puede no ser continuo en los puntos críticos o finales de C.

Una función es punto-medio convexa (midpoint convex) en un intervalo "C" si

f\left( \frac{x+y}{2} \right) \le  \frac{f(x)+f(y)}{2}

para todo x e y en C. Esta condición es sólo ligeramente más relajada que la de convexidad. En particular, una función continua que es punto-medio convexa será también convexa.

Una función diferenciable de una variable es convexa en un intervalo sí y sólo si su derivada es monótonamente no-decreciente en ese intervalo.

Una función continuamente diferenciable de una variable es convexa en un intervalo si y sólo si la función se encuentra por encima de todas sus tangentes: f(y) ≥ f(x) + f '(x) (yx) para todo x e y en el intervalo. En particular, si f '(c) = 0, luego c es un mínimo absoluto de f(x).

Una función doblemente diferenciable de una variable es convexa en un intervalo si y sólo si su segunda derivada es no negativa en ese intervalo; esto proporciona una prueba práctica para verificar convexidad. Si la segunda derivada es positiva, entonces es estrictamente convexa, pero la doble implicación no se cumple, como podemos ver por ejemplo en f(x) = x4.

En general, una función continua doblemente diferenciable de muchas variables es convexa en un conjunto convexo si y sólo si su matriz Hessiana es definida positiva en el interior de ese conjunto convexo.

Cualquier mínimo local de una función convexa es también un mínimo absoluto. Una función estrictamente convexa tendrá a lo más un mínimo absoluto.

Para una función convexa f, los conjuntos de nivel {x | f(x) < a} y {x | f(x) ≤ a} con aR son conjuntos convexos. Sin embargo, una función cuyos conjuntos de nivel son conjuntos convexos puede no resultar ser convexa; una función de este tipo se llama función cuasi-convexa.

La inecuación de Jensen se aplica a toda función convexa f. Si X es una variable aleatoria que toma valores en el dominio de f, entonces E f(X) \geq f(EX). (Aquí E denota la esperanza matemática.)

Cálculo de función convexa[editar]

  • Si f y g son funciones convexas, entonces también lo son m(x) = \max\{f(x),g(x) \} y h(x) = f(x) + g(x) .
  • Si f y g son funciones convexas y g es creciente, entonces h(x) = g(f(x)) es convexa.
  • La convexidad es invariante bajo mapeamientos afines; es decir, si f(x) es convexa, con x\in\mathbb{R}^n, entonces también lo es g(y) = f(Ay+b) , donde A\in\mathbb{R}^{n \times m},\; b\in\mathbb{R}^m.
  • Si f(x,y) es convexa en (x,y) y C es un conjunto convexo no vacío, entonces g(x) = \inf_{y\in C} f(x,y) es convexa en x, siempre que g(x) > -\infty para algún x.

Ejemplos[editar]

  • La función f(x)=x^2 tiene f''(x)=2>0 en todos los puntos, luego f es una función (estrictamente) convexa.
  • La función valor absoluto f(x)=|x| es convexa, incluso a pesar de que no es derivable en el punto x = 0.
  • La función f(x)=|x|^p para 1 ≤ p es convexa.
  • La función f con dominio [0,1] definida por f(0)=f(1)=1, f(x)=0 para 0<x<1 es convexa; es continua en el intervalo abierto (0,1), pero no en 0 ni en 1.
  • La función x3 tiene segunda derivada 6x; luego ella es convexa en el conjunto donde x ≥ 0 y cóncava en el conjunto donde x ≤ 0.
  • Toda transformación lineal con dominio en \mathbb{R} es convexa, pero no estrictamente convexa, pues si f es lineal, luego f(a + b) = f(a) + f(b). Esto también se aplica si reemplazamos "convexo" por "cóncavo".
  • Toda función afín con dominio en \mathbb{R}, es decir, cada función de la forma f(x) = a^T x + b , es al mismo tiempo convexa y cóncava.
  • Toda norma vectorial es una función convexa, por la desigualdad triangular.
  • Si f es convexa, la función perspectiva g(x,t) = tf(x/t) es convexa para t > 0.
  • Las funciones f(x) = \sqrt x y g(x) = \log(x). son monótonamente crecientes pero no convexas.
  • Las funciones h(x) = x^2 y k(x)=-x son convexas pero no monótonamente crecientes.
  • La función f(x) = 1/x2, con f(0)=+∞, es convexa en los intervalos (0,+∞) y (-∞,0), pero no es convexa en (-∞,+∞), debido al punto x = 0.

Teoremas sobre funciones convexas[editar]

El siguiente teorema generaliza un resultado bien conocido en \scriptstyle \R a cualquier espacio normado sea de dimensión finita o infinita:

(Condición necesaria de mínimo local) Sea J:U\to \R una función definida sobre un conjunto convexo U\, de un espacio vectorial normado. Si el punto u\in U es un mínimo local de la función y si la función J:U\to \R es diferenciable (en sentido de Fréchet) en el entorno de dicho punto, entonces

\mathrm{D}J(u)(v-u) \ge 0, \qquad \forall:v\in U

La desigualdad anterior se denimina desigualdad de Euler.

El teorema anterior es válido para cualquier función sea convexa o no, mientras que el siguiente es válido sólo para funciones convexas:

(Convexidad y derivada) Sea J:U\to \R una función definida sobre un conjunto convexo U\, de un espacio normado, entonces:

a) La función J\, es convexa en su dominio si y sólo si:
J(v)\ge J(u) + \mathrm{D}J(u)(v-u), \qquad \forall:u,v\in U
b) La función J\, es estrictamente convexa en su dominio si y sólo si:
J(v)> J(u) + \mathrm{D}J(u)(v-u), \qquad \forall:u,v\in U, u\ne v

El significado geométrico del teorema anterior es claro, el teorema implica simplemente que la función en todo punto está por encima del plano tangente en un punto. El siguiente teorema es válido para funciones convexas que son dos veces diferenciables (y por tanto admiten una forma bilineal que generaliza la matriz hessiana):

(Convexidad y segunda derivada) Sea J:U\to \R una función definida sobre un conjunto convexo U\, de un espacio normado y que sea dos veces diferenciable, entonces:

a) La función J\, es convexa en su dominio si y sólo si:
\mathrm{D}^2J(u)(v-u,v-u)\ge 0, \qquad \forall:u,v\in U
b) Si
\mathrm{D}^2J(u)(v-u,v-u)> 0, \qquad \forall:u,v\in U, u\ne v
La función es estrictamente convexa en su dominio.

Nótese que en este último caso el recíproco de la afirmación b) no es cierto en general, por ejemplo considérese U=\R,\ J(u)=u^4 cuya segunda derivada en el origen se anula y, sin embargo, la función sigue siendo estrictamente convexa.

El último teorema impone restricciones sobre el número de mínimos que puede tener una función convexa y su naturaleza:

(mínimos de funciones convexas) Sea J:U\to \R una función definida sobre un conjunto convexo U\, de un espacio normado, entonces:

a) Cualquier mínimo local de la función J\, de hecho es un mínimo aboluto (aunque no todo mínimo absoluto es un mínimo local).
b) Si J\, es estrictamente convexa, tiene como mucho un único mínimo, y es un mínimo estricto.
c) Si U\, es un conjunto abierto, entonces un punto u\in U es un mínimo si y solo si \mathrm{D}J(u)=0

Véase también[editar]

Referencias[editar]

  • Rockafellar, R. T. (1970). Convex analysis. Princeton: Princeton University Press. 
  • Luenberger, David (1984). Linear and Nonlinear Programming. Addison-Wesley. 
  • Luenberger, David (1969). Optimization by Vector Space Methods. Wiley & Sons. 
  • Bertsekas, Dimitri (2003). Convex Analysis and Optimization. Athena Scientific. 
  • Thomson, Brian (1994). Symmetric Properties of Real Functions. CRC Press. 
  • Hiriart-Urruty, Jean-Baptiste, y Lemaréchal, Claude. (2004). Fundamentals of Convex analysis. Berlin: Springer.
  • Krasnosel'skii M.A., Rutickii Ya.B. (1961). Convex Functions and Orlicz Spaces. Groningen: P.Noordhoff Ltd. 
  • Borwein, Jonathan, and Lewis, Adrian. (2000). Convex Analysis and Nonlinear Optimization. Springer.

Enlaces externos[editar]