Ir al contenido

Espacio vectorial

De Wikipedia, la enciclopedia libre
Esta es una versión antigua de esta página, editada a las 20:01 8 abr 2010 por DSisyphBot (discusión · contribs.). La dirección URL es un enlace permanente a esta versión, que puede ser diferente de la versión actual.
Un espacio vectorial es un conjunto de objetos (llamados vectores) que pueden escalarse y sumarse.

Un espacio vectorial (o espacio lineal) es el objeto básico de estudio en la rama de la matemática llamada álgebra lineal. A los elementos de los espacios vectoriales se les llama vectores. Sobre los vectores pueden realizarse dos operaciones: la multiplicación por escalares y la adición (una asociación entre un par de objetos). Estas dos operaciones se tienen que ceñir a un conjunto de axiomas que generalizan las propiedades comunes de las tuplas de números reales así como de los vectores en el espacio euclídeo. Un concepto importante es el de dimensión.

Históricamente, las primeras ideas que condujeron a los espacios vectoriales modernos se remontan al siglo XVII: geometría analítica, matrices y sistemas de ecuaciones lineales. La primera formulación moderna y axiomática se debe a Giuseppe Peano, a finales del siglo XIX. Los siguientes avances en la teoría de espacios vectoriales provienen del análisis funcional, principalmente de los espacios de funciones. Los problemas de Análisis funcional requerían resolver problemas sobre la convergencia. Esto se hizo dotando a los espacios vectoriales de una adecuada topología, permitiendo tener en cuenta cuestiones de proximidad y continuidad. Estos espacios vectoriales topológicos, en particular los espacios de Banach y los espacios de Hilbert tienen una teoría más rica y complicada.

Los espacios vectoriales tienen aplicaciones en otras ramas de la matemática, la ciencia y la ingeniería. Se utilizan en métodos como las series de Fourier, que se utiliza en las rutinas modernas de compresión de imágenes y sonido, o proporcionan el marco para resolver ecuaciones en derivadas parciales. Además, los espacios vectoriales proporcionan una forma abstracta libre de coordenadas de tratar con objetos geométricos y físicos, tales como tensores, que a su vez permiten estudiar las propiedades locales de variedades mediante técnicas de linealización.

Motivación y definición

El vector negro (x, y) = (5, 7) puede expresarse como combinación lineal de dos pares diferentes de vectores (5·(1, 0) y 7·(0, 1) – azul; 3·(−1, 1) y 4·(2, 1) – amarillo).

El plano R2, consistente en los pares (x, y) de números reales, es el típico ejemplo de espacio vectorial: cualquiera dos pares de números reales pueden sumarse,

(x1, y1) + (x2, y2) = (x1 + x2, y1 + y2),

y cualquier par (x, y) puede escalarse, multiplicarse por un número real s, para obtener otro vector (sx, sy).

Existe además un vector, el (0,0), llamado vector nulo que cumple que al sumarse con cualquier otro vector no lo altera. Todo vector, por ejemplo el (1, 0), tiene su opuesto, el (-1, 0), que sumados dan como resultante el vector nulo (0, 0).

La noción de espacio vectorial es una generalización de esta idea. Es más general de varias maneras: en primer lugar, en lugar de los números reales otros cuerpos, como los números complejos o los cuerpos finitos, se permiten. En segundo lugar, la dimensión del espacio, que es de dos en el ejemplo anterior, puede ser arbitraria, incluso infinita. Otro punto de vista conceptual importante es que los elementos de los espacios vectoriales no suelen estar expresados como combinaciones lineales de un conjunto de vectores, es decir, no hay preferencia de representar el vector (x, y ) como

(x, y) = x · (1, 0) + y · (0, 1)
o como
(x, y) = (−1/3·x + 2/3·y) · (−1, 1) + (1/3·x + 1/3·y) · (2, 1)

Definición formal

La definición de un espacio vectorial requiere de un cuerpo de escalares K (como el cuerpo de los números reales o el cuerpo de los números complejos). Un espacio vectorial es un conjunto V (no vacío) a cuyos elementos se llaman vectores, dotado de dos operaciones:

  • suma de vectores: cualquiera dos vectores v y w pueden sumarse para obtener un tercer vector v + w
  • producto por un escalar: cualquier vector v puede multiplicarse por un escalar, i.e. un elemento de K, a. El producto se denota como av.

que satisfacen las siguientes propiedades o axiomas (u, v, w son vectores arbitrarios de V, y a, b son escalares, respectivamente):

Propiedad Significado
Propiedad asociativa de la suma u + (v + w) = (u + v) + w
Propiedad conmutativa de la suma v + w = w + v
Existencia de elemento neutro o nulo de la suma Existe un elemento 0V, llamado vector cero o nulo, de forma que v + 0 = v para todo vV.
Existencia de elemento opuesto o simétrico de la suma Para todo v ∈ V, existe un elemento -vV, llamado opuesto de v, de forma que v + (-v) = 0.
Propiedad distributiva del producto por un escalar respecto a la suma de vectores a (v + w) = a v + a w
Propiedad distributiva del producto por un vector respecto a la suma de escalares (a + b) v = a v + b v
Propiedad asociativa mixta del producto por un escalar a (b v) = (ab) v[nb 1]
Existencia de elemento unidad del producto por un escalar 1 v = v, donde 1 es la identidad multiplicativa en K

Con esta definición puede comprobarse que R2, con la suma y producto vistos arriba, es por tanto un espacio vectorial. Comprobar los axiomas se reduce a verificar identidades sencillas como

(x, y) + (0, 0) = (x, y),

i.e. la suma de un vector nulo (0, 0) con otro vector produce el mismo vector. La propiedad distributiva lleva a

(a + b) · (x, y) = a · (x, y) + b · (x, y).

Notas y definición alternativa

El requisito de que la suma de vectores y la multiplicación por un escalar sean operaciones binarias incluye (por la definición de las operaciones binarias) una propiedad llamada cerradura, es decir, u + v y a v se encuentran en V para todos a, u y v. Algunos autores optan por mencionar estas propiedades como axiomas separados.

Las primeras cuatro propiedades hacen referencia a la suma de vectores y se resumen diciendo que el espacio vectorial es un grupo conmutativo con la suma. El resto de propiedades son equivalentes a la existencia de un homomorfismo de anillos f del cuerpo en el anillo de endoformismos del grupo de vectores. Luego, la multiplicación por un escalar a v se define como (f(a))(v). Esto puede ser visto como el punto de partida de la definición de un espacio vectorial sin referirse al cuerpo. En particular, para cualquier a de , se llama homotecia de razón a al morfismo de .

Con estas premisas tenemos la siguiente

Definición

Se dice que es un espacio vectorial sobre si y sólo si se tiene

, +, *

es un morfismo de anillos.

Consecuencias de esta definición
  • El hecho que sea un grupo abeliano resume en sí mismo los axiomas de la suma vectorial.
  • El que sea homotecia da cuenta del axioma 4 del producto por escalares ya que es lineal.
  • El que f sea un morfismo de anillos significa que
    • , es decir que , ó sea (axioma 10)
    • , es decir , ó sea (axioma 7)
    • , ó sea , donde 1 es el neutro de e es la identidad, es decir la aplicación de V. La identidad es obviamente el neutro de End V. Esto se escribe para cuaquier vector . (axioma 8 )
  • Se podría añadir , la aplicación nula de V, pero es una consecuencia de la tercera premisa.
  • El último punto () equivale a afirmar que f no es la aplicación nula.

Propiedades del espacio vectorial.

Hay una serie de propiedades que se demuestran fácilmente a partir de los axiomas del espacio vectorial. Algunas de ellas se derivan de la teoría elemental de grupos, aplicada al grupo (aditivo) de vectores: por ejemplo, el vector nulo 0 Є V, y el opuesto -v de un vector v son únicos. Otras propiedades se pueden derivar de la propiedad distributiva, por ejemplo, la multiplicación por el escalar cero da el vector nulo y ningún otro escalar multiplicado por un vector da cero:

Propiedad Significado
Unicidad del vector nulo
Unicidad del opuesto de un vector
Producto por el escalar cero 0 v = 0. El 0 es el único escalar que cumple esta propiedad.
Producto de un escalar por el vector nulo a 0 = 0
Opuesto del producto de un vector por un escalar - (a v) = (-a) v = a (-v)

Historia

Los espacios vectoriales se derivan de la geometría afín, a través de la introducción de coordenadas en el plano o el espacio tridimensional. Alrededor de 1636, los matemáticos franceses Descartes y Fermat fundaron las bases de la geometría analítica mediante la vinculación de las soluciones de una ecuación con dos variables a la determinación de una curva plana.[1]​ Para lograr una solución geométrica sin usar coordenadas, Bernhard Bolzano introdujo en 1804 ciertas operaciones sobre puntos, líneas y planos, que son predecesores de los vectores.[2]​ Este trabajo hizo uso del concepto de coordenadas baricéntricas de August Ferdinand Möbius de 1827.[3]​ El origen de la definición de los vectores es la definición de Giusto Bellavitis de bipoint, que es un segmento orientado, uno de cuyos extremos es el origen y el otro un objetivo. Los vectores se reconsideraron con la presentación de los números complejos de Argand y Hamilton y la creación de los cuaterniones por este último (Hamilton fue además el que inventó el nombre de vector).[4]​ Son elementos de R2 y R4; el tratamiento mediante combinaciones lineales se remonta a Laguerre en 1867, quien también definió los sistemas de ecuaciones lineales.

En 1857, Cayley introdujo la notación matricial, que permite una armonización y simplificación de los aplicaciones lineales. Casi al mismo tiempo, Grassmann estudió el cálculo baricéntrico iniciado por Möbius. Previó conjuntos de objetos abstractos dotados de operaciones.[5]​ En su trabajo, los conceptos de independencia lineal y dimensión, así como de producto escalar están presentes. En realidad el trabajo de Grassmann de 1844 supera el marco de los espacios vectoriales, ya que teniendo en cuenta la multiplicación, también, lo llevó a lo que hoy en día se llaman álgebras. El matemático italiano Peano dio la primera definición moderna de espacios vectoriales y aplicaciones lineales en 1888.[6]

Un desarrollo importante de los espacios vectoriales se debe a la construcción de los espacios de funciones por Henri Lebesgue. Esto más tarde fue formalizado por Banach en su tesis doctoral de 1920[7]​ y por Hilbert. En este momento, el álgebra y el nuevo campo del análisis funcional empezaron a interactuar, en particular con conceptos clave tales como los espacios de funciones p-integrables y los espacios de Hilbert. También en este tiempo, los primeros estudios sobre espacios vectoriales de infinitas dimensiones se realizaron.

Ejemplos

Espacios de coordenadas y de funciones

El primer ejemplo de un espacio vectorial sobre un cuerpo K es el propio cuerpo, equipado con la suma y multiplicación definida en el cuerpo. Esto se generaliza por el espacio vectorial conocido como el espacio de coordenadas representado generalmente como Kn, donde n es un entero. Sus elementos son n-tuplas

(a1, a2, ..., an), donde los ai son elementos de K.

Las sucesiones infinitas de coordenadas, y, más generalmente, las funciones de cualquier conjunto fijo Ω en un cuerpo K también forman espacios vectoriales, mediante la suma y la multiplicación escalar puntual, es decir, la suma de dos funciones de f y g viene dada por

(f + g)(w) = f(w) + g(w)

y de igual modo para la multiplicación. Tales espacios de funciones se producen en muchas situaciones geométricas, cuando Ω es la recta real, un intervalo, o algún subconjunto de Rn. Muchos conceptos en topología y análisis, tales como continuidad, integrabilidad o diferenciabilidad tienen un buen comportamiento respecto a la linealidad, es decir, sumas y múltiplos por un escalar de funciones que posean una determinada propiedad seguirán teniéndola. Por lo tanto, el conjunto de tales funciones son espacios vectoriales. Estos espacios se estudian con más detalle utilizando los métodos de análisis funcional, véase más abajo. Las desigualdades algebraicas también producen espacios vectoriales: el espacio vectorial K[x] formado por funciones polinómicas, i.e.

f (x) = rnxn + rn−1xn−1 + ... + r1x + r0,donde los coeficientes rn, ..., r0 se encuentran en K. Las series de potencias son similares, salvo que se permiten infinitos términos.

Ecuaciones lineales

Los sistemas de ecuaciones lineales homogéneas están estrechamente vinculados a los espacios vectoriales. Por ejemplo, las soluciones de

a + 3b + c = 0
4a + 2b + 2c = 0

vienen dadas por tripletas de la forma a, b = a/2, y c = −5a/2 para un a arbitrario. Forman un espacio vectorial: las sumas y múltiplos de esas tripletas sigue cumpliendo las ecuaciones, por lo que son soluciones, también. Las matrices se pueden utilizar para condensar múltiples ecuaciones lineales en una sola ecuación, con el ejemplo anterior,

Ax = 0,

donde A es la matriz

,

, x es el vector (a, b, c), y 0 = (0, 0) es el vector nulo. De forma similar, las soluciones de ecuaciones diferenciales lineales homogéneas forman espacios vectoriales. Por ejemplo, las soluciones de la ecuación

f ''(x) + 2f '(x) + f (x) = 0

son de la forma f (x) = a · ex + bx · ex, donde a y b son constantes arbitrarias, y e = 2.718....

Teoría de números algebraicos

Una situación común en la teoría de números algebraicos es un cuerpo K que contiene un subcuerpo E. Por las operaciones de multiplicación y adición de K, K se convierte en un E-espacio vectorial, es decir, una extensión de E. Por ejemplo, los números complejos son un espacio vectorial sobre R. Otro ejemplo es Q(z), el cuerpo más pequeño que contiene los números racionales y algún número complejo z.

Bases y dimensión

Las bases revelan la estructura de los espacios vectoriales de una manera concisa. Una base es el menor conjunto (finito o infinito) B = {vi}iI de vectores que generan todo el espacio. Esto significa que cualquier vector v puede ser expresado como una suma (llamada combinación lineal) de elementos de la base

a1vi1 + a2vi2 + ... + anvin,

donde los ak son escalares y vik (k = 1, ..., n) elementos de la base B. La minimalidad, por otro lado, se hace formal por el concepto de independencia lineal. Un conjunto de vectores se dice que es linealmente independiente si ninguno de sus elementos puede ser expresado como una combinación lineal de los restantes. Equivalentemente, una ecuación

a1vi1 + ai2v2 + ... + anvin = 0

sólo se consigue si todos los escalares a1, ..., an son iguales a cero. Por definición cada vector puede ser expresado como una suma finita de los elementos de la base. Debido a la independencia lineal este tipo de representación es única. Los espacios vectoriales a veces se introducen desde este punto de vista.

Todo espacio vectorial tiene una base. Este hecho se basa en el lema de Zorn, una formulación equivalente del axioma de elección. Habida cuenta de los otros axiomas de la teoría de conjuntos de Zermelo-Fraenkel, la existencia de bases es equivalente al axioma de elección. El ultrafilter lemma, que es más débil que el axioma de elección, implica que todas las bases de un espacio vectorial tienen el mismo "tamaño", es decir, cardinalidad. A ésta, se le llama la dimensión del espacio vectorial, representada por dim V. Si el espacio es generado por un número finito de vectores, todo lo anterior puede demostrarse sin necesidad de acudir a la teoría de conjuntos.

La dimensión de un espacio de coordenadas Fn es n, pues cualquier vector (x1, x2, ..., xn) puede expresarse de forma única como combinación lineal de n vectores (llamados vectores coordenadas) e1 = (1, 0, ..., 0), e2 = (0, 1, 0, ..., 0), a en = (0, 0, ..., 0, 1), es decir, la suma

x1e1 + x2e2 + ... + xnen,

La dimensión de los espacios de funciones, como por ejemplo el espacio de funciones definidas en algún intervalo acotado o no, es infinita. Bajo unas adecuadas asunciones de regularidad de los coeficientes involucrados, la dimensión del espacio de soluciones de una ecuación diferencial ordinaria homogénea es igual al grado de la ecuación. Por ejemplo, la ecuación anterior tiene grado 2. El espacio de soluciones está generado por ex y xex (que son linealmente independientes en R), por lo que la dimensión de este espacio es dos. El grado de una extensión como por ejemplo Q(z) sobre Q depende de si z es o no algebraico, i.e. satisface una cierta ecuación polinomial

qnzn + qn−1zn−1 + ... + q0 = 0, con coeficientes racionales qn, ..., q0.

Si es algebraico, la dimensión es finita. Es más, es igual al grado del polinomio mínimo del que z es raíz. Por ejemplo,el conjunto de los números complejos es un espacio vectorial bidimensional sobre los números reales, generado por 1 y la unidad imaginaria i. Ésta última cumple i2 + 1 = 0, una ecuación de grado dos. Si z no es algebraico, la dimensión es infinita. Así, para z = π no existe dicha ecuación, pues π es trascendente.

Aplicaciones lineales y matrices

Como ocurre con muchas entidades algebraicas, la relación entre dos espacios vectoriales se expresa por las aplicaciones entre ellos. En el contexto de los espacios vectoriales, el concepto correspondiente se denomina aplicación lineal o transformación lineal. Se tratan de funciones f : VW que son compatibles con la estructura relevante, i.e., preservan la suma de vectores y el producto por un escalar:

f(v + w) = f(v) + f(w) y f(a · v) = a · f(v).

Un isomorfismo es aquella aplicación lineal f : VW para la cual existe una inversa g : WV. Si existe un isomorfismo entre V y W, los dos espacios se dice que son isomorfos, siendo esencialmente idénticos como espacios vectoriales, ya que a cualquier identidades en V le corresponde, a través de f, otra similar en W, y viceversa a través de g.

Dados dos espacios vectoriales V y W, las aplicaciones lineales de V en W forman un espacio vectorial representado como HomF(V, W) o como L(V, W).

Una vez se elige una base de V, las aplicaciones lineales f : VW están completamente determinadas por las imágenes de los vectores de la base, ya que cualquier elemento de V se expresa de forma única como una combinación lineal de éstos. Si los dos espacios tienen la misma dimensión se puede elegir una biyección entre dos bases fijas de V y W. La aplicación que aplica cualquier elemento de la base de V en el correspondiente elemento de la base deW, es, por su propia definición, un isomorfismo. Luego todo espacio vectorial está completamente determinado (salvo isomorfismos) por su dimensión, un simple número. En particular, cualquier espacio vectorial de dimensión n sobre F es isomorfo a Fn.

Matrices

Una matriz típica.

Las matrices son un concepto útil para representar las aplicaciones lineales. Se escriben como una tabla rectangular de escalares, es decir, elementos de algún cuerpo K. Cualquier matriz m-por-n A da lugar a una aplicación lineal de Kn a Km, por la siguiente fórmula:

,

o mediante el producto de la matriz A con el vector de coordenadas x:

xAx.

Además, después de la elección de bases de V y W, cualquier aplicación lineal f : VW se representa de forma única por una matriz a través de esta fórmula.

El volumen de este paralelepípedo es el valor absoluto del determinante de la matriz 3-por-3 formada por los vectores r1, r2, y r3.

El determinante det (A) de una matriz cuadrada A es un escalar que nos dice si la correspondiente aplicación lineal es o no un isomorfismo: para serlo la condición necesaria y suficiente es que el determinante no sea cero.

Vectores y valores propios

Un caso especialmente importante de aplicación lineal son los endomorfismos, es decir, aplicaciones f : VV. En este caso, los vectores v pueden compararse con sus imágenes por f, f(v). Cualquier vector v satisfaciendo f(v) = λ · v, donde λ es un escalar, se dice que es un vector propio de f con valor propio λ.[nb 2]​ Equivalentemente, v es un elemento del núcleo de la diferencia fλ · Id (la aplicación identidad VV). En el caso finito-dimensional, esto puede ser reformulado utilizando determinantes como: f tiene el valor propio λ sii

det (fλ · Id) = 0.

Al desarrollar el determinante, la expresión del lado izquierdo resulta ser una función polinómica en λ, llamada polinomio característico de f. Si el cuerpo F es lo suficientemente grande como para contener un cero de este polinomio (que siempre ocurrirá si F es algebraicamente cerrado, por ejemplo C) la aplicación lineal tendrá al menos un vector propio. El espacio vectorial V puede o no tener una base formada por vectores propios. Este fenómeno se rige por la forma canónica de Jordan del endomorfismo. El teorema espectral describe el caso infinito-dimensional; para lograr este objetivo, son necesarios los mecanismos de análisis funcional, consulte más abajo.

Construcciones básicas

Además de lo expuesto en los ejemplos anteriores, hay una serie de construcciones que nos proporcionan espacios vectoriales a partir de otros. Además de las definiciones concretas que figuran a continuación, también se caracterizan por propiedades universales, que determina un objeto X especificando las aplicaciones lineales de X a cualquier otro espacio vectorial.

Espacios vectoriales con estructura adicional

Desde el punto de vista del álgebra lineal, los espacios vectoriales se comprenden completamente en la medida en que cualquier espacio vectorial se caracteriza, salvo isomorfismos, por su dimensión. Sin embargo, los espacios vectoriales ad hoc no ofrecen un marco para hacer frente a la cuestión fundamental para el análisis de si una sucesión de funciones converge a otra función. Asimismo, el álgebra lineal no está adaptada per se para hacer frente a series infinitas, ya que la suma solo permite un número finito de términos para sumar. Las necesidades del análisis funcional requieren considerar nuevas estructuras.

Espacios vectoriales normados y espacios prehilbertianos

La "medición" de vectores es una necesidad frecuente, ya sea especificando una norma, , que mide las longitudes de los vectores, o por un producto escalar, <.,.>, que permite medir además los ángulos entre los vectores. En particular se cumple la fórmula:

Esta última implica que las longitudes de los vectores se puede definir también, mediante la definición de la correspondiente norma .

Dos vectores x e y satisfaciendo que su producto escalar es cero se dice que son ortogonales.

Los espacios vectoriales dotados de estas operaciones se conocen respectivamente como espacios vectoriales normados y espacios prehilbertianos.

Ejemplos

Los espacios de coordenadas Kn pueden equiparse con el producto escalar estándar:

<(x1, x2, ..., xn), (y1, y2, ..., yn)> = x · y = x1y1 + ... + xnyn.

Una importante variante del producto escalar estándar se utiliza en el espacio-tiempo de Minkowski, es decir, R4 dotado del producto escalar

<x , y> = x1y1 + x2y2 + x3y3x4y4.

Es crucial para el tratamiento matemático de la relatividad especial, donde la cuarta coordenada corresponde al tiempo.

Espacios vectoriales topológicos

Las cuestiones de convergencia se abordan considerando espacios vectoriales V con una topología compatibe, es decir, una estructura que permite hablar de elementos que se encuentran cercanos unos a otros. Compatible quiere decir que la suma y producto por un escalar deben ser aplicaciones continuas, es decir, si x e y son vectores, y a es un escalar, una pequeña variación de x e y produce una pequeña variación de x + y y ax. Si lo que varía es el escalar a, el cuerpo K debe estar dotado de una topología; una elección común son los números reales y los números complejos.

Espacios de Banach

Espacios de Hilbert

Citas

  1. Este axioma no es la afirmación de la asociatividad de una operación, ya que hay dos operaciones en cuestión, la multiplicación por un escalar: b v; y el producto de escalares: ab.
  2. La nomenclatura deriva del alemán

Referencias

Referencias históricas

Véase también

Referencias

  1. Bourbaki, 1969, ch. "Álgabre linéaire et álgebre multilinéaire", pp. 78–91.
  2. Bolzano, 1804.
  3. Möbius, 1827.
  4. Hamilton, 1853.
  5. Grassmann, 1844.
  6. Peano, 1888, ch. IX.
  7. Banach, 1922.


Enlaces externos