Teoría perturbacional

De Wikipedia, la enciclopedia libre
Saltar a: navegación, búsqueda

En mecánica cuántica, la teoría perturbacional o teoría de perturbaciones es un conjunto de esquemas aproximados para describir sistemas cuánticos complicados en términos de otros más sencillos. La idea es empezar con un sistema simple y gradualmente ir activando hamiltonianos "perturbativos", que representan pequeñas alteraciones al sistema. Si la alteración o perturbación no es demasiado grande, las diversas magnitudes físicas asociadas al sistema perturbado (por ejemplo sus niveles de energía y sus estados propios) podrán ser generados de forma continua a partir de los del sistema sencillo. De esta forma, podemos estudiar el sistema complejo basándonos en el sistema sencillo.

En particular al estudiar las energías de un sistema físico, el método consiste en identificar dentro del Hamiltoniano (perturbado) qué parte de éste corresponde a un problema con solución conocida (Hamiltoniano no perturbado en caso que su solución sea analítica) y considerar el resto como un potencial que modifica al anterior Hamiltoniano. Dicha identificación permite escribir a los autoestados del Hamiltoniano perturbado como una combinación lineal de los autoestados del Hamiltoniano sin perturbar y a las autoenergías como las autoenergías del problema sin perturbar más términos correctivos.

Procedimiento[editar]

Caso no degenerado[editar]

Sea H \, el Hamiltoniano de un sistema físico. De acuerdo con lo antes mencionado, el mismo se puede escribir como \hat H=\hat H_0+\lambda \hat V, donde \hat H_0 corresponde al Hamiltoniano sin pertubar (cuyas soluciones se conocen) y \hat V es el potencial que modifica a H_0 \,. El parámetro \lambda \, controla la magnitud de la perturbación. En general es un parámetro ficticio que se usa por conveniencia matemática y que al final del análisis se toma \lambda=1 \,. Por otro lado, los autoestados de H \, se escriben como una combinación lineal de los autoestados de H_0 \,

|\psi_n\rangle=\sum_m\sum_k\lambda^kc^{(k)}_{nm}|\psi^{(0)}_m\rangle

y las energías como

E_n=\sum_k\lambda^kE_n^{(k)}

donde E_n^{(k)} es la k-ésima corrección a la energía. El índice k \, indica el orden de la corrección comenzando por k=0 \,. Es decir, cuanto mayor sea k \,, mejor aproximación se tendrá y para k=0 \, no hay corrección alguna. En las anteriores expresiones se ha supuesto que

H_0|\psi^{(0)}_n\rangle=E^{(0)}_n|\psi^{(0)}_n\rangle y H|\psi_n\rangle=E_n|\psi_n\rangle

Si reemplazamos las expresiones para H, E_n y |\psi_n\rangle en la segunda ecuación de la anterior línea se tiene

H|\psi_n\rangle=E_n|\psi_n\rangle
(H_0+\lambda V)\sum_m\sum_k\lambda^kc^{(k)}_{nm}|\psi^{(0)}_m\rangle=(\sum_{k_1}\lambda^{k_1}E_n^{(k_1)})\sum_{m'}\sum_{k_2}\lambda^{k_2}c^{(k_2)}_{nm'}|\psi^{(0)}_{m'}\rangle
\sum_k\sum_m\lambda^kc^{(k)}_{nm}(E^{(0)}_m+\lambda V)|\psi^{(0)}_m\rangle=\sum_{k_1}\sum_{k_2}\sum_{m'}E_n^{(k_1)}\lambda^{k_1+k_2}c^{(k_2)}_{nm'}|\psi^{(0)}_{m'}\rangle
\sum_k\sum_m\lambda^kc^{(k)}_{nm}(E^{(0)}_m+\lambda V)|\psi^{(0)}_m\rangle=\sum_{k_1,k_2}\sum_{m'}E_n^{(k_1)}\lambda^{k_1+k_2}c^{(k_2)}_{nm'}|\psi^{(0)}_{m'}\rangle
\sum_mc^{(0)}_{nm}E^{(0)}_m|\psi_m^{(0)}\rangle+\sum_{k=1}\sum_m\lambda^k(c^{(k)}_{nm}E^{(0)}_m+c^{(k-1)}_{nm} V)|\psi^{(0)}_m\rangle=\sum_{m'}c^{(0)}_{nm'}E^{(0)}_n|\psi_{m'}^{(0)}\rangle+\sum_{k_1+k_2=1}\sum_{m'}E_n^{(k_1)}\lambda^{k_1+k_2}c^{(k_2)}_{nm'}|\psi^{(0)}_{m'}\rangle
\sum_mc^{(0)}_{nm}(E^{(0)}_m-E^{(0)}_n)|\psi_m^{(0)}\rangle+\sum_{k=1}\sum_m\lambda^k(c^{(k)}_{nm}E^{(0)}_m+c^{(k-1)}_{nm}V)|\psi^{(0)}_m\rangle=\sum_{k_1+k_2=1}\sum_{m'}E_n^{(k_1)}\lambda^{k_1+k_2}c^{(k_2)}_{nm'}|\psi^{(0)}_{m'}\rangle

Esta igualdad se debe satisfacer para todo orden de \lambda. El primer término del lado izquierdo de la última línea corresponde al orden k=0 y debe ser idénticamente nulo ya que del lado derecho de la igualdad no existen términos de dicho orden en \lambda. Esto implica que, para que toda la suma se anule, los c^{(0)}_{nm}=\delta_{nm}, donde \delta_{nm} es la delta de Kronecker.

Por otro lado, cuando k=1 se tiene en el lado izquierdo el primer orden de \lambda que se obtiene en el lado derecho cuando k_1+k_2=1, es decir cuando k_1=1\wedge k_2=0 o bien cuando k_1=0\wedge k_2=1. Por lo tanto se tiene

\sum_m(c^{(1)}_{nm}E^{(0)}_m+c^{(0)}_{nm}V)|\psi^{(0)}_m\rangle=\sum_{m'}(E_n^{(1)}c^{(0)}_{nm'}+E_n^{(0)}c^{(1)}_{nm'})|\psi^{(0)}_{m'}\rangle

Para el segundo orden, k=2 y k_1=2\wedge k_2=0, k_1=1\wedge k_2=1 y k_1=0\wedge k_2=2, entonces

\sum_m(c^{(2)}_{nm}E^{(0)}_m+c^{(1)}_{nm}V)|\psi^{(0)}_m\rangle=\sum_{m'}(E_n^{(2)}c^{(0)}_{nm'}+E_n^{(1)}c^{(1)}_{nm'}+ E_n^{(0)}c^{(2)}_{nm'})|\psi^{(0)}_{m'}\rangle

Para el tercer orden, k=3 y k_1=3\wedge k_2=0, k_1=2\wedge k_2=1, k_1=1\wedge k_2=2 y k_1=0\wedge k_2=3, entonces

\sum_m(c^{(3)}_{nm}E^{(0)}_m+c^{(2)}_{nm}V)|\psi^{(0)}_m\rangle=\sum_{m'}(E_n^{(3)}c^{(0)}_{nm'}+E_n^{(2)}c^{(1)}_{nm'}+ E_n^{(1)}c^{(2)}_{nm'}+E_n^{(0)}c^{(3)}_{nm'})|\psi^{(0)}_{m'}\rangle

y así sucesivamente hasta el orden que se desee. A partir de las anterior igualdades es posible calcular todos los coeficientes c^{(k)}_{nm} de las combinaciones lineales y las correcciones a las energías E^{k}_n. Para obtenerlas se procede del siguiente modo: primero se usa el hecho que c^{(0)}_{nm}=\delta_{nm} con lo cual, para los tres órdenes respectivamente se tiene,

\sum_mc^{(1)}_{nm}E^{(0)}_m|\psi^{(0)}_m\rangle+V|\psi^{(0)}_n\rangle=E_n^{(1)}|\psi^{(0)}_n\rangle+\sum_{m'}E_n^{(0)}c^{(1)}_{nm'}|\psi^{(0)}_{m'}\rangle
\sum_m(c^{(2)}_{nm}E^{(0)}_m+c^{(1)}_{nm}V)|\psi^{(0)}_m\rangle=E_n^{(2)}|\psi^{(0)}_n\rangle+\sum_{m'}(E_n^{(1)}c^{(1)}_{nm'}+ E_n^{(0)}c^{(2)}_{nm'})|\psi^{(0)}_{m'}\rangle
\sum_m(c^{(3)}_{nm}E^{(0)}_m+c^{(2)}_{nm}V)|\psi^{(0)}_m\rangle=E_n^{(3)}|\psi^{(0)}_n\rangle+\sum_{m'}(E_n^{(2)}c^{(1)}_{nm'}+ E_n^{(1)}c^{(2)}_{nm'}+E_n^{(0)}c^{(3)}_{nm'})|\psi^{(0)}_{m'}\rangle

Para hallar las correcciones a la energía se debe multiplicar por el bra \langle\psi^{(0)}_n| y usar que \langle\psi^{(0)}_n|\psi^{(0)}_n\rangle=1, obteniéndose entonces

c^{(1)}_{nn}E^{(0)}_n+\langle\psi^{(0)}_n|V|\psi^{(0)}_n\rangle=E_n^{(1)}+E_n^{(0)}c^{(1)}_{nn}
c^{(2)}_{nn}E^{(0)}_n+\sum_mc^{(1)}_{nm}\langle\psi^{(0)}_n|V|\psi^{(0)}_m\rangle=E_n^{(2)}+(E_n^{(1)}c^{(1)}_{nn}+ E_n^{(0)}c^{(2)}_{nn})
c^{(3)}_{nn}E^{(0)}_n+\sum_mc^{(2)}_{nm}\langle\psi^{(0)}_n|V|\psi^{(0)}_m\rangle=E_n^{(3)}+(E_n^{(2)}c^{(1)}_{nn}+ E_n^{(1)}c^{(2)}_{nn}+E_n^{(0)}c^{(3)}_{nn})

Reordenando las anteriores expresiones y despejando para la corrección deseada se tiene

E_n^{(1)}=\langle\psi^{(0)}_n|V|\psi^{(0)}_n\rangle
E_n^{(2)}=\sum_mc^{(1)}_{nm}\langle\psi^{(0)}_n|V|\psi^{(0)}_m\rangle-E_n^{(1)}c^{(1)}_{nn}
E_n^{(3)}=\sum_mc^{(2)}_{nm}\langle\psi^{(0)}_nV|\psi^{(0)}_m\rangle-(E_n^{(2)}c^{(1)}_{nn}+ E_n^{(1)}c^{(2)}_{nn})

De este modo se han obtenido las correcciones para las energías en términos de relaciones recursivas partiendo de la primera corrección cuyo valor es el elemento de matriz E_n^{(1)}=\langle\psi^{(0)}_n|V|\psi^{(0)}_n\rangle. Las correcciones también dependen de los coeficientes de las combinaciones lineales. Estos pueden ser hallados con un razonamiento similar, en efecto, si en vez de haber multiplicar por \langle\psi^{(0)}_n| se multiplica por \langle\psi^{(0)}_l| con l\neq n se tiene

c^{(1)}_{nl}E^{(0)}_l+\langle\psi^{(0)}_l|V|\psi^{(0)}_n\rangle=E_n^{(0)}c^{(1)}_{nl}
c^{(2)}_{nl}E^{(0)}_l+\sum_mc^{(1)}_{nm}\langle\psi^{(0)}_l|V|\psi^{(0)}_m\rangle=E_n^{(1)}c^{(1)}_{nl}+ E_n^{(0)}c^{(2)}_{nl}
c^{(3)}_{nl}E^{(0)}_l+\sum_mc^{(2)}_{nm}\langle\psi^{(0)}_l|V|\psi^{(0)}_m\rangle=E_n^{(2)}c^{(1)}_{nl}+ E_n^{(1)}c^{(2)}_{nl}+E_n^{(0)}c^{(3)}_{nl}

Reordenando para este caso

c^{(1)}_{nl}=\frac{\langle\psi^{(0)}_l|V|\psi^{(0)}_n\rangle}{E_n^{(0)}-E^{(0)}_l}
c^{(2)}_{nl}=\frac{\sum_mc^{(1)}_{nm}\langle\psi^{(0)}_l|V|\psi^{(0)}_m\rangle-E_n^{(1)}c^{(1)}_{nl}}{E_n^{(0)}-E^{(0)}_l}
c^{(3)}_{nl}=\frac{\sum_mc^{(2)}_{nm}\langle\psi^{(0)}_l|V|\psi^{(0)}_m\rangle-(E_n^{(2)}c^{(1)}_{nl}+ E_n^{(1)}c^{(2)}_{nl})}{E_n^{(0)}-E^{(0)}_l}

Los coeficientes c^{(k)}_{nn} se calculan por normalización del estado |\psi_n\rangle. Una vez obtenidos todos los coeficientes y las correcciones a la energía del orden deseado se los reemplaza en las expresiones expuestas inicialmente para determinar los autoestados de H y las autoenergías de dicho operados, respectivamente.

Por ejemplo, si se desea calcular la corrección para la energía a primer orden y los autoestados correspondientes, las expresiones

|\psi_n\rangle=\sum_m\sum_k\lambda^kc^{(k)}_{nm}|\psi^{(0)}_m\rangle y E_n=\sum_k\lambda^kE_n^{(k)}

se cortan para k=1 quedando

|\psi_n\rangle=\sum_mc^{(0)}_{nm}|\psi^{(0)}_m\rangle+\sum_mc^{(1)}_{nm}|\psi^{(0)}_m\rangle y E_n=E_n^{(0)}+E_n^{(1)}

luego, se reemplazan los resultados antes hallados

|\psi_n\rangle=(1+c^{(1)}_{nn})|\psi^{(0)}_n\rangle+\sum_{m\neq n}\frac{\langle\psi^{(0)}_l|V|\psi^{(0)}_n\rangle}{E_n^{(0)}-E^{(0)}_l}|\psi^{(0)}_m\rangle y E_n=E_n^{(0)}+\langle\psi^{(0)}_n|V|\psi^{(0)}_n\rangle

y se obtienen las aproximaciones de los estados y las energías para el problema con la perturbación V.

Caso degenerado[editar]

Ahora veamos el caso en que el operador no perturbado \displaystyle{\hat H_0} posea valores propios degenerados. Llamemos |\psi_n^k \rangle a estas autofunciones (que tomaremos ortonormales \langle\psi_n^p|\psi_m^k\rangle=\delta_{nm}\delta_{kp} ) asociadas al autovalor \displaystyle{E_n^{(0)}}.

\hat H_0 |\psi_n^k\rangle=E_n^{(0)} |\psi_n^k\rangle

Debemos recordar que las combinaciones lineales de los autoestados degenerados de un mismo nivel energético forman un subespacio vectorial del espacio de Hilbert del sistema físico. Es decir, cualquier combinación lineal de los estados |\psi_n^k \rangle es a su vez un autoestado de \displaystyle{\hat H_0} con el mismo autovalor. En este caso surgen complicaciones matemáticas que nos obligan a considerar solamente las aproximaciones al primer orden en la energía y a orden cero en las autofunciones. En efecto, buscamos resolver:

(\hat H_0+\lambda \hat V)|\psi\rangle=E|\psi\rangle

Donde asumimos que podemos escribir

|\psi\rangle=\sum_k C_k |\psi_n^k\rangle
E=E_n^{(0)}+\lambda E_n^{(1)}

Donde los coeficientes C_k son de orden cero en \lambda. Reemplazando en la ecuación de Schrödinger:

\sum_k C_k \hat V \psi_n^k=E_n^{(1)} \sum_k C_k \psi_n^k

Haciendo producto interno con |\psi_n^p\rangle y definiendo V_{pk}=\langle \psi_n^p | \hat V | \psi_n^k \rangle obtenemos:

\sum_k V_{pk} C_k=E_n^{(1)} \sum_k C_k \delta_{pk}

Si consideramos la matriz V formada por los elementos matriciales V_{pk} y el vector columna C (de elementos C_k), es fácil darse cuenta que la ecuación anterior puede escribirse en forma matricial:

VC=E_n^{(1)}C

La anterior ecuación es una ecuación de valores propios. Puesto que requerimos soluciones no nulas para las autofunciones debe cumplirse que:

|V-E_n^{(1)}I|=0

La anterior es una ecuación de grado igual al orden de degeneración \displaystyle{g_n} del nivel E_n^{(0)}, y tiene en general \displaystyle{g_n} soluciones diferentes. Estas soluciones van a ser las correcciones (al primer orden en \lambda) de la energía. Los autoestados correspodientes son las soluciones de la ecuaciones para los C_k (téngase en cuenta que en las ecuaciones de este tipo siempre queda una incógnita arbitraria que luego será la que permite la normalización del autoestado). Puesto que en general las soluciones para E_n^{(1)} serán diferentes, ya no habrá degeneración en el sistema perturbado. Se dice que la perturbación rompe la degeneración'. En otros casos, la degeneración puede ser rota en forma parcial, es decir, se puede obtener un sistema de autoestados con una degeneración menor a la original.

Teoría de perturbaciones de muchos cuerpos[editar]

También llamada "teoría de perturbaciones de Möller-Plesset" y "teoría de perturbaciones de Rayleigh y Schrödinger", por sus usos tempranos en mecánica cuántica, se le llama "de muchos cuerpos" por su popularidad entre los físicos que trabajan con sistemas infinitos. Para ellos, la consistencia con la talla del problema, que se discute más abajo, es una cuestión de gran importancia, obviamente.

Representación diagramática y consistencia con la talla del problema[editar]

La teoría perturbacional es, como la interacción de configuraciones, un procedimiento sistemático que se puede usar para encontrar la energía de correlación, más allá del nivel Hartree-Fock. La teoría de perturbaciones no es un método variacional, con lo que no da cotas superiores de la energía, sino solamente aproximaciones sucesivamente mejores. En cambio, sí que es consistente con la talla del problema (esto es: la energía de las energías calculadas para dos sistemas es igual a la energía calculada para el sistema suma).

R. P. Feynman ideó una representación diagramática de la teoría de perturbaciones de Rayleigh y Schrödinger, y la aplicó en sus trabajos de electrodinámica cuántica. Inspirado por él, J. Goldstone usó estas representaciones para demostrar la consistencia de la talla (mostró que ciertas contribuciones, que aparentemente rompían la consistencia, se anulaban sistemáticamente a cualquier orden de perturbación).

Con ayuda de estas mismas representaciones, H. P. Kelly llevó a cabo por primera vez la aproximación del par electrónico independiente, sumando ciertas partes de la perturbación (ciertos diagramas) hasta un orden infinito.

Aplicaciones de la teoría perturbacional[editar]

La teoría perturbacional es una herramienta extremadamente importante para la descripción de sistemas cuánticos reales, ya que es muy difícil encontrar soluciones exactas a la ecuación de Schrödinger a partir de hamiltonianos de complejidad moderada. De hecho, la mayoría de los hamiltonianos para los que se conocen funciones exactas, como el átomo de hidrógeno, el oscilador armónico cuántico y la partícula en una caja están demasiado idealizados como para describir a sistemas reales. A través de la teoría de las perturbaciones, es posible usar soluciones de hamiltonianos simples para generar soluciones para un amplio espectro de sistemas complejos. Por ejemplo, añadiendo un pequeño potencial eléctrico perturbativo al modelo mecanocuántico del átomo de hidrógeno, se pueden calcular las pequeñas desviaciones en las líneas espectrales del hidrógeno causadas por un campo eléctrico (el efecto Stark). (Hay que notar que, estrictamente, si el campo eléctrico externo fuera uniforme y se extendiera al infinito, no habría estado enlazado, y los electrones terminarían saliendo del átomo por efecto túnel, por débil que fuera el campo. El efecto Stark es una pseudoaproximación.)

Las soluciones que produce la teoría perturbacional no son exactas, pero con frecuencia son extremadamente acertadas. Típicamente, el resultado se expresa en términos de una expansión polinómica infinita que converge rápidamente al valor exacto cuando se suma hasta un grado alto (generalmente, de forma asintótica). En la teoría de la electrodinámica cuántica, en la que la interacción electrón - fotón se trata pertrubativamente, el cálculo del momento magnético del electrón está de acuerdo con los resultados experimentales hasta las primeras 11 cifras significativas. En electrodinámica cuántica y en teoría cuántica de campos, se usan técnicas especiales de cálculo, conocidas como diagramas de Feynman, para sumar de forma sistemática los términos de las series polinómicas.

Bajo ciertas circunstancias, la teoría perturbacional no es camino adecuado. Este es el caso cuando el sistema en estudio no se puede describir por una pequeña perturbación impuesta a un sistema simple. En cromodinámica cuántica, por ejemplo, la interacción de los quarks con el campo de los gluones no puede tratarse perturbativamente a bajas energías, porque la energía de interacción se hace demasiado grande. La teoría de perturbaciones tampoco puede describir estados con una generación no-continua, incluyendo estados enlazados y varios fenómenos colectivos como los solitones. Un ejemplo sería un sistema de partículas libres (sin interacción), en las que se introduce una interacción atractiva. Dependiendo de la forma de la interacción, se puede generar un conjunto de estados propios completamente nuevo, que correspondería a grupos de partículas enlazadas unas a otras. Un ejemplo de este fenómeno puede encontrarse en la superconductividad convencional, en la que la atracción entre electrones de conducción mediada por fonones lleva a la formación de electrones fuertemente correlacionados, conocidos como pares de Cooper. Con este tipo de sistemas, se debe usar otros esquemas de aproximación, como el método variacional o la aproximación WKB.

El problema de los sistemas no perturbativos ha sido aliviado por el advenimiento de los ordenadores modernos. Ahora es posible obtener soluciones numéricas, no perturbativas para ciertos problemas, usando métodos como la Teoría del Funcional de la Densidad (DFT). Estos avances han sido de particular utilidad para el campo de la química cuántica. También se han usado ordenadores para llevar a cabo cálculos de teoría perturbacional a niveles extraordinariamente altos de precisión, algo importante en física de partículas para obtener resultados comparables a los resultados experimentales.

Véase también[editar]