Espacio secuencial (evolución)

De Wikipedia, la enciclopedia libre

En biología evolutiva, el espacio secuencial es una forma de representar todas las secuencias posibles (para una proteína, gen o genoma).[1][2]​ El espacio de secuencia tiene una dimensión por aminoácido o nucleótido en la secuencia que conduce a espacios altamente dimensionales.[3][4]

La mayoría de las secuencias en el espacio secuencial no tienen función, dejando regiones relativamente pequeñas que están pobladas por genes naturales.[5]​ Cada secuencia de proteína es adyacente a todas las demás secuencias a las que se puede llegar a través de una sola mutación. Se ha estimado que la vida en la Tierra ha explorado todo el espacio funcional de secuencias de proteínas.[6]​ La evolución se puede visualizar como el proceso de muestrear secuencias cercanas en el espacio de secuencia y moverse a cualquiera con una mejor aptitud sobre la actual.

Representación[editar]

Un espacio de secuencia generalmente se presenta como una cuadrícula. Para los espacios secuencial de proteínas, cada residuo en la proteína está representado por una dimensión con 20 posibles posiciones a lo largo de ese eje correspondiente a los posibles aminoácidos.[3][4]​ Por lo tanto, hay 400 posibles dipéptidos dispuestos en un espacio de 20x20, pero eso se expande a 10130 para que incluso una pequeña proteína de 100 aminoácidos se organice en un espacio con 100 dimensiones. Aunque tal multidimensionalidad abrumadora no se puede visualizar o representar esquemáticamente, proporciona un modelo abstracto útil para pensar sobre el rango de proteínas y la evolución de una secuencia a otra.

Estos espacios altamente multidimensionales se pueden comprimir a 2 o 3 dimensiones mediante el análisis de componentes principales. Un paisaje de fitness es simplemente un espacio de secuencia con un eje vertical adicional de fitness agregado para cada secuencia.[7]

El espacio de secuencia de proteínas se puede representar como un espacio con n dimensiones, donde n es el número de aminoácidos en la proteína. Cada eje tiene 20 posiciones que representan los 20 aminoácidos. Hay 400 posibles proteínas de 2 aminoácidos (dipéptido) que se pueden organizar en una cuadrícula 2D. Los 8000 tripéptidos se pueden organizar en un cubo 3D. La mayoría de las proteínas tienen más de 100 aminoácidos y, por lo tanto, ocupan grandes espacios multidimensionales que contienen un número astronómico de secuencias de proteínas.

Secuencias funcionales en el espacio de secuencias[editar]

A pesar de la diversidad de las superfamilias de proteínas, el espacio de secuencia está extremadamente escasamente poblado por proteínas funcionales. La mayoría de las secuencias de proteínas aleatorias no tienen pliegue ni función.[8]​ Las superfamilias de enzimas, por lo tanto, existen como pequeños grupos de proteínas activas en un vasto espacio vacío de secuencia no funcional.[9][10]

La densidad de proteínas funcionales en el espacio de secuencia y la proximidad de diferentes funciones entre sí es un determinante clave para comprender la capacidad de evolución.[11]​ El grado de interpenetración de dos redes neutrales de diferentes actividades en el espacio secuencial determinará cuán fácil es evolucionar de una actividad a otra. Cuanta más superposición entre diferentes actividades en el espacio de secuencia, mayor será la variación críptica para la actividad promiscua.[12]

El espacio de secuencia de proteínas se ha comparado con la Biblioteca de Babel, una biblioteca teórica que contiene todos los libros posibles que tienen 410 páginas.[13][14]​ En la Biblioteca de Babel, encontrar cualquier libro que tuviera sentido era imposible debido al gran número y la falta de orden. Lo mismo sería cierto para las secuencias de proteínas si no fuera por la selección natural, que ha seleccionado solo secuencias de proteínas que tienen sentido. Además, cada secuencia de proteínas está rodeada por un conjunto de vecinos (mutantes puntuales) que probablemente tengan al menos alguna función.

Véase también[editar]

Referencias[editar]

  1. DePristo, Mark A.; Weinreich, Daniel M.; Hartl, Daniel L. (2 de agosto de 2005). «Missense meanderings in sequence space: a biophysical view of protein evolution». Nature Reviews Genetics 6 (9): 678-687. PMID 16074985. doi:10.1038/nrg1672. 
  2. Maynard Smith, John (7 de febrero de 1970). «Natural Selection and the Concept of a Protein Space». Nature 225 (5232): 563-564. PMID 5411867. doi:10.1038/225563a0. 
  3. a b Bornberg-Bauer, E.; Chan, H. S. (14 de septiembre de 1999). «Modeling evolutionary landscapes: Mutational stability, topology, and superfunnels in sequence space». Proceedings of the National Academy of Sciences 96 (19): 10689-10694. PMC 17944. PMID 10485887. doi:10.1073/pnas.96.19.10689. 
  4. a b Cordes, MH; Davidson, AR; Sauer, RT (Feb 1996). «Sequence space, folding and protein design.». Current Opinion in Structural Biology 6 (1): 3-10. PMID 8696970. doi:10.1016/S0959-440X(96)80088-1. 
  5. Hermes, JD; Blacklow, SC; Knowles, JR (Jan 1990). «Searching sequence space by definably random mutagenesis: improving the catalytic potency of an enzyme.». Proceedings of the National Academy of Sciences of the United States of America 87 (2): 696-700. PMC 53332. PMID 1967829. doi:10.1073/pnas.87.2.696. 
  6. http://rsif.royalsocietypublishing.org/content/5/25/953
  7. Romero, PA; Arnold, FH (Dec 2009). «Exploring protein fitness landscapes by directed evolution.». Nature Reviews Molecular Cell Biology 10 (12): 866-76. PMC 2997618. PMID 19935669. doi:10.1038/nrm2805. 
  8. Keefe, AD; Szostak, JW (Apr 5, 2001). «Functional proteins from a random-sequence library.». Nature 410 (6829): 715-8. PMC 4476321. PMID 11287961. doi:10.1038/35070613. 
  9. Stemmer, Willem P. C. (June 1995). «Searching Sequence Space». Bio/Technology 13 (6): 549-553. doi:10.1038/nbt0695-549. 
  10. Bornberg-Bauer, E (Nov 1997). «How are model protein structures distributed in sequence space?». Biophysical Journal 73 (5): 2393-403. PMC 1181141. PMID 9370433. doi:10.1016/S0006-3495(97)78268-7. 
  11. Bornberg-Bauer, E; Huylmans, AK; Sikosek, T (Jun 2010). «How do new proteins arise?». Current Opinion in Structural Biology 20 (3): 390-6. PMID 20347587. doi:10.1016/j.sbi.2010.02.005. 
  12. Wagner, Andreas (14 de julio de 2011). The origins of evolutionary innovations : a theory of transformative change in living systems. Oxford [etc.]: Oxford University Press. ISBN 978-0199692590. 
  13. Arnold, FH (2000). «The Library of Maynard-Smith: My Search for Meaning in the protein universe». Advances in Protein Chemistry 55: ix-xi. PMID 11050930. doi:10.1016/s0065-3233(01)55000-7. 
  14. Ostermeier, M (March 2007). «Beyond cataloging the Library of Babel.». Chemistry & Biology 14 (3): 237-8. PMID 17379136. doi:10.1016/j.chembiol.2007.03.002.