Diferencia entre revisiones de «Índice de fijación»

De Wikipedia, la enciclopedia libre
Contenido eliminado Contenido añadido
InternetArchiveBot (discusión · contribs.)
Rescatando 1 referencia(s) y marcando 0 enlace(s) como roto(s)) #IABot (v2.0
Creado al traducir la página «Fixation index»
Línea 1: Línea 1:
El '''índice de fijación''' ('''F<sub>ST</sub>''') es una medida de la [[ Diferenciación poblacional |diferenciación de la población]] debido a la [[ Estructura genética |estructura genética]]. Con frecuencia se estima a partir de datos de [[Polimorfismo (biología)|polimorfismo genético]], como [[Polimorfismo de nucleótido único|polimorfismos de un solo nucleótido]] (SNP) o [[Microsatélite|microsatélites]]. Desarrollado como un caso especial de las [[Estadístico F|estadísticas F]] de [[Sewall Green Wright|Wright]], es una de las estadísticas más utilizadas en [[genética de poblaciones]].
El '''índice de fijación''', representado como '''''F<sub>st</sub>''''', es un valor estadístico empleado para evaluar el nivel de diferenciación genética entre poblaciones.


== Definición ==
Se trata de un término acuñado por el genetista estadounidense [[Sewall Wright]] y que forma parte de lo que se denominan [[estadísticos F de Wright]]. El índice de fijación es un componente generado por el balance que se establece entre el [[flujo genético]] (por ejemplo debido a migraciones) y la [[deriva genética]],<ref>{{Cita web |url=http://www.ecotips.com.mx/Bioconservacion/EguarteFlujogenetico.pdf |título=Flujo génico, diferenciación y estructura genética de las poblaciones, con ejemplos en especies de plantas mexicanas |fechaacceso=21 de febrero de 2016 |urlarchivo=https://web.archive.org/web/20160303032633/http://www.ecotips.com.mx/Bioconservacion/EguarteFlujogenetico.pdf |fechaarchivo=3 de marzo de 2016 }}</ref> que en poblaciones aisladas genéticamente, (ya sea por creencias religiosas, políticas o [[aislamiento geográfico]]) pueden tener un efecto importante en la estructura genética de los individuos que las componen. Teniendo esto último en cuenta, también se utiliza como definición del índice de fijación lo siguiente: "probabilidad de poseer dos [[alelos]] idénticos por descendencia (es decir, heredados o procedentes de un alelo común ancestral) en un determinado [[locus]]."
Dos de las definiciones más comúnmente usadas para F<sub>ST</sub> en un locus dado se basan en la varianza de las [[Frecuencia alélica|frecuencias alélicas]] entre las poblaciones y en la probabilidad de [[ Identidad por descendencia |Identidad por descendencia]].

Si <math>\bar{p}</math> es la frecuencia promedio de un alelo en la población total, <math>\sigma^2_S</math> es la varianza en la frecuencia del alelo entre diferentes subpoblaciones, ponderada por los tamaños de las subpoblaciones, y <math>\sigma^2_T</math> es la varianza del estado alélico en la población total, F<sub>ST</sub> se define como<ref>{{Cita publicación|título=Genetics in geographically structured populations: defining, estimating and interpreting FST|apellidos=Holsinger|nombre=Kent E.|apellidos2=Bruce S. Weir|publicación=Nat Rev Genet|volumen=10|número=9|páginas=639–650|issn=1471-0056|doi=10.1038/nrg2611|pmc=4687486|pmid=19687804|año=2009}}</ref>

: <math> F_{ST} = \frac{\sigma^2_S}{\sigma^2_T} = \frac{\sigma^2_S}{\bar{p}(1-\bar{p})}</math>

La definición de [[Sewall Green Wright|Wright]] ilustra que F<sub>ST</sub> mide la cantidad de variación genética que puede explicarse por la estructura de la población. Esto también puede considerarse como la fracción de la diversidad total que no es consecuencia de la diversidad promedio dentro de las subpoblaciones, donde la diversidad se mide por la probabilidad de que dos alelos seleccionados al azar sean diferentes, a saber <math>2p(1-p)</math> . Si la frecuencia del alelo en el <math>i</math> la población es <math>p_i</math> y el tamaño relativo de la <math>i</math> la población es <math>c_i</math>, luego

: <math> F_{ST} = \frac{\bar{p}(1-\bar{p})-\sum c_i p_i(1-p_i)}{\bar{p}(1-\bar{p})} = \frac{\bar{p}(1-\bar{p})- \overline{p(1-p)}}{\bar{p}(1-\bar{p})}</math>

Alternativamente,<ref name="Durrett2008">{{Cita libro|apellidos=Richard Durrett|título=Probability Models for DNA Sequence Evolution|url=https://books.google.com/books?id=o4_bMHy7jFoC|fechaacceso=25 October 2012|fecha=12 August 2008|editorial=Springer|isbn=978-0-387-78168-6}}</ref>

: <math> F_{ST} = \frac{f_0-\bar{f}}{1-\bar{f}}</math>

dónde <math>f_0</math> es la probabilidad de identidad por descendencia de dos individuos dado que los dos individuos están en la misma subpoblación, y <math>\bar{f}</math> es la probabilidad de que dos individuos de la población total sean idénticos por descendencia. Usando esta definición, F<sub>ST</sub> puede interpretarse como una medida de cuánto más cerca están dos individuos de la misma subpoblación, en comparación con la población total. Si la [[ Tasa de mutación |tasa de mutación]] es pequeña, esta interpretación puede hacerse más explícita al vincular la probabilidad de identidad por descendencia con los [[Teoría de la coalescencia|tiempos coalescentes]]: dejemos que T<sub>0</sub> y T denoten el tiempo promedio de coalescencia para individuos de la misma subpoblación y la población total, respectivamente. Luego,

: <math> F_{ST} \approx 1-\frac{T_0}{T}</math>

Esta formulación tiene la ventaja de que el tiempo esperado de coalescencia se puede estimar fácilmente a partir de datos genéticos, lo que condujo al desarrollo de varios estimadores para F<sub>ST</sub>.

== Estimación ==
En la práctica, ninguna de las cantidades utilizadas para las definiciones se puede medir fácilmente. Como consecuencia, se han propuesto varios estimadores. Un estimador particularmente simple aplicable a los datos de secuencia de ADN es:<ref name="Hudson1992">{{Cita publicación|título=Estimation of Levels of Gene Flow from DNA Sequence Data|apellidos=Hudson|nombre=RR.|apellidos2=Slatkin|nombre2=M.|fecha=Oct 1992|publicación=Genetics|volumen=132|número=2|páginas=583–9|doi=|pmc=1205159|pmid=1427045|apellidos3=Maddison|nombre3=WP.}}</ref>

: <math> F_{ST} = \frac{ \pi_\text{Between} - \pi_\text{Within} } { \pi_\text{Between} } </math>

dónde <math> \pi_\text{Between} </math> y <math> \pi_\text{Within} </math> representan el [[ Diversidad de nucleótidos |número promedio de diferencias por pares]] entre dos individuos muestreados de diferentes subpoblaciones (<math> \pi_\text{Between} </math>) o de la misma subpoblación (<math> \pi_\text{Within}</math>) La diferencia promedio por pares dentro de una población se puede calcular como la suma de las diferencias por pares divididas por el número de pares. Sin embargo, este estimador está sesgado cuando los tamaños de muestra son pequeños o si varían entre poblaciones. Por lo tanto, se utilizan métodos más elaborados para calcular F<sub>ST</sub> en la práctica. Dos de los procedimientos más utilizados son el estimador de Weir y Cockerham (1984),<ref name="WeirCockerham1984">{{Cita publicación|título=Estimating F-Statistics for the Analysis of Population Structure|apellidos=Weir|nombre=B. S.|apellidos2=Cockerham|nombre2=C. Clark|publicación=Evolution|volumen=38|número=6|páginas=1358–1370|issn=0014-3820|doi=10.2307/2408641|pmid=28563791|año=1984}}</ref> o la realización de un [[análisis de varianza molecular]].


== Interpretación ==
== Interpretación ==
Esta comparación de la variabilidad genética dentro y entre poblaciones se usa con frecuencia en [[genética de poblaciones]] aplicadas. Los valores van de 0 a 1. Un valor cero implica [[Panmixia|panmixis]] completa; es decir, que las dos poblaciones se cruzan libremente. Un valor de uno implica que toda la variación genética se explica por la estructura de la población, y que las dos poblaciones no comparten ninguna diversidad genética.


Para modelos idealizados como [[ Aislamiento por distancia |el modelo de isla finita de Wright]], F<sub>ST</sub> puede usarse para estimar las tasas de migración. Bajo ese modelo, la tasa de migración es
Se considera que un mayor efecto de la deriva genética derivará una mayor diferenciación genética entre las poblaciones estudiadas y por lo tanto mayor valor de ''F<sub>st</sub>''.


: <math>M = \frac{m}{\mu} \approx\frac{1}{4}\left (\frac{1}{F_{ST}} -1 \right ) </math> ,
De manera que un ''F<sub>st</sub>'' = 0 indica que no existen diferencias genéticas entre las poblaciones estudiadas, mientras que un valor de ''F<sub>st</sub>'' = 1 implica un aislamiento genético entre las mismas, en cuanto a los loci estudiados.


donde {{Mvar|m}} es la tasa de migración por generación, y <math>\mu</math> es la tasa de mutación por generación.<ref>
== Aplicaciones ==
Peter Beerli, [http://evolution.genetics.washington.edu/PBhtmls/NATO/PBChap.pdf Estimation of migration rates and population sizes in geographically structured populations] (1998), Advances in molecular ecology (ed. G. Carvalho). NATO Science Series A: Life Sciences, IOS Press, Amsterdam, 39-53.</ref>


La interpretación de F<sub>ST</sub> puede ser difícil cuando los datos analizados son altamente polimórficos. En este caso, la probabilidad de identidad por descendencia es muy baja y F<sub>ST</sub> puede tener un límite superior arbitrariamente bajo, lo que podría conducir a una mala interpretación de los datos. Además, estrictamente hablando F <sub>ST</sub> no es una [[Métrica (matemáticas)|distancia]] en el sentido matemático, ya que no satisface la [[Desigualdad triangular|desigualdad del triángulo]].
Como ya se ha comentado anteriormente, el valor de ''F<sub>st</sub>'' se utiliza habitualmente en estudios de genética de poblaciones.

Para las poblaciones de [[Plantae|plantas]] que pertenecen claramente a la misma [[especie]], los valores de F<sub>ST</sub> superiores al 15% se consideran diferenciación "grande" o "significativa", mientras que los valores inferiores al 5% se consideran diferenciación "pequeña" o "insignificante".<ref>Frankham, R., Ballou, J.D., Briscoe, D.A., 2002. Introduction to Conservation Genetics. Cambridge University Press, Cambridge.
Un ejemplo reciente, y que representa muy bien lo que más arriba hemos denominado aislamiento genético, lo encontramos en un trabajo publicado en la revista Nature Genetics. En este trabajo, realizado en la población de la isla de [[Cerdeña]], se analizó el valor del índice de fijación con el objetivo de medir la diferenciación de esta población con otras procedentes de Europa, a partir de las cuales se pobló la isla. Los resultados mostraron como existe una clara diferenciación genética entre la población sarda y las distintas poblaciones europeas de procedencia, que puede explicarse por el efecto de la deriva genética y selección natural que sufrió la población de la isla tras el asentamiento inicial.<ref>[http://www.nature.com/ng/journal/v47/n11/full/ng.3368.html Genome sequencing elucidates Sardinian genetic architecture and augments association analyses for lipid and blood inflammatory markers]</ref>
Hartl DL, Clark AG (1997) Principles of Population Genetics, 3nd edn. Sinauer Associates, Inc, Sunderland, MA.</ref> Los valores para poblaciones de [[Mammalia|mamíferos]] entre [[Subespecie|subespecies]], o especies estrechamente relacionadas, son valores típicos del orden del 5% al 20%. F<sub>ST</sub> entre las poblaciones [[Canis lupus lupus|euroasiática]] y norteamericana del [[Canis lupus|lobo gris]] fueron reportadas en 9.9%, aquellas entre las poblaciones de [[Canis lupus|lobo]] [[Canis rufus|rojo]] y [[Canis lupus|lobo gris]] entre 17% y 18%. El [[Canis lycaon|lobo del este]], una "especie similar al lobo" altamente mezclada recientemente reconocida, tiene valores de F<sub>ST</sub> inferiores al 10% en comparación con los lobos grises euroasiáticos (7,6%) y norteamericanos (5,7%), con el lobo rojo (8,5%), e incluso un valor aún más bajo cuando se combina con el [[Canis latrans|Coyote]] (4.5%).<ref>B. M. von Holdt et al., "Whole-genome sequence analysis shows that two endemic species of North American wolf are admixtures of the coyote and gray wolf", ''Science Advances '' 27 Jul 2016: Vol. 2, no. 7, e1501714, doi: 10.1126/sciadv.1501714.</ref>

== F<sub>ST</sub> en humanos ==
Los valores de F<sub>ST</sub> dependen en gran medida de la elección de las poblaciones. Los grupos étnicos estrechamente relacionados, como los [[Pueblo danés|daneses]] frente a los [[Pueblo neerlandés|holandeses]], o los [[Pueblo francés|franceses]] frente a los [[Pueblo español|españoles]] muestran valores significativamente inferiores al 1%, indistinguibles de la panmixia. Dentro de Europa, se ha encontrado que los grupos étnicos más divergentes tienen valores del orden del 7% ([[Samis|Lapps]] vs. [[Pueblo sardo|Sardos]]).

Se encuentran valores más grandes si se comparan grupos homogéneos altamente divergentes: el valor más alto encontrado fue cercano al 46%, entre [[Mbuti]] y [[Papúes|Papuanos]].<ref>Cavalli-Sforza et al. (1994), cited after
V. Ginsburgh, S. Weber, ''The Palgrave Handbook of Economics and Language'', Springer (2016), [https://books.google.ch/books?id=ya3tCwAAQBAJ&pg=PA182 p. 182].</ref>

== Distancias genéticas autosómicas basadas en marcadores clásicos ==
En su estudio ''The History and Geography of Human Genes (1994)'', Cavalli-Sforza, Menozzi y Piazza proporcionan algunas de las estimaciones más detalladas y completas de distancias genéticas entre poblaciones humanas, dentro y a través de los continentes. Su base de datos inicial contiene 76,676 frecuencias de genes (usando 120 polimorfismos sanguíneos), correspondientes a 6,633 muestras en diferentes lugares. Al seleccionar y agrupar tales muestras, restringen su análisis a 491 poblaciones. Se centran en ''las poblaciones aborígenes'' que se encontraban en su ubicación actual a fines del siglo XV, cuando comenzaron las grandes migraciones europeas.<ref>Cavalli-Sforza et al., 1994, p. 24</ref> Cuando se estudia la diferencia genética a nivel mundial, el número se reduce a 42 poblaciones representativas, agregando subpoblaciones caracterizadas por un alto nivel de similitud genética. Para estas 42 poblaciones, Cavalli-Sforza y sus coautores informan distancias bilaterales calculadas a partir de 120 alelos. Entre este conjunto de 42 poblaciones mundiales, la mayor distancia genética observada es entre los pigmeos Mbuti y Papua Nueva Guinea, donde la distancia Fst es 0.4573, mientras que la distancia genética más pequeña (0.0021) es entre los daneses y los ingleses. Cuando se consideran datos más desglosados para 26 poblaciones europeas, la distancia genética más pequeña (0.0009) está entre los holandeses y los daneses, y la más grande (0.0667) está entre los lapones y los sardos. Se encontró que la distancia genética media entre las 861 parejas disponibles de las 42 poblaciones seleccionadas fue de 0.1338. Una distancia genética de 0.1338 implica que el parentesco entre individuos no relacionados de la misma raza en relación con la población mundial es equivalente al parentesco entre medio hermanos en una población de apareamiento aleatorio. Esto también implica que si un humano de una raza dada tiene un medio hermano birracial, ese humano está genéticamente más cerca de un individuo no relacionado de su raza que del medio hermano biracial.<ref>{{Cita web|url=https://pdfs.semanticscholar.org/2978/43c00b89c7d9b18feb463109e4a51eaf139f.pdf|título=Kinship and Population Subdivision|año=2002}}</ref>

=== Distancias genéticas autosómicas basadas en SNP ===
Un estudio de 2012 basado en datos del [[Proyecto HapMap|Proyecto Internacional HapMap]] estimó F<sub>ST</sub> entre las tres principales poblaciones "continentales" de [[Caucasoide|europeos]] (combinados de residentes de Utah de ascendencia del norte y oeste de Europa de la colección CEPH e italianos de Toscana), [[Pueblos de Asia Oriental|asiáticos orientales]] (combinando chinos Han de Beijing, chinos del área metropolitana de Denver y japoneses de Tokio, Japón) y [[África subsahariana|africanos subsaharianos]] (combinando [[ Pueblo luhya |Luhya]] de Webuye, Kenia, [[Masái|Maasai]] de Kinyawa, Kenia y [[Pueblo yoruba|Yoruba]] de Ibadan, Nigeria). Informó un valor cercano al 12% entre las poblaciones continentales, y valores cercanos a la [[panmixia]] (menor al 1%) dentro de las poblaciones continentales.<ref>{{Cita publicación|título=Empirical Distributions of FST from Large-Scale Human Polymorphism Data|apellidos=Elhaik|nombre=Eran|publicación=PLOS One|volumen=7|número=11|páginas=e49837|bibcode=2012PLoSO...749837E|doi=10.1371/journal.pone.0049837|pmc=3504095|pmid=23185452|año=2012}}</ref>
{| class="wikitable" style="text-align:center; width:80%;"
|+ Distancias genéticas autosómicas intercontinentales basadas en SNP<ref name="nelis">{{Cita publicación|título=Genetic Structure of Europeans: A View from the North–East|apellidos=Nelis|nombre=Mari|fecha=2009-05-08|publicación=PLOS ONE|volumen=4|número=5|páginas=e5472|apellidos-editor=Fleischer|nombre-editor=Robert C.|bibcode=2009PLoSO...4.5472N|doi=10.1371/journal.pone.0005472|pmc=2675054|pmid=19424496|número-autores=etal}}, [http://www.plosone.org/article/fetchSingleRepresentation.action?uri=info:doi/10.1371/journal.pone.0005472.s003 see table]</ref>
! scope="col" |
! scope="col" | Europa (CEU)
! scope="col" | África subsahariana (yoruba)
! scope="col" | Asia oriental (japonés)
|-
! scope="row" | África subsahariana (yoruba)
| 0,153
|
|
|-
! scope="row" | Asia oriental (japonés)
| 0.111
| 0,190
|
|-
! scope="row" | Asia oriental (chino)
| 0.110
| 0,192
| 0.007
|-
|}
{| class="wikitable" style="text-align:center; width:80%;"
|+ Distancias genéticas autosómicas intraeuropeas / mediterráneas basadas en SNP <ref name="nelis">{{Cita publicación|título=Genetic Structure of Europeans: A View from the North–East|apellidos=Nelis|nombre=Mari|fecha=2009-05-08|publicación=PLOS ONE|volumen=4|número=5|páginas=e5472|apellidos-editor=Fleischer|nombre-editor=Robert C.|bibcode=2009PLoSO...4.5472N|doi=10.1371/journal.pone.0005472|pmc=2675054|pmid=19424496|número-autores=etal}}, [http://www.plosone.org/article/fetchSingleRepresentation.action?uri=info:doi/10.1371/journal.pone.0005472.s003 see table]</ref> <ref>{{Cita publicación|título=European Population Genetic Substructure: Further Definition of Ancestry Informative Markers for Distinguishing among Diverse European Ethnic Groups|apellidos=Tian|nombre=Chao|fecha=November 2009|publicación=Molecular Medicine|volumen=15|número=11–12|páginas=371–383|issn=1076-1551|doi=10.2119/molmed.2009.00094|pmc=2730349|pmid=19707526|número-autores=etal}}, [https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2730349/table/t1-09_94_tian/ see table]</ref>
! scope="col" |
! scope="col" | Italianos
! scope="col" | Palestinos
! scope="col" | Suecos
! scope="col" | Finlandeses
! scope="col" | Españoles
! scope="col" | Alemanes
! scope="col" | Rusos
! scope="col" | Franceses
! scope="col" | Griegos
|-
! scope="row" | Palestinos
| 0.0064
|
|
|
|
|
|
|
|
|-
! scope="row" | Suecos
| 0.0064-0.0090
| 0,0191
|
|
|
|
|
|
|
|-
! scope="row" | Finlandeses
| 0.0130-0.0230
|
| 0.0050-0.0110
|
|
|
|
|
|
|-
! scope="row" | Españoles
| 0.0010-0.0050
| 0,0101
| 0.0040-0055
| 0.0110-0.0170
|
|
|
|
|
|-
! scope="row" | Alemanes
| 0.0029-0.0080
| 0,0136
| 0.0007-0.0010
| 0.0060-0.0130
| 0.0015-0.0030
|
|
|
|
|-
! scope="row" | Rusos
| 0.0088-0.0120
| 0,0202
| 0.0030-0.0036
| 0.0060-0.0120
| 0.0070-0.0079
| 0.0030-0.0037
|
|
|
|-
! scope="row" | Franceses
| 0.0030-0.0050
|
| 0.0020
| 0.0080-0.0150
| 0.0010
| 0.0010
| 0.0050
|
|
|-
! scope="row" | Griegos
| 0.0000
| 0.0057
| 0.0084
|
| 0.0035
| 0.0039
| 0,0108
|
|
|-
|}

== Programas para calcular F<sub>ST</sub> ==

* [[Arlequin]]
* [[ FSTAT (software) |Fstat]]
* [https://web.archive.org/web/20110718091946/http://people.bu.edu/ngcrawfo/smogd/ SMOGD] <ref>{{Cita publicación|título=<span style="font-variant: small-caps;">smogd</span>: software for the measurement of genetic diversity|apellidos=Crawford|nombre=Nicholas G.|publicación=[[Molecular Ecology Resources]]|volumen=10|número=3|páginas=556–557|doi=10.1111/j.1755-0998.2009.02801.x|pmc=|pmid=21565057|año=2010}}</ref>
* [https://cran.r-project.org/package=diveRsity diveRsity] (paquete R)
* [https://cran.r-project.org/package=hierfstat hierfstat] (paquete R)
* [https://cran.r-project.org/package=FinePop FinePop] <ref>{{Cita publicación|título=Empirical Bayes inference of pairwise F(ST) and its distribution in the genome|publicación=Genetics|volumen=177|número=2|páginas=861–73|doi=10.1534/genetics.107.077263|pmc=2034649|pmid=17660541|año=2007}}</ref> (paquete R)
* [http://i122server.vu-wien.ac.at/MSA/info.html/MSA_info.html Analizador de microsatélites (MSA)]
* [http://vcftools.sourceforge.net/index.html VCFtools]
* DnaSP

== Módulos para calcular F <sub>ST</sub> ==

* [http://biopython.org/wiki/PopGen_Genepop BioPython]
* BioPerl


== Referencias ==
== Referencias ==
{{listaref}}
{{Listaref}}

=== Otras lecturas ===
 

== Enlaces externos ==


* [https://web.archive.org/web/20150424112002/http://www.bioperl.org/wiki/HOWTO:PopGen#Population_Statistics_using_Bio::PopGen::PopStats BioPerl - Bio :: PopGen :: PopStats]
{{Control de autoridades}}
[[Categoría:Genética de poblaciones]]
[[Categoría:Genética de poblaciones]]
[[Categoría:Wikipedia:Páginas con traducciones sin revisar]]

Revisión del 21:33 25 mar 2020

El índice de fijación (FST) es una medida de la diferenciación de la población debido a la estructura genética. Con frecuencia se estima a partir de datos de polimorfismo genético, como polimorfismos de un solo nucleótido (SNP) o microsatélites. Desarrollado como un caso especial de las estadísticas F de Wright, es una de las estadísticas más utilizadas en genética de poblaciones.

Definición

Dos de las definiciones más comúnmente usadas para FST en un locus dado se basan en la varianza de las frecuencias alélicas entre las poblaciones y en la probabilidad de Identidad por descendencia.

Si es la frecuencia promedio de un alelo en la población total, es la varianza en la frecuencia del alelo entre diferentes subpoblaciones, ponderada por los tamaños de las subpoblaciones, y es la varianza del estado alélico en la población total, FST se define como[1]

La definición de Wright ilustra que FST mide la cantidad de variación genética que puede explicarse por la estructura de la población. Esto también puede considerarse como la fracción de la diversidad total que no es consecuencia de la diversidad promedio dentro de las subpoblaciones, donde la diversidad se mide por la probabilidad de que dos alelos seleccionados al azar sean diferentes, a saber . Si la frecuencia del alelo en el la población es y el tamaño relativo de la la población es , luego

Alternativamente,[2]

dónde es la probabilidad de identidad por descendencia de dos individuos dado que los dos individuos están en la misma subpoblación, y es la probabilidad de que dos individuos de la población total sean idénticos por descendencia. Usando esta definición, FST puede interpretarse como una medida de cuánto más cerca están dos individuos de la misma subpoblación, en comparación con la población total. Si la tasa de mutación es pequeña, esta interpretación puede hacerse más explícita al vincular la probabilidad de identidad por descendencia con los tiempos coalescentes: dejemos que T0 y T denoten el tiempo promedio de coalescencia para individuos de la misma subpoblación y la población total, respectivamente. Luego,

Esta formulación tiene la ventaja de que el tiempo esperado de coalescencia se puede estimar fácilmente a partir de datos genéticos, lo que condujo al desarrollo de varios estimadores para FST.

Estimación

En la práctica, ninguna de las cantidades utilizadas para las definiciones se puede medir fácilmente. Como consecuencia, se han propuesto varios estimadores. Un estimador particularmente simple aplicable a los datos de secuencia de ADN es:[3]

dónde y representan el número promedio de diferencias por pares entre dos individuos muestreados de diferentes subpoblaciones () o de la misma subpoblación () La diferencia promedio por pares dentro de una población se puede calcular como la suma de las diferencias por pares divididas por el número de pares. Sin embargo, este estimador está sesgado cuando los tamaños de muestra son pequeños o si varían entre poblaciones. Por lo tanto, se utilizan métodos más elaborados para calcular FST en la práctica. Dos de los procedimientos más utilizados son el estimador de Weir y Cockerham (1984),[4]​ o la realización de un análisis de varianza molecular.

Interpretación

Esta comparación de la variabilidad genética dentro y entre poblaciones se usa con frecuencia en genética de poblaciones aplicadas. Los valores van de 0 a 1. Un valor cero implica panmixis completa; es decir, que las dos poblaciones se cruzan libremente. Un valor de uno implica que toda la variación genética se explica por la estructura de la población, y que las dos poblaciones no comparten ninguna diversidad genética.

Para modelos idealizados como el modelo de isla finita de Wright, FST puede usarse para estimar las tasas de migración. Bajo ese modelo, la tasa de migración es

,

donde m es la tasa de migración por generación, y es la tasa de mutación por generación.[5]

La interpretación de FST puede ser difícil cuando los datos analizados son altamente polimórficos. En este caso, la probabilidad de identidad por descendencia es muy baja y FST puede tener un límite superior arbitrariamente bajo, lo que podría conducir a una mala interpretación de los datos. Además, estrictamente hablando F ST no es una distancia en el sentido matemático, ya que no satisface la desigualdad del triángulo.

Para las poblaciones de plantas que pertenecen claramente a la misma especie, los valores de FST superiores al 15% se consideran diferenciación "grande" o "significativa", mientras que los valores inferiores al 5% se consideran diferenciación "pequeña" o "insignificante".[6]​ Los valores para poblaciones de mamíferos entre subespecies, o especies estrechamente relacionadas, son valores típicos del orden del 5% al 20%. FST entre las poblaciones euroasiática y norteamericana del lobo gris fueron reportadas en 9.9%, aquellas entre las poblaciones de lobo rojo y lobo gris entre 17% y 18%. El lobo del este, una "especie similar al lobo" altamente mezclada recientemente reconocida, tiene valores de FST inferiores al 10% en comparación con los lobos grises euroasiáticos (7,6%) y norteamericanos (5,7%), con el lobo rojo (8,5%), e incluso un valor aún más bajo cuando se combina con el Coyote (4.5%).[7]

FST en humanos

Los valores de FST dependen en gran medida de la elección de las poblaciones. Los grupos étnicos estrechamente relacionados, como los daneses frente a los holandeses, o los franceses frente a los españoles muestran valores significativamente inferiores al 1%, indistinguibles de la panmixia. Dentro de Europa, se ha encontrado que los grupos étnicos más divergentes tienen valores del orden del 7% (Lapps vs. Sardos).

Se encuentran valores más grandes si se comparan grupos homogéneos altamente divergentes: el valor más alto encontrado fue cercano al 46%, entre Mbuti y Papuanos.[8]

Distancias genéticas autosómicas basadas en marcadores clásicos

En su estudio The History and Geography of Human Genes (1994), Cavalli-Sforza, Menozzi y Piazza proporcionan algunas de las estimaciones más detalladas y completas de distancias genéticas entre poblaciones humanas, dentro y a través de los continentes. Su base de datos inicial contiene 76,676 frecuencias de genes (usando 120 polimorfismos sanguíneos), correspondientes a 6,633 muestras en diferentes lugares. Al seleccionar y agrupar tales muestras, restringen su análisis a 491 poblaciones. Se centran en las poblaciones aborígenes que se encontraban en su ubicación actual a fines del siglo XV, cuando comenzaron las grandes migraciones europeas.[9]​ Cuando se estudia la diferencia genética a nivel mundial, el número se reduce a 42 poblaciones representativas, agregando subpoblaciones caracterizadas por un alto nivel de similitud genética. Para estas 42 poblaciones, Cavalli-Sforza y sus coautores informan distancias bilaterales calculadas a partir de 120 alelos. Entre este conjunto de 42 poblaciones mundiales, la mayor distancia genética observada es entre los pigmeos Mbuti y Papua Nueva Guinea, donde la distancia Fst es 0.4573, mientras que la distancia genética más pequeña (0.0021) es entre los daneses y los ingleses. Cuando se consideran datos más desglosados para 26 poblaciones europeas, la distancia genética más pequeña (0.0009) está entre los holandeses y los daneses, y la más grande (0.0667) está entre los lapones y los sardos. Se encontró que la distancia genética media entre las 861 parejas disponibles de las 42 poblaciones seleccionadas fue de 0.1338. Una distancia genética de 0.1338 implica que el parentesco entre individuos no relacionados de la misma raza en relación con la población mundial es equivalente al parentesco entre medio hermanos en una población de apareamiento aleatorio. Esto también implica que si un humano de una raza dada tiene un medio hermano birracial, ese humano está genéticamente más cerca de un individuo no relacionado de su raza que del medio hermano biracial.[10]

Distancias genéticas autosómicas basadas en SNP

Un estudio de 2012 basado en datos del Proyecto Internacional HapMap estimó FST entre las tres principales poblaciones "continentales" de europeos (combinados de residentes de Utah de ascendencia del norte y oeste de Europa de la colección CEPH e italianos de Toscana), asiáticos orientales (combinando chinos Han de Beijing, chinos del área metropolitana de Denver y japoneses de Tokio, Japón) y africanos subsaharianos (combinando Luhya de Webuye, Kenia, Maasai de Kinyawa, Kenia y Yoruba de Ibadan, Nigeria). Informó un valor cercano al 12% entre las poblaciones continentales, y valores cercanos a la panmixia (menor al 1%) dentro de las poblaciones continentales.[11]

Distancias genéticas autosómicas intercontinentales basadas en SNP[12]
Europa (CEU) África subsahariana (yoruba) Asia oriental (japonés)
África subsahariana (yoruba) 0,153
Asia oriental (japonés) 0.111 0,190
Asia oriental (chino) 0.110 0,192 0.007
Distancias genéticas autosómicas intraeuropeas / mediterráneas basadas en SNP [12][13]
Italianos Palestinos Suecos Finlandeses Españoles Alemanes Rusos Franceses Griegos
Palestinos 0.0064
Suecos 0.0064-0.0090 0,0191
Finlandeses 0.0130-0.0230 0.0050-0.0110
Españoles 0.0010-0.0050 0,0101 0.0040-0055 0.0110-0.0170
Alemanes 0.0029-0.0080 0,0136 0.0007-0.0010 0.0060-0.0130 0.0015-0.0030
Rusos 0.0088-0.0120 0,0202 0.0030-0.0036 0.0060-0.0120 0.0070-0.0079 0.0030-0.0037
Franceses 0.0030-0.0050 0.0020 0.0080-0.0150 0.0010 0.0010 0.0050
Griegos 0.0000 0.0057 0.0084 0.0035 0.0039 0,0108

Programas para calcular FST

Módulos para calcular F ST

Referencias

  1. Holsinger, Kent E.; Bruce S. Weir (2009). «Genetics in geographically structured populations: defining, estimating and interpreting FST». Nat Rev Genet 10 (9): 639-650. ISSN 1471-0056. PMC 4687486. PMID 19687804. doi:10.1038/nrg2611. 
  2. Richard Durrett (12 August 2008). Probability Models for DNA Sequence Evolution. Springer. ISBN 978-0-387-78168-6. Consultado el 25 October 2012. 
  3. Hudson, RR.; Slatkin, M.; Maddison, WP. (Oct 1992). «Estimation of Levels of Gene Flow from DNA Sequence Data». Genetics 132 (2): 583-9. PMC 1205159. PMID 1427045. 
  4. Weir, B. S.; Cockerham, C. Clark (1984). «Estimating F-Statistics for the Analysis of Population Structure». Evolution 38 (6): 1358-1370. ISSN 0014-3820. PMID 28563791. doi:10.2307/2408641. 
  5. Peter Beerli, Estimation of migration rates and population sizes in geographically structured populations (1998), Advances in molecular ecology (ed. G. Carvalho). NATO Science Series A: Life Sciences, IOS Press, Amsterdam, 39-53.
  6. Frankham, R., Ballou, J.D., Briscoe, D.A., 2002. Introduction to Conservation Genetics. Cambridge University Press, Cambridge. Hartl DL, Clark AG (1997) Principles of Population Genetics, 3nd edn. Sinauer Associates, Inc, Sunderland, MA.
  7. B. M. von Holdt et al., "Whole-genome sequence analysis shows that two endemic species of North American wolf are admixtures of the coyote and gray wolf", Science Advances 27 Jul 2016: Vol. 2, no. 7, e1501714, doi: 10.1126/sciadv.1501714.
  8. Cavalli-Sforza et al. (1994), cited after V. Ginsburgh, S. Weber, The Palgrave Handbook of Economics and Language, Springer (2016), p. 182.
  9. Cavalli-Sforza et al., 1994, p. 24
  10. «Kinship and Population Subdivision». 2002. 
  11. Elhaik, Eran (2012). «Empirical Distributions of FST from Large-Scale Human Polymorphism Data». PLOS One 7 (11): e49837. Bibcode:2012PLoSO...749837E. PMC 3504095. PMID 23185452. doi:10.1371/journal.pone.0049837. 
  12. a b Nelis, Mari (8 de mayo de 2009). «Genetic Structure of Europeans: A View from the North–East». En Fleischer, Robert C., ed. PLOS ONE 4 (5): e5472. Bibcode:2009PLoSO...4.5472N. PMC 2675054. PMID 19424496. doi:10.1371/journal.pone.0005472. , see table
  13. Tian, Chao (November 2009). «European Population Genetic Substructure: Further Definition of Ancestry Informative Markers for Distinguishing among Diverse European Ethnic Groups». Molecular Medicine 15 (11–12): 371-383. ISSN 1076-1551. PMC 2730349. PMID 19707526. doi:10.2119/molmed.2009.00094. , see table
  14. Crawford, Nicholas G. (2010). «smogd: software for the measurement of genetic diversity». Molecular Ecology Resources 10 (3): 556-557. PMID 21565057. doi:10.1111/j.1755-0998.2009.02801.x. 
  15. «Empirical Bayes inference of pairwise F(ST) and its distribution in the genome». Genetics 177 (2): 861-73. 2007. PMC 2034649. PMID 17660541. doi:10.1534/genetics.107.077263. 

Otras lecturas

 

Enlaces externos