Índice Chao1

De Wikipedia, la enciclopedia libre

El índice Chao1 es el nombre que recibe una colección de estimadores derivados por Anne Chao y colaboradores. Cada uno de los estimadores produce una cota inferior del número de especies que hay en un entorno de interés bajo la hipótesis de que las especies raras dan la mayor información sobre aquellas que no se observaron.[1][2][3]​ Chao1 es usado por lo regular para muestras pequeñas y es particularmente útil en datos sesgados a especies de baja abundancia.[4]

Generalidades[editar]

A lo largo de las décadas, los ecólogos de comunidades se han interesado en conocer y entender la biodiversidad presente; el cómo se genera, se mantiene y se distribuye en el tiempo y en el espacio.[5]​ La riqueza de especies, definida como el número total de especies de un taxón dado presente en un área determinada, es un componente clave para las estimaciones de diversidad. Sin embargo, algunos problemas asociados se presentan al momento de la identificación taxonómica o durante el muestreo ya que es complicado muestrear todas las especies del ensamble debido quizá a la baja disponibilidad de tiempo o de recursos así como a una baja equitatividad o alta dominancia de ciertas especies. Una posible solución ante estas situaciones es hacer estimaciones de la riqueza de especies empleando tanto métodos paramétricos basados en curvas de acumulación de especies como métodos no paramétricos.[6]​ Estos últimos incluyen estimadores como el índice de Chao, el ACE (Abundance-based Coverage Estimator) y el ICE (Incidence-based Coverage Estimator)[7]​ y tienen la ventaja de no requerir de supuestos sobre la distribución de las abundancias de las especies dentro de las comunidades.[8]

Centrándonos exclusivamente en el índice de Chao, Colwell y Coddington propusieron dos variantes de éste: Chao1 para el estimador basado en abundancias y Chao2 para el estimador basado en incidencia.[9]

Aspecto matemático[editar]

El índice Chao1 fue originalmente propuesto en 1984 por Anne Chao para estimar el número de clases en una población considerando datos de abundancia.[1]​ Para su construcción se considera un experimento, similar al método captura-recaptura, en el que en un entorno con especies distintas se capturan individuos y se registran sus especies. Denotamos por al número de especies que fueron observadas veces. El índice Chao1 original está dado por la expresión

 

 

 

 

(1)

donde es el número de especies que se observaron, mientras que y representan el número de especies que únicamente se observaron una o dos veces (singletons y doubletons respectivamente).[1]​ Esta misma fórmula se usa para el cálculo de Chao2, pero considerando datos de incidencia.[3]

Debido a que la derivación de este índice se hace de manera no paramétrica, no es posible construir intervalos de confianza de manera analítica, pero es posible usar un método bootstrap para construir intervalos aproximados.[1]

Posteriormente, en 1987, Anne Chao obtuvo la misma fórmula (1) pero considerando un modelo paramétrico,[2]​ lo cual permite construir intervalos de confianza del nivel  % usando el método Delta. El intervalo en cuestión es:

 

 

 

 

(2)

donde

 

 

 

 

(3)

 

 

 

 

(4)

y es tal que , con la función de distribución acumulada de la distribución normal estándar.

Otra fórmula que suele usarse para definir al índice Chao1 se encuentra dada por

donde a diferencia de la expresión (1), en esta aparece el término , el cual surge como una corrección cuando es pequeña.[2][10]​ En este caso también se puede construir un intervalo de confianza, similar al de la expresión (2), reemplazando , dada en (4), por

Los estimadores presentados anteriormente únicamente están definidos cuando . Para solventar este problema, Chao y colaboradores proponen un estimador corregido por sesgo[11]​ que puede calcularse incluso cuando . Este está dado por

 

 

 

 

(5)

Bajo este esquema también es posible construir intervalos de confianza, reemplazando por

si

y

si .[10]​ Existe una versión del índice que considera el término .[12]​ Sin embargo, los autores comentan que para datos de abundancia es posible omitir este término de corrección ya que es bastante grande en las aplicaciones.[12]

En 2014, Chao y colaboradores obtuvieron un índice de Chao1 mejorado, en el sentido de que genera una cota inferior mejorada para estimar la riqueza.[3]​ Este índice, , está dado por

Cuando los autores sugieren reemplazar con .[3]​ Nótese que en este caso ya no solamente se usan las frecuencias de las especies observadas una o dos veces, sino que también se consideran las frecuencias de aquellas registradas tres o cuatro veces.

Por la misma naturaleza de los estimadores, la de proveer una cota inferior del número de especies presente, suelen usarse como índices de la riqueza de un entorno de interés. Por ejemplo, la librería vegan de R usa la expresión (5) para calcular el índice Chao1.[10][13][14]

Ejemplos prácticos[editar]

Ejemplo 1[editar]

Supongamos que para un estudio se muestrearon ranas arborícolas presentes tanto en un bosque secundario (BS) como en un bosque maduro (BM). Los datos obtenidos en campo fueron los siguientes:

Número de individuos
(frecuencia observada)
Especie BS BM
A 0 4
B 0 1
C 4 3
D 2 1
E 4 4
F 3 4
G 1 3
H 0 5
I 1 2
J 0 1
K 3 2
L 1 1
M 1 4
N 1 1
O 5 1
P 2 4
Q 0 4
R 2 3
S 1 1
T 3 2
U 0 3
V 4 5
W 3 1

De acuerdo a la tabla anterior, se observaron 17 especies distintas en el sitio BS y 23 en el BM, representando esto a . El número de singletons, o número de especies registradas una sola vez, fue de 6 para el BS y de 8 para el BM. Por otro lado, el número de doubletons, o número de especies vistas únicamente dos veces, fue de 3 para ambos sitios.

Sitio Riqueza observada
()
Singletons
()
Doubletons
()
BS 17 6 3
BM 23 8 3

Con los datos de la tabla anterior y usando el índice Chao1 original, dado por la expresión (1), se estima que la riqueza de especies en el sitio BS es mientras que la riqueza de especies en el sitio BM es . Usando las fórmulas descritas en (2), (3) y (4), se calcularon los intervalos de confianza del 95 %. Los estimadores obtenidos, así como los intervalos se muestran en la siguiente figura:

Riqueza estimada de especies mediante el índice Chao1 con intervalos de confianza del 95 %.
Riqueza estimada de especies mediante el índice Chao1 con intervalos de confianza del 95 %.

Ejemplo 2[editar]

Tradicionalmente, el índice Chao1 se ha empleado sobre todo para estimaciones de riqueza de especies de organismos macroscópicos (como se ilustra en el ejemplo 1). Sin embargo, este índice sigue siendo ampliamente usado en líneas de investigación desarrolladas de forma más reciente, como es el caso para datos del microbioma.

Un ejemplo práctico de su aplicación para este tipo de datos se puede encontrar en el trabajo desarrollado en 2022 por Rahmeh y colaboradores,[15]​ donde se buscaba comparar la riqueza y abundancia de los taxa que componían el microbioma de leche de camellos en distintos sitios de Kuwait. Ya que los camellos tienen la capacidad de producir altas cantidades de leche empleando poca agua y alimento, era importante conocer la composición del microbioma presente. Para esto, se hizo una secuenciación de amplicones del gen 16S y se identificaron a las especies bacterianas presentes así como sus abundancias. Mediante estos datos se puede entonces comparar la riqueza observada, es decir, el número de OTUs (unidades taxonómicas operacionales) presentes en las muestras, con la riqueza estimada obtenida mediante el índice de Chao.

Comparación entre la riqueza de OTUs observada y la estimada con el índice Chao1 para el microbioma de la leche de camello. En color rojo se muestran los valores estimados de riqueza mientras que en color azul se muestran los valores observados.
Comparación entre la riqueza de OTUs observada y la estimada con el índice Chao1 para el microbioma de la leche de camello. En color rojo se muestran los valores estimados de riqueza mientras que en color azul se muestran los valores observados.

La riqueza estimada por el índice Chao1 es mayor que la observada en todos los sitios. Esto se debe a la presencia de singletons y doubletons (secuencias únicas encontradas solamente una o dos veces respectivamente) empleados para el cálculo del índice, cuya relación se suma a la riqueza observada de OTUs. Si se contara con una muestra de tamaño suficiente entonces la riqueza observada, la riqueza estimada con el índice Chao1 y la riqueza real de la población tenderían a ser similares.[16]

Diferencias con otros estimadores[editar]

De manera general, los métodos no paramétricos para estimaciones de riqueza se basan en el número total de especies observadas en la muestra aunado a una corrección en el cálculo debido a las especies raras presentes (singletons o doubletons). Sin embargo, la elección del estimador más apropiado está en función de factores como el tamaño de muestra o el tipo de datos tomados. Por ejemplo, el índice Chao1 así como el ACE se emplean cuando se cuenta con datos de abundancias de especies mientras que el Chao2 y el ICE se emplean para datos de incidencia. Por otro lado, Chao1 y Chao2 son apropiados cuando se trata de muestras pequeñas, mientras que el ACE y el ICE son empleados para grupos de organismos abundantes.[4]

Aplicaciones[editar]

El índice Chao1 se ha utilizado en distintos estudios para estimar la riqueza total de especies de árboles a nivel global y continental,[17]​ para comparar las comunidades de aves en distintos sitios urbanos,[18]​ para detectar cambios en las comunidades de insectos en ecosistemas restaurados[19]​ o para estudiar el microbioma presente en distintos hospederos.[20]​ Además se ha aplicado a datos generados durante la pandemia por COVID-19 para así comparar, a lo largo del tiempo, la riqueza de los taxa del microbioma de personas sanas versus pacientes hospitalizados y/o en recuperación.[21]

Referencias[editar]

  1. a b c d Chao, A. (1984). «Nonparametric Estimation of the Number of Classes in a Population». Scandinavian Journal of Statistics ([Board of the Foundation of the Scandinavian Journal of Statistics, Wiley]) 11 (4): 265-270. ISSN 0303-6898. Consultado el 16 de febrero de 2023. .
  2. a b c Chao, A. (1987). «Estimating the Population Size for Capture-Recapture Data with Unequal Catchability». Biometrics ([Wiley, International Biometric Society]) 43 (4): 783-791. ISSN 0006-341X. doi:10.2307/2531532. Consultado el 16 de febrero de 2023. .
  3. a b c d Chiu, C.-H., Wang, Y.-T., Walther, B. A., Chao, A. (septiembre 2014). «An improved nonparametric lower bound of species richness via a modified good-turing frequency formula: An Improved Nonparametric Lower Bound of Species Richness». Biometrics 70 (3): 671-682. ISSN 0006-341X. doi:10.1111/biom.12200. Consultado el 16 de febrero de 2023. .
  4. a b Rajakaruna, H., Drake, D. A. R., T. Chan, F., Bailey, S. A. (octubre 2016). «Optimizing performance of nonparametric species richness estimators under constrained sampling». Ecology and Evolution 6 (20): 7311-7322. ISSN 2045-7758. doi:10.1002/ece3.2463. Consultado el 8 de marzo de 2023. .
  5. Mittelbach, G. G., McGill, B. J. (23 de mayo de 2019). Community Ecology (2a edición). Oxford University Press. ISBN 978-0-19-883585-1. doi:10.1093/oso/9780198835851.001.0001. .
  6. Branco, M., Figueiras, F. G., Cermeño, P. (1 de mayo de 2018). «Assessing the Efficiency of Non-Parametric Estimators of Species Richness for Marine Microplankton». Journal of Plankton Research 40 (3): 230-243. ISSN 0142-7873. doi:10.1093/plankt/fby005. Consultado el 9 de marzo de 2023. .
  7. Kim, B.-R., Shin, J., Guevarra, R. B., Lee, J. H., Kim, D. W., Seol, K.-H., Lee, J.-H., Kim, H. B., Isaacson, R. E. (28 de diciembre de 2017). «Deciphering Diversity Indices for a Better Understanding of Microbial Communities». Journal of Microbiology and Biotechnology 27 (12): 2089-2093. ISSN 1017-7825. doi:10.4014/jmb.1709.09027. Consultado el 16 de febrero de 2023. .
  8. Chao, A., Chiu, C. (16 de mayo de 2016). «eLS». En John Wiley & Sons, Ltd, ed. Nonparametric Estimation and Comparison of Species Richness (1a edición). Wiley. pp. 1-11. ISBN 978-0-470-01617-6. doi:10.1002/9780470015902.a0026329. .
  9. Colwell, R. K., Coddington, J. A., Hawksworth, D. L. (29 de julio de 1994). «Estimating Terrestrial Biodiversity through Extrapolation». Philosophical Transactions of the Royal Society of London. Series B: Biological Sciences (Royal Society) 345 (1311): 101-118. doi:10.1098/rstb.1994.0091. Consultado el 9 de marzo de 2023. .
  10. a b c Chao, A., Shen, T.-J. Walther, B. A., ed. User’s Guide for Program SPADE (Species Prediction And Diversity Estimation). .
  11. Chao, A. (2006). «Encyclopedia of Statistical Sciences». Species Estimation and Applications. John Wiley & Sons, Ltd. ISBN 978-0-471-66719-3. doi:10.1002/0471667196.ess5051. .
  12. a b Chao, A., Shen, T.-J., Hwang, W.-H. (junio 2006). «Application of Laplace’s boundary-mode approximations to estimate species and shared species richness». Australian html_ent glyph="@amp;" ascii="&"/ New Zealand Journal of Statistics 48 (2): 117-128. ISSN 1369-1473. doi:10.1111/j.1467-842X.2006.00430.x. Consultado el 7 de marzo de 2023. .
  13. Oksanen, J., Blanchet, F. G., Friendly, M., Kindt, R., Legendre, P., McGlinn, D., Minchin, P. R., O’Hara, R. B., Simpson, G. L., Solymos, P., Stevens, M. H. H., Szoecs, E., Wagner, H. (2020). vegan: Community Ecology Package. .
  14. McMurdie, P. J., Holmes, S. (2013). «phyloseq: An R package for reproducible interactive analysis and graphics of microbiome census data». PLoS ONE 8 (4): e61217. .
  15. Rahmeh, R., Akbar, A., Alomirah, H., Kishk, M., Al-Ateeqi, A., Al-Milhm, S., Shajan, A., Akbar, B., Al-Merri, S., Alotaibi, M., Esposito, A. (1 de diciembre de 2022). «Data on microbial diversity of camel milk microbiota determined by 16S rRNA gene sequencing». Data in Brief 45: 108744. ISSN 2352-3409. doi:10.1016/j.dib.2022.108744. Consultado el 7 de marzo de 2023. .
  16. Gotelli, N. J., Colwell, R. K. (2011). «Biological Diversity: Frontiers in Measurement and Assessment». En Magurran, A. E., McGill, B. J., ed. Estimating Species Richness. Oxford University Press. p. 51. ISBN 978-0-19-958067-5. .
  17. Cazzolla Gatti, R., Reich, P. B., Gamarra, J. G. P., Crowther, T., Hui, C., Morera, A., Bastin, J.-F., Miguel, S. de-, Nabuurs, G.-J., Svenning, J.-C., Serra-Diaz, J. M., Merow, C., Enquist, B., Kamenetsky, M., Lee, J., Zhu, J., Fang, J., Jacobs, D. F., Pijanowski, B., Banerjee, A., Giaquinto, R. A., Alberti, G., Almeyda Zambrano, A. M., Alvarez-Davila, E., Araujo-Murakami, A., Avitabile, V., Aymard, G. A., Balazy, R., Baraloto, C., Barroso, J. G., Bastian, M. L., Birnbaum, P., Bitariho, R., Bogaert, J., Bongers, F., Bouriaud, O., Brancalion, P. H. S., Brearley, F. Q., Broadbent, E. N., Bussotti, F., Castro da Silva, W., César, R. G., Češljar, G., Chama Moscoso, V., Chen, H. Y. H., Cienciala, E., Clark, C. J., Coomes, D. A., Dayanandan, S., Decuyper, M., Dee, L. E., Del Aguila Pasquel, J., Derroire, G., Djuikouo, M. N. K., Van Do, T., Dolezal, J., Đorđević, I. Đ., Engel, J., Fayle, T. M., Feldpausch, T. R., Fridman, J. K., Harris, D. J., Hemp, A., Hengeveld, G., Herault, B., Herold, M., Ibanez, T., Jagodzinski, A. M., Jaroszewicz, B., Jeffery, K. J., Johannsen, V. K., Jucker, T., Kangur, A., Karminov, V. N., Kartawinata, K., Kennard, D. K., Kepfer-Rojas, S., Keppel, G., Khan, M. L., Khare, P. K., Kileen, T. J., Kim, H. S., Korjus, H., Kumar, A., Kumar, A., Laarmann, D., Labrière, N., Lang, M., Lewis, S. L., Lukina, N., Maitner, B. S., Malhi, Y., Marshall, A. R., Martynenko, O. V., Monteagudo Mendoza, A. L., Ontikov, P. V., Ortiz-Malavasi, E., Pallqui Camacho, N. C., Paquette, A., Park, M., Parthasarathy, N., Peri, P. L., Petronelli, P., Pfautsch, S., Phillips, O. L., Picard, N., Piotto, D., Poorter, L., Poulsen, J. R., Pretzsch, H., Ramírez-Angulo, H., Restrepo Correa, Z., Rodeghiero, M., Rojas Gonzáles, R. D. P., Rolim, S. G., Rovero, F., Rutishauser, E., Saikia, P., Salas-Eljatib, C., Schepaschenko, D., Scherer-Lorenzen, M., Šebeň, V., Silveira, M., Slik, F., Sonké, B., Souza, A. F., Stereńczak, K. J., Svoboda, M., Taedoumg, H., Tchebakova, N., Terborgh, J., Tikhonova, E., Torres-Lezama, A., Plas, F. van der, Vásquez, R., Viana, H., Vibrans, A. C., Vilanova, E., Vos, V. A., Wang, H.-F., Westerlund, B., White, L. J. T., Wiser, S. K., Zawiła-Niedźwiecki, T., Zemagho, L., Zhu, Z.-X., Zo-Bi, I. C., Liang, J. (8 de febrero de 2022). «The Number of Tree Species on Earth». Proceedings of the National Academy of Sciences 119 (6): e2115329119. ISSN 0027-8424. doi:10.1073/pnas.2115329119. Consultado el 2 de marzo de 2023. .
  18. Xu, W., Fu, W., Dong, J., Yu, J., Huang, P., Zheng, D., Chen, Z., Zhu, Z., Ding, G. (10 de julio de 2022). «Bird Communities Vary under Different Urbanization Types—A Case Study in Mountain Parks of Fuzhou, China». Diversity 14 (7): 555. ISSN 1424-2818. doi:10.3390/d14070555. Consultado el 8 de marzo de 2023. .
  19. Farfán-Beltrán, M. E., Chávez-Pesqueira, M., Hernández-Cumplido, J., Cano-Santana, Z. (15 de abril de 2022). «A quick evaluation of ecological restoration based on arthropod communities and trophic guilds in an urban ecological preserve in Mexico City». Revista Chilena de Historia Natural 95 (1): 4. ISSN 0717-6317. doi:10.1186/s40693-022-00108-8. Consultado el 8 de marzo de 2023. .
  20. Zhu, Q. L., Yan, K., Wang, N. Z., Ma, S. Q., Lu, D. S., Su, X. H., Yuan, Z. S., Dong, Y. F., Wang, Y. P., Ding, C. J. (29 de noviembre de 2022). «The Structure and Assembly of Rhizobacterial Communities Are Influenced by Poplar Genotype». Frontiers in Microbiology 13: 1052567. ISSN 1664-302X. doi:10.3389/fmicb.2022.1052567. Consultado el 8 de marzo de 2023. .
  21. Chen, Y., Gu, S., Chen, Y., Lu, H., Shi, D., Guo, J., Wu, W.-R., Yang, Y., Li, Y., Xu, K.-J., Ding, C., Luo, R., Huang, C., Yu, L., Xu, M., Yi, P., Liu, J., Tao, J.-j., Zhang, H., Lv, L., Wang, B., Sheng, J., Li, L. (1 de enero de 2022). «Six-month follow-up of gut microbiota richness in patients with COVID-19». Gut 71 (1): 222-225. ISSN 0017-5749. doi:10.1136/gutjnl-2021-324090. Consultado el 8 de marzo de 2023. .