Ir al contenido

Usuario:Juaneliasmillasvera/Taller

De Wikipedia, la enciclopedia libre

Culturomía

[editar]

La culturomía es una lexicología computacional que estudia el comportamiento humano y el efecto arrastre a través del análisis cuantitativo de los textos digitalizados.[1][2]​ Los investigadores hacen minería de datos de archivos digitales extensos para investigar fenomenos sociales reflejados en el uso del lenguaje y sus palabras.[3]​ La versión en idioma inglés del termino fue acuñada en un artículo de la revista Science por Jean-Baptiste Michel y Erez Lieberman Aiden.[4]

Michel y Aiden crearon en los laboratorios de Google el Google Ngram Viewer el cual usa n-gramas para analizar los libros del archivo de la libreria digital de Google.

Debido a que la muestra de datos del Google Ngram no es una muestra imparcial[5]​ y no incluye metadatos,[6]​ podrían existir peligros al usarlo para estudiar el lenguaje o la popularidad de los términos.[7]​ La literatura médica representa una parte larga pero cambiante del corpus, y hay que tener en cuenta la frecuencia con la que se imprime o se lee esa litertura.[8]

Referencias

[editar]
  1. Cohen, Patricia (16 de diciembre de 2010). «In 500 Billion Words, New Window on Culture» (en inglés). New York Times. 
  2. Hayes, Brian (mayo–junio de 2011). «Bit Lit». American Scientist (en inglés) 99 (3): 190. doi:10.1511/2011.90.190. Archivado desde el original el 18 de octubre de 2016. 
  3. Letcher, David W. (6 de abril de 2011). «Cultoromics: A New Way to See Temporal Changes in the Prevalence of Words and Phrases». American Institute of Higher Education 6th International Conference Proceedings. 4 (1): 228. Consultado el 25 de octubre de 2024. 
  4. Michel, Jean-Baptiste; Liberman Aiden, Erez (16 de diciembre de 2010). «Quantitative Analysis of Culture Using Millions of Digitized Books». Science. 331 (6014): 176–82. PMID 21163965. doi:10.1126/science.1199644. 
  5. Pechenick, Eitan Adam; Danforth, Christopher M; Dodds, Peter Sheridan (7 de octubre de 2015). «"Characterizing the Google Books Corpus: Strong Limits to Inferences of Socio-Cultural and Linguistic Evolution"». PLOS ONE. 10 (10): e0137041. PMID 26445406. doi:10.1371/journal.pone.0137041. Consultado el 25 de octubre de 2024. 
  6. Koplenig, Alexander (Abril de 2017). «The impact of lacking metadata for the measurement of cultural and linguistic change using the Google Ngram data sets—Reconstructing the composition of the German corpus in times of WWII». Digital Scholarship in the Humanities. 32 (1): 169–188. ISSN 2055-7671. doi:10.1093/llc/fqv037. 
  7. Zhang, Sarah (24 de mayo de 2017). «"The Pitfalls of Using Google Ngram to Study Language"». WIRED. 
  8. «Terminos de ejemplo para comparación.».