Diferencia entre revisiones de «Población estadística»

De Wikipedia, la enciclopedia libre
Contenido eliminado Contenido añadido
m Revertidos los cambios de Joselito678 (disc.) a la última edición de Gsrdzl
Etiqueta: Reversión
Sin resumen de edición
Línea 8: Línea 8:
La '''media poblacional''', o [[valor esperado]] de la población, es una [[Medidas de tendencia central|medida de tendencia central]] bien de una [[distribución de probabilidad]] o de una [[variable aleatoria]] caracterizada por la distribución.<ref>{{cite book|last=Feller|first=William|title=Introduction to Probability Theory and its Applications, Vol I|year=1950|publisher=Wiley|isbn=0471257087|pages=221}}</ref> En una [[distribución de probabilidad discreta]] de una variable aleatoria ''X'', la media es igual a la suma sobre cada valor posible ponderada por la probabilidad de ese valor; es decir, se calcula tomando el producto de cada valor posible ''x'' de ''X'' y su probabilidad ''p''(''x''), y luego sumando todos estos productos, dando <math>\mu = \sum x p(x)....</math>.<ref>Elementary Statistics by Robert R. Johnson and Patricia J. Kuby, [https://books.google.com/books?id=DWCAh7jWO98C&lpg=PP1&pg=PA279#v=onepage&q&f=false p. 279]</ref><ref name=":1">{{Cite web|last=Weisstein|first=Eric W.|title=Population Mean|url=https://mathworld.wolfram.com/PopulationMean.html|access-date=2020-08-21|website=mathworld.wolfram.com|language=en}}</ref> Una fórmula análoga se aplica al caso de una [[distribución de probabilidad continua]]. No toda distribución de probabilidad tiene una media definida (véase la [[distribución de Cauchy]] como ejemplo). Además, la media puede ser infinita para algunas distribuciones.
La '''media poblacional''', o [[valor esperado]] de la población, es una [[Medidas de tendencia central|medida de tendencia central]] bien de una [[distribución de probabilidad]] o de una [[variable aleatoria]] caracterizada por la distribución.<ref>{{cite book|last=Feller|first=William|title=Introduction to Probability Theory and its Applications, Vol I|year=1950|publisher=Wiley|isbn=0471257087|pages=221}}</ref> En una [[distribución de probabilidad discreta]] de una variable aleatoria ''X'', la media es igual a la suma sobre cada valor posible ponderada por la probabilidad de ese valor; es decir, se calcula tomando el producto de cada valor posible ''x'' de ''X'' y su probabilidad ''p''(''x''), y luego sumando todos estos productos, dando <math>\mu = \sum x p(x)....</math>.<ref>Elementary Statistics by Robert R. Johnson and Patricia J. Kuby, [https://books.google.com/books?id=DWCAh7jWO98C&lpg=PP1&pg=PA279#v=onepage&q&f=false p. 279]</ref><ref name=":1">{{Cite web|last=Weisstein|first=Eric W.|title=Population Mean|url=https://mathworld.wolfram.com/PopulationMean.html|access-date=2020-08-21|website=mathworld.wolfram.com|language=en}}</ref> Una fórmula análoga se aplica al caso de una [[distribución de probabilidad continua]]. No toda distribución de probabilidad tiene una media definida (véase la [[distribución de Cauchy]] como ejemplo). Además, la media puede ser infinita para algunas distribuciones.


Para una población finita, la media poblacional de una propiedad es igual a la media aritmética de la propiedad dada, considerando cada miembro de la población. Por ejemplo, la media poblacional de la altura es igual a la suma de las alturas de cada individuo dividida por el número total de individuos. La ''[[media de la muestra]]'' puede diferir de la media de la población, especialmente en el caso de muestras pequeñas. La [[ley de los grandes números]] establece que cuanto mayor sea el tamaño de la muestra, más probable será que la media de la muestra se acerque a la media de la población.<ref>Schaum's Outline of Theory and Problems of Probability by Seymour Lipschutz and Marc Lipson, [https://books.google.com/books?id=ZKdqlw2ZnAMC&lpg=PP1&pg=PA141#v=onepage&q&f=false p. 141]</ref>
Para una población finita, la media poblacional de una propiedad es igual a la media aritmética de la propiedad dada, considerando cada miembro de la población<ref> [https://web.archive.org/web/20190616110442/https://www.openintro.org/stat/textbook.php?stat_book=os ''OpenIntro Statistics''], 3rd edition by Diez, Barr, and Cetinkaya-Rundel</ref>. Por ejemplo, la media poblacional de la altura es igual a la suma de las alturas de cada individuo dividida por el número total de individuos. La ''[[media de la muestra]]'' puede diferir de la media de la población, especialmente en el caso de muestras pequeñas. La [[ley de los grandes números]] establece que cuanto mayor sea el tamaño de la muestra, más probable será que la media de la muestra se acerque a la media de la población.<ref>Schaum's Outline of Theory and Problems of Probability by Seymour Lipschutz and Marc Lipson, [https://books.google.com/books?id=ZKdqlw2ZnAMC&lpg=PP1&pg=PA141#v=onepage&q&f=false p. 141]</ref>


== Subpoblación ==
== Subpoblación ==
{{otrosusos|Infrapoblación}}
{{otrosusos|Infrapoblación}}
{{otrosusos|Despoblación}}
{{otrosusos|Despoblación}}
Un subconjunto de una población que comparte una o más propiedades adicionales se denomina ''subpoblación''. Por ejemplo, si la población es toda egipcia, una subpoblación son todos hombres egipcios; si la población son todas las farmacias del mundo, una subpoblación son todas las farmacias de Egipto. Por el contrario, una muestra es un subconjunto de una población que no se elige para compartir ninguna propiedad adicional.
Un subconjunto de una población que comparte una o más propiedades adicionales se denomina ''subpoblación''<ref>{{Citation | last = Shao
| first = Jun | title = Mathematical Statistics | publisher = [[Springer Science+Business Media|Springer]] | year = 1998 | isbn = 0-387-98674-X }}</ref>. Por ejemplo, si la población es toda egipcia, una subpoblación son todos hombres egipcios; si la población son todas las farmacias del mundo, una subpoblación son todas las farmacias de Egipto. Por el contrario, una muestra es un subconjunto de una población que no se elige para compartir ninguna propiedad adicional.


Las estadísticas descriptivas pueden producir resultados diferentes para diferentes subpoblaciones. Por ejemplo, un medicamento en particular puede tener diferentes efectos en diferentes subpoblaciones, y estos efectos pueden ocultarse o descartarse si dichas subpoblaciones especiales no se identifican y examinan de forma aislada.
Las estadísticas descriptivas pueden producir resultados diferentes para diferentes subpoblaciones<ref>{{Citation |last1=Jaynes|first1=E. T. | author-link = Edwin Thompson Jaynes | title=Probability Theory: The logic of science| date=2007 | publisher=[[Cambridge University Press]] | isbn=978-0-521-59271-0| edition=5}}</ref>. Por ejemplo, un medicamento en particular puede tener diferentes efectos en diferentes subpoblaciones, y estos efectos pueden ocultarse o descartarse si dichas subpoblaciones especiales no se identifican y examinan de forma aislada.


De manera similar, a menudo se pueden estimar parámetros con mayor precisión si se separan subpoblaciones: la distribución de alturas entre las personas se modela mejor considerando a hombres y mujeres como subpoblaciones separadas, por ejemplo.
De manera similar, a menudo se pueden estimar parámetros con mayor precisión si se separan subpoblaciones: la distribución de alturas entre las personas se modela mejor considerando a hombres y mujeres como subpoblaciones separadas, por ejemplo.


Las poblaciones que constan de subpoblaciones pueden modelarse mediante [[Modelo de mezcla|modelos de mezcla]], que combinan las distribuciones dentro de las subpoblaciones en una distribución de población general. Incluso si las subpoblaciones están bien modeladas por modelos simples dados, la población general puede no ajustarse correctamente a un modelo simple dado; un ajuste deficiente puede ser evidencia de la existencia de subpoblaciones. Por ejemplo, dadas dos subpoblaciones iguales, ambas distribuidas normalmente, si tienen la misma desviación estándar, pero medias diferentes, la distribución general exhibirá una baja [[curtosis]] en relación con una única distribución normal: las medias de las subpoblaciones recaen sobre los hombros de la distribución general. Si están suficientemente separados, estos forman una [[distribución bimodal]]; de lo contrario, simplemente tiene un pico ancho. Además, presentará sobredispersión en relación con una única distribución normal con la variación dada. Alternativamente, dadas dos subpoblaciones con la misma media, pero diferentes desviaciones estándar, la población general exhibirá una alta curtosis, con un pico más agudo y colas más pesadas (y, en consecuencia, hombros menos profundos) que una sola distribución.
Las poblaciones que constan de subpoblaciones pueden modelarse mediante [[Modelo de mezcla|modelos de mezcla]], que combinan las distribuciones dentro de las subpoblaciones en una distribución de población general<ref>{{SpringerEOM | title=Statistical Estimator | id=s/s087360 | first=Login Nikolaevich | last=Bol'shev}}.</ref>. Incluso si las subpoblaciones están bien modeladas por modelos simples dados, la población general puede no ajustarse correctamente a un modelo simple dado; un ajuste deficiente puede ser evidencia de la existencia de subpoblaciones. Por ejemplo, dadas dos subpoblaciones iguales, ambas distribuidas normalmente, si tienen la misma desviación estándar, pero medias diferentes, la distribución general exhibirá una baja [[curtosis]] en relación con una única distribución normal: las medias de las subpoblaciones recaen sobre los hombros de la distribución general<ref>{{cite book|author1=Barbara Illowsky|author2=Susan Dean|title=Introductory Statistics|url=https://openstax.org/details/introductory-statistics|year=2014|publisher=OpenStax CNX|isbn=9781938168208}}</ref>. Si están suficientemente separados, estos forman una [[distribución bimodal]]; de lo contrario, simplemente tiene un pico ancho. Además, presentará sobredispersión en relación con una única distribución normal con la variación dada. Alternativamente, dadas dos subpoblaciones con la misma media, pero diferentes desviaciones estándar, la población general exhibirá una alta curtosis, con un pico más agudo y colas más pesadas (y, en consecuencia, hombros menos profundos) que una sola distribución<ref>{{Cite book
| last = Kosorok | first = Michael | title = Introduction to Empirical Processes and Semiparametric Inference
| publisher = [[Springer Science+Business Media|Springer]] | series = Springer Series in Statistics | date = 2008
| url = https://www.springer.com/mathematics/probability/book/978-0-387-74977-8
| doi = 10.1007/978-0-387-74978-5 | isbn = 978-0-387-74978-5}}</ref>.


== Véase también ==
== Véase también ==
Línea 35: Línea 40:


== Enlaces externos ==
== Enlaces externos ==

* [http://www.socialresearchmethods.net/kb/sampstat.htm Términos estadísticos simplificados]
* [http://www.socialresearchmethods.net/kb/sampstat.htm Términos estadísticos simplificados]
[[Categoría:Teoría estadística]]
[[Categoría:Teoría estadística]]

Revisión del 12:05 3 jun 2023

En estadística, una población es un conjunto de elementos o eventos similares que son de interés para alguna pregunta o experimento.[1]​ Una población estadística puede ser un grupo de objetos existentes (por ejemplo, el conjunto de todas las estrellas dentro de la Vía Láctea) o una hipotética y potencialmente infinita grupo de objetos concebidos como una generalización de la experiencia (por ejemplo, el conjunto de todas las manos posibles en un juego de póquer).[2]​ Un objetivo común del análisis estadístico es producir información sobre alguna población elegida.[3]

En la inferencia estadística, se elige un subconjunto de la población (una muestra estadística) para representar la población en un análisis estadístico.[4]​ La relación entre el tamaño de esta muestra estadística y el tamaño de la población se denomina fracción de muestreo. Entonces es posible estimar los parámetros de la población utilizando las estadísticas de muestra adecuadas.

Media

La media poblacional, o valor esperado de la población, es una medida de tendencia central bien de una distribución de probabilidad o de una variable aleatoria caracterizada por la distribución.[5]​ En una distribución de probabilidad discreta de una variable aleatoria X, la media es igual a la suma sobre cada valor posible ponderada por la probabilidad de ese valor; es decir, se calcula tomando el producto de cada valor posible x de X y su probabilidad p(x), y luego sumando todos estos productos, dando .[6][7]​ Una fórmula análoga se aplica al caso de una distribución de probabilidad continua. No toda distribución de probabilidad tiene una media definida (véase la distribución de Cauchy como ejemplo). Además, la media puede ser infinita para algunas distribuciones.

Para una población finita, la media poblacional de una propiedad es igual a la media aritmética de la propiedad dada, considerando cada miembro de la población[8]​. Por ejemplo, la media poblacional de la altura es igual a la suma de las alturas de cada individuo dividida por el número total de individuos. La media de la muestra puede diferir de la media de la población, especialmente en el caso de muestras pequeñas. La ley de los grandes números establece que cuanto mayor sea el tamaño de la muestra, más probable será que la media de la muestra se acerque a la media de la población.[9]

Subpoblación

Un subconjunto de una población que comparte una o más propiedades adicionales se denomina subpoblación[10]​. Por ejemplo, si la población es toda egipcia, una subpoblación son todos hombres egipcios; si la población son todas las farmacias del mundo, una subpoblación son todas las farmacias de Egipto. Por el contrario, una muestra es un subconjunto de una población que no se elige para compartir ninguna propiedad adicional.

Las estadísticas descriptivas pueden producir resultados diferentes para diferentes subpoblaciones[11]​. Por ejemplo, un medicamento en particular puede tener diferentes efectos en diferentes subpoblaciones, y estos efectos pueden ocultarse o descartarse si dichas subpoblaciones especiales no se identifican y examinan de forma aislada.

De manera similar, a menudo se pueden estimar parámetros con mayor precisión si se separan subpoblaciones: la distribución de alturas entre las personas se modela mejor considerando a hombres y mujeres como subpoblaciones separadas, por ejemplo.

Las poblaciones que constan de subpoblaciones pueden modelarse mediante modelos de mezcla, que combinan las distribuciones dentro de las subpoblaciones en una distribución de población general[12]​. Incluso si las subpoblaciones están bien modeladas por modelos simples dados, la población general puede no ajustarse correctamente a un modelo simple dado; un ajuste deficiente puede ser evidencia de la existencia de subpoblaciones. Por ejemplo, dadas dos subpoblaciones iguales, ambas distribuidas normalmente, si tienen la misma desviación estándar, pero medias diferentes, la distribución general exhibirá una baja curtosis en relación con una única distribución normal: las medias de las subpoblaciones recaen sobre los hombros de la distribución general[13]​. Si están suficientemente separados, estos forman una distribución bimodal; de lo contrario, simplemente tiene un pico ancho. Además, presentará sobredispersión en relación con una única distribución normal con la variación dada. Alternativamente, dadas dos subpoblaciones con la misma media, pero diferentes desviaciones estándar, la población general exhibirá una alta curtosis, con un pico más agudo y colas más pesadas (y, en consecuencia, hombros menos profundos) que una sola distribución[14]​.

Véase también

Referencias

  1. «Glossary of statistical terms: Population». Statistics.com. Consultado el 22 de febrero de 2016. 
  2. Weisstein, Eric W. «Población estadística». En Weisstein, Eric W, ed. MathWorld (en inglés). Wolfram Research. 
  3. Yates, Daniel S.; Moore, David S; Starnes, Daren S. (2003). The Practice of Statistics (2nd edición). New York: Freeman. ISBN 978-0-7167-4773-4. Archivado desde el original el 9 de febrero de 2005. Consultado el 23 de enero de 2021. 
  4. «Glossary of statistical terms: Sample». Statistics.com. Consultado el 22 de febrero de 2016. 
  5. Feller, William (1950). Introduction to Probability Theory and its Applications, Vol I. Wiley. p. 221. ISBN 0471257087. 
  6. Elementary Statistics by Robert R. Johnson and Patricia J. Kuby, p. 279
  7. Weisstein, Eric W. «Population Mean». mathworld.wolfram.com (en inglés). Consultado el 21 de agosto de 2020. 
  8. OpenIntro Statistics, 3rd edition by Diez, Barr, and Cetinkaya-Rundel
  9. Schaum's Outline of Theory and Problems of Probability by Seymour Lipschutz and Marc Lipson, p. 141
  10. Shao, Jun (1998), Mathematical Statistics, Springer, ISBN 0-387-98674-X .
  11. Jaynes, E. T. (2007), Probability Theory: The logic of science (5 edición), Cambridge University Press, ISBN 978-0-521-59271-0 .
  12. Plantilla:SpringerEOM.
  13. Barbara Illowsky; Susan Dean (2014). Introductory Statistics. OpenStax CNX. ISBN 9781938168208. 
  14. Kosorok, Michael (2008). Introduction to Empirical Processes and Semiparametric Inference. Springer Series in Statistics. Springer. ISBN 978-0-387-74978-5. doi:10.1007/978-0-387-74978-5. 

Bibliografía

Enlaces externos