Conjunto de datos

De Wikipedia, la enciclopedia libre
Saltar a: navegación, búsqueda

Un "Conjunto de datos" o "dataset" es una colección de datos normalmente tabulada.

En general y en su versión más simple un conjunto de datos corresponde a los contenidos de una única tabla de base de datos, o una única matriz de datos estadística, donde cada columna de la tabla representa una variable en particular, y cada fila representa a un miembro determinado del conjunto de datos en cuestión. Un conjunto de datos contiene los valores para cada una de las variables, como podrían ser la altura y el peso de un objeto, que corresponden a cada miembro del conjunto de datos. Cada uno de estos valores se conoce con el nombre de dato. El conjunto de datos puede incluir datos para uno o más miembros en función de su número de filas.

Método científico[editar]

La publicación de los conjuntos de datos usados en un experimento son clave para su reproducibilidad, y cada vez son más las leyes públicas y normas de revistas científicas que obligan a hacerlos públicos, para evitar sesgos.

Propiedades[editar]

Dependiendo del estudio, es un factor clave las propiedades del conjunto: dispersión, kurtosis, etc.

Véase también[editar]

Referencias[editar]

Enlaces externos[editar]