Análisis de datos y gráficos estadísticos

Recuerda que:

Una tabla de frecuencias es una ordenación en forma de tabla de los datos estadísticos, asignando a cada dato su frecuencia correspondiente.

Datos agrupados y no agrupados

Los datos agrupados son aquellos datos que pertenecen a un tamaño de muestra mayor a 20 o más elementos, por lo que para ser analizados requieren ser agrupados en clases a partir de ciertas características.

Derivado de lo anterior, los datos no agrupados son aquellos que pertenecen a una muestra menor a 20 elementos, por lo que para ser analizados, no requieren ser agrupados.

Al tamaño de la muestra o número total de elementos de la muestra se le designa como n.

Hay que aclarar que en estadística no es correcto usar la expresión conjunto de datos, pues los conjuntos de datos no admiten repetición de sus elementos (Por ejemplo, un conjunto de datos es el siguiente: {19,20,21,22,23,26,28,31}, notando además, que la notación correspondiente para escribir un conjunto de datos es {…} ). Entonces, lo correcto es usar la expresión sistema de datos, pues éstos sí admiten repetición de sus elementos (Por ejemplo, un sistema de datos es el siguiente: 19,20,20,26,23,21,22,22,19,28,26,31)

La siguiente tabla de frecuencias (ver Tabla 1), presenta el modelo más utilizado para la construcción de tablas de frecuencias de datos, para datos agrupados.

Miremos qué significa cada elemento de la tabla:

Clase: Indica el intervalo en donde se deben agrupar los datos o valores. Cada clase está delimitada por el límite inferior (Li-1) de la clase y el límite superior de la clase (Ls); el ancho o amplitud de la clase se representa como Ci. En algunos textos también aparece como Xi, y se lee como la clase i. En la gran mayoría de casos se organizan en intervalos semi-abiertos de la forma (a,b].

Para saber cuántos intervalos deben construirse, se hace lo siguiente:

m= √ n, donde m es el número de intervalos que deben construirse, aproximando este valor al número más grande, y n es el número total de datos.

Para determinar la amplitud de la clase (o ancho de clase), se hace lo siguiente:

Ancho de clase: Ci=(R+u) / m, donde

R es el rango y viene dado por R=X máximo - X mínimo,
u será 1 si los datos son enteros, 0.1 si los datos tienen una cifra decimal y 0.01 si los datos tienen dos cifras decimales, y
m es el número de intervalos que deben construirse.

Además,

Límite inferior de la primera clase viene dado por Li-1=Xmín - (1/2)u y
Límite superior viene dado por (Li-1)+Ci

Marca de clase: Es el punto medio de cada intervalo y es el valor o dato que representa a todo el intervalo para el cálculo de algunos parámetros. En algunos textos también aparece como Xi’.

Para calcular la marca de clase, se hace lo siguiente:
Xi'=(Límite inferior + Límite superior) / 2

fi: Frecuencia absoluta de la clase i (cantidad de elementos pertenecientes a la clase i). En algunos textos también aparece como ni.
Fi: Frecuencia absoluta acumulada de la clase i (suma de las frecuencias absolutas de todas las clases inferiores o iguales a la clase considerada). En algunos textos también aparece como Ni.
hi: Frecuencia relativa de la clase i (es el cociente entre la frecuencia absoluta de una determinada clase y el número total de datos n). Se puede expresar en número decimal, fracción o porcentaje.
Hi: Frecuencia relativa acumulada de la clase i (suma de las frecuencias relativas de todas las clases interiores o iguales a a clase considerada). Se puede expresar en número decimal, fracción o porcentaje.

Referencias:

Vitutor. (2014). Tablas de frecuencia [Mensaje en un blog]. Recuperado de http://www.vitutor.com/estadistica/descriptiva/a_3.html
Pbacelis. (03,12,2012). Datos agrupados y no agrupados [Mensaje en un blog]. Recuperado de http://es.slideshare.net/pbacelis/datos-agrupados-y-no
Mendoza H., Bautista, G. Capítulo 1: Estadística Descriptiva - Presentación de datos cuantitativos [Mensaje en un blog]. Recuperado de http://www.virtual.unal.edu.co/cursos/ciencias/2001065/html/un1/cont_114_14.html
Díaz, D (2015). Apuntes del curso Análisis Exploratorio de Datos y Estadística. Universidad del Valle - IEP - AEM.

Análisis de datos y gráficos estadísticos

Etiquetas

miércoles, 17 de febrero de 2016

No hay comentarios:

Publicar un comentario