Una tabla de frecuencias es una ordenación en forma de tabla de los datos estadísticos, asignando a cada dato su frecuencia correspondiente.
Los datos agrupados son aquellos datos que pertenecen a un tamaño de muestra mayor a 20 o más elementos, por lo que para ser analizados requieren ser agrupados en clases a partir de ciertas características.
Derivado de lo anterior, los datos no agrupados son aquellos que pertenecen a una muestra menor a 20 elementos, por lo que para ser analizados, no requieren ser agrupados.
Derivado de lo anterior, los datos no agrupados son aquellos que pertenecen a una muestra menor a 20 elementos, por lo que para ser analizados, no requieren ser agrupados.
Al tamaño de la muestra o número total de elementos de la muestra se le designa como n.
Hay que aclarar que en estadística no es correcto usar la expresión conjunto de datos, pues los conjuntos de datos no admiten repetición de sus elementos (Por ejemplo, un conjunto de datos es el siguiente: {19,20,21,22,23,26,28,31}, notando además, que la notación correspondiente para escribir un conjunto de datos es {…} ). Entonces, lo correcto es usar la expresión sistema de datos, pues éstos sí admiten repetición de sus elementos (Por ejemplo, un sistema de datos es el siguiente: 19,20,20,26,23,21,22,22,19,28,26,31)
La siguiente tabla de frecuencias (ver Tabla 1), presenta el modelo más utilizado para la construcción de tablas de frecuencias de datos, para datos agrupados.
La siguiente tabla de frecuencias (ver Tabla 1), presenta el modelo más utilizado para la construcción de tablas de frecuencias de datos, para datos agrupados.
Miremos qué significa cada elemento de la tabla:
Para saber cuántos intervalos deben construirse, se hace lo siguiente:
m= √ n, donde m es el número de intervalos que deben construirse, aproximando este valor al número más grande, y n es el número total de datos.
Para determinar la amplitud de la clase (o ancho de clase), se hace lo siguiente:
Ancho de clase: Ci=(R+u) / m, donde - R es el rango y viene dado por R=X máximo - X mínimo,
- u será 1 si los datos son enteros, 0.1 si los datos tienen una cifra decimal y 0.01 si los datos tienen dos cifras decimales, y
- m es el número de intervalos que deben construirse.
Además,
- Límite inferior de la primera clase viene dado por Li-1=Xmín - (1/2)u y
- Límite superior viene dado por (Li-1)+Ci
Marca de clase: Es el punto medio de cada intervalo y es el valor o dato que representa a todo el intervalo para el cálculo de algunos parámetros. En algunos textos también aparece como Xi’.
Para calcular la marca de clase, se hace lo siguiente:Xi'=(Límite inferior + Límite superior) / 2
fi: Frecuencia absoluta de la clase i (cantidad de elementos pertenecientes a la clase i). En algunos textos también aparece como ni.
Fi: Frecuencia absoluta acumulada de la clase i (suma de las frecuencias absolutas de todas las clases inferiores o iguales a la clase considerada). En algunos textos también aparece como Ni.
hi: Frecuencia relativa de la clase i (es el cociente entre la frecuencia absoluta de una determinada clase y el número total de datos n). Se puede expresar en número decimal, fracción o porcentaje.
Hi: Frecuencia relativa acumulada de la clase i (suma de las frecuencias relativas de todas las clases interiores o iguales a a clase considerada). Se puede expresar en número decimal, fracción o porcentaje.
Referencias:
- Vitutor. (2014). Tablas de frecuencia [Mensaje en un blog]. Recuperado de http://www.vitutor.com/estadistica/descriptiva/a_3.html
- Pbacelis. (03,12,2012). Datos agrupados y no agrupados [Mensaje en un blog]. Recuperado de http://es.slideshare.net/pbacelis/datos-agrupados-y-no
- Mendoza H., Bautista, G. Capítulo 1: Estadística Descriptiva - Presentación de datos cuantitativos [Mensaje en un blog]. Recuperado de http://www.virtual.unal.edu.co/cursos/ciencias/2001065/html/un1/cont_114_14.html
- Díaz, D (2015). Apuntes del curso Análisis Exploratorio de Datos y Estadística. Universidad del Valle - IEP - AEM.
No hay comentarios:
Publicar un comentario