
- Marca de claseLa
marca de clase es el punto medio de cada intervalo. La marca declase es el valor que representa a todo el intervalo para el cálculo dealgunos parámetros como la media aritmética o la desviación típica.
- ¿Como calcular la
marca de clase ?• Se calcula la marca de clase (Xi), que es el valor medio o promedio decada intervalo, el cual sirve para facilitar el cálculo de algunasmedidas de posición y de dispersión.• Una vez escogido el número de intervalos se determina la amplitudde cada clase o intervalo (C).
- • Esta amplitud
es igual al rango de los datos dividida en el número deintervalos.• El primer intervalo debe contener el menor valor de los datos y el últimointervalo debe contener el mayor valor de los datos.• Se determina el número de intervalos o clase (K) que se utilizan paraagrupar los datos.• En general se recomienda tener, hasta donde sea posible, tener entre 5 y20 intervalos o clases.
- En consideración• Sin
embargo, si no se tiene seguridad del número de intervalos autilizar, se puede aplicar la regla de Sturges, con la cual se obtiene unaaproximación aceptable sobre el número de intervalos necesariospara agruparlos.• la regla de Sturges es una regla que permite calcular el numero declase cuando se conoce el tamaño de la población o muestra.
¿Qué es una marca de clase?
La marca de clase, también conocida como punto medio, es el valor que se encuentra en el centro de una clase, el cual representa a todos los valores que están en dicha categoría. Fundamentalmente, la marca de clase es usada para el cálculo de ciertos parámetros, como la media aritmética o la desviación estándar.
Entonces, la marca de clase es el punto medio de cualquier intervalo. Este valor también es muy útil para encontrar la varianza de un conjunto de datos ya agrupados en clases, lo que a su vez permite comprender a qué distancia del centro se encuentran esos datos determinados.
Distribución de frecuencia
Para comprender qué es una marca de clases es necesario el concepto de distribución de frecuencia. Dado un conjunto de datos, una distribución de frecuencia es una tabla que divide dichos datos en un número de categorías llamadas clases.
Dicha tabla muestra cuál es la cantidad de elementos que pertenece a cada clase; esto último se conoce como frecuencia.
En esta tabla se sacrifica parte de la información que obtenemos de los datos, ya que en vez de tener el valor individual de cada elemento, solo sabemos que pertenece a dicha clase.
Por otro lado, ganamos una mejor comprensión sobre el conjunto de datos, ya que de esta forma es más fácil apreciar patrones establecidos, lo que facilita la manipulación de dichos datos.
¿Cuántas clases considerar?
Para realizar una distribución de frecuencia primero debemos determinar la cantidad de clases que se desean tomar y elegir los límites de clase de las mismas.
La elección de cuántas clases tomar debe ser de manera conveniente, teniendo en cuenta que un número pequeño de clases puede ocultar información sobre los datos que deseamos estudiar y uno muy grande puede generar demasiados detalles que no necesariamente sean útiles.
Los factores que debemos tomar en cuenta al momento de elegir cuántas clases tomar son varios, pero entre estos destacan dos: el primero es tomar en cuenta cuántos datos tenemos que considerar; el segundo es saber de qué tamaño es el rango de la distribución (es decir, la diferencia entre la observación más grande y la más pequeña).
Después de tener las clases ya definidas procedemos a contar cuántos datos existen en cada clase. Este número es llamado frecuencia de clases y se denota por fi.
Como anteriormente habíamos dicho, tenemos que una distribución de frecuencia pierde la información que proviene de manera individual de cada dato u observación. Por ello se busca un valor que represente a toda la clase a la cual pertenezca; este valor es la marca de clases.
¿Cómo se obtiene?
La marca de clase es el valor central que representa una clase. Se obtiene al sumar los límites del intervalo y dividir este valor entre dos. Esto podríamos expresarlo matemáticamente como sigue:
xi= (Límite inferior + Límite superior)/2.
En esta expresión xi denota la marca de la i-ésima clase.
Ejemplo
Dado el siguiente conjunto de datos, dar una distribución de frecuencia representativa y conseguir la marca de clases correspondientes.
Como el dato con mayor valor numérico es 391 y el menor es de 221, tenemos que el rango es 391 -221= 170.
Elegiremos 5 clases, todas con el mismo tamaño. Una forma de elegir las clases es la siguiente:
Nótese que cada dato está en una clase, estas son disjuntas y tienen el mismo valor. Otra forma de elegir las clases es considerando a los datos como parte de una variable continua, la cual podría alcanzar cualquier valor real. En este caso podemos considerar clases de la forma:
205-245, 245-285, 285-325, 325-365, 365-405
No obstante, esta forma de agrupar los datos puede presentar ciertas ambigüedades con las fronteras. Por ejemplo, en el caso del 245 surge la pregunta: ¿a qué clase pertenece, a la primera o a la segunda?
Para evitar estas confusiones se hace una convención de puntos extremos. De esta manera, la primera clase será el intervalo (205,245], la segunda (245,285], y así sucesivamente.
Una vez definidas las clases, procedemos a calcular la frecuencia y nos queda la siguiente tabla:
Luego de obtener la distribución de frecuencia de los datos, procedemos a encontrar las marcas de clases de cada intervalo. En efecto, tenemos que:
x1=(205+ 245)/2=225
x2=(245+ 285)/2=265
x3=(285+ 325)/2=305
x4=(325+ 365)/2=345
x5=(365+ 405)/2=385
Podemos representar esto mediante el siguiente gráfico:
¿Para qué sirve?
La marca de clase es muy funcional para hallar la media aritmética y la varianza de un grupo de datos que ya han sido agrupados en distintas clases.
Podemos definir a la media aritmética como la suma de las observaciones obtenidas entre el tamaño de la muestra. Desde un punto de vista físico, su interpretación es como el punto de equilibrio de un conjunto de datos.
Identificar todo un conjunto de datos por un solo número puede ser riesgoso, por lo cual también hay que tomar en cuenta la diferencia entre este punto de equilibrio y los datos reales. A estos valores se les conoce como desviación de la media aritmética, y con estos se busca determinar cuánto varía la media aritmética de los datos.
La manera más común de dar con este valor es por la varianza, que es el promedio de los cuadrados de las desviaciones de la media aritmética.
Para calcular la media aritmética y la varianza de un conjunto de datos agrupados en una clase hacemos uso de las siguientes fórmulas, respectivamente:
En estas expresiones xi es la i-ésima marca de clase, fi representa la frecuencia correspondiente y k el número de clases en que fueron agrupados los datos.
Ejemplo
Haciendo uso de los datos dados en el ejemplo anterior, tenemos que podemos ampliar un poco más los datos de la tabla de distribución de frecuencia. Se obtiene lo siguiente:
Luego, al sustituir los datos en la fórmula, nos queda que la media aritmética es:
Su varianza y desviación estándar son:
De esto podemos concluir que los datos originales tienen una media aritmética de 306,6 y una desviación estándar de 39,56.
La distribución de frecuencias o tabla de frecuencias es una ordenación en forma de tabla de los datos estadísticos, asignando a cada dato su frecuencia correspondiente.
Tipos de frecuencias
Frecuencia absoluta
La frecuencia absoluta es el número de veces que aparece un determinado valor en un estudio estadístico.
Al tirar una moneda veces salen
caras
Se representa por , aunque otros autores la representan como
.
La suma de las frecuencias absolutas es igual al número total de datos, que se representa por .
Para indicar resumidamente estas sumas se utiliza la letra griega (sigma mayúscula) que se lee suma o sumatoria.
Frecuencia relativa
La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor y el número total de datos.
Se puede expresar en tanto por ciento y se representa por .
La frecuencia relativa es un número comprendido entre y
.
La suma de las frecuencias relativas es igual a .
Frecuencia acumulada
La frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valor considerado.
Se representa por .
Frecuencia relativa acumulada
La frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de un determinado valor y el número total de datos.
Se puede expresar en tantos por ciento.
Ejemplo:
Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas máximas:
.
En la primera columna de la tabla colocamos la variable ordenada de menor a mayor
En la segunda hacemos el recuento
En la tercera anotamos la frecuencia absoluta
En la cuarta anotamos la frecuencia acumulada:
En la primera casilla colocamos la primera frecuencia absoluta:
En la segunda casilla sumamos el valor de la frecuencia acumulada anterior más la frecuencia absoluta correspondiente:
En la tercera casilla sumamos el valor de la frecuencia acumulada anterior más la frecuencia absoluta correspondiente:
La última tiene que ser igual a (sumatoria de
).
En la quinta columna disponemos las frecuencias relativas que son el resultado de dividir cada frecuencia absoluta por
En la sexta anotamos la frecuencia relativa acumulada .
En la primera casilla colocamos la primera frecuencia relativa acumulada.
En la segunda casilla sumamos el valor de la frecuencia relativa acumulada anterior más la frecuencia relativa correspondiente y así sucesivamente hasta la última, que tiene que ser igual a .
Recuento
I
II
III
III
I
Este tipo de tablas de frecuencias se utiliza con variables discretas.
Distribución de frecuencias agrupadas
La distribución de frecuencias agrupadas o tabla con datos agrupados se emplea si las variables toman un número grande de valores o la variable es continua.
Se agrupan los valores en intervalos que tengan la misma amplitud denominados clases. A cada clase se le asigna su frecuencia correspondiente.
Límites de la clase
Cada clase está delimitada por el límite inferior de la clase y el límite superior de la clase.
Amplitud de la clase
La amplitud de la clase es la diferencia entre el límite superior e inferior de la clase.
Marca de clase
La marca de clase es el punto medio de cada intervalo y es el valor que representa a todo el intervalo para el cálculo de algunos parámetros.
La marca de clase se representa por
Construcción de una tabla de datos agrupados
.
1º Se localizan los valores menor y mayor de la distribución. En este caso son y
.
2º Se restan y se busca un número entero un poco mayor que la diferencia y que sea
divisible por el número de intervalos queramos establecer.
Es conveniente que el número de intervalos oscile entre y
.
En este caso, , incrementamos el número hasta
,
intervalos.
Se forman los intervalos teniendo presente que el límite inferior de una clase pertenece al intervalo, pero el límite superior no pertenece intervalo, se cuenta en el siguiente intervalo.
es la marca de clase que es el punto medio de cada intervalo.
1
Si siguen teniendo dudas con la construcción de tablas de frecuencias, busca un profesor particular matematicas en Superprof. ¡Estaremos encantados de ayudarte!