Podemos resumir una serie de observaciones mediante "estadísticos": "función de los datos observados". Existen tres tipos de medidas estadísticas:
Medidas de tendencia central: dan idea de los valores al rededor de los cuales el resto de los datos tienen tendencia a agruparse.
- Media aritmética
- La mediana (valor de la observación tal que un 50% de los datos es menor y un 50% es mayor, si el numéro de observaciones es impar será (n/2)+1)
- La moda (valor con mayor frecuencia, puede ser bidmodal, multimodal... y si los datos están agrupados se habla de clase modal).
Medidas de posición: dividen un conjunto ordenado de datos en grupos con la misma cantidad de individuos. Los cuantiles solo tienen en cuenta la posición de los valores en la muestra. Los más usados son:
- Percentiles: dividen la muestra ordenada en 100 partes. Es "i" (Pi) aquel valor que ordenadas las observaciones en forma creciente, el i% de ellas son menores que él y el (100-i)% son mayores. En una serie de datos agrupados buscamos el intervalo en el que la frecuecia relativa acumulada sea superior a valor del percentil. El valor del P50 corresponde al valor de la mediana.
- Deciles: divide la muestra ordenada en 10 partes. El i/ 10% de las observacions son menos que él y el (100-i)/10% son mayores. El valor D5 corresponde al valor de la mediana y al P50.
- Cuartiles: Divide la muestra ordenada en 4 partes. El Q1 muestra que el 25% de las observaciones son menores y el 75% mayores. el Q2 sería 50% mayores y 50% menores, coincide con el valor de D5 y valor de la mediana P50. El Q3 sería el 75% son menores y el 25% mayores y el Q4 indica el valor mayor que se alcanza en la serie numérica.
Medidas de dispersión o variabilidad: dan información acerca de la heterogeneidad de nuestras observaciones.
- Rango o recorrido: diferencia entre el mayor y menor valor de la muestra [xn-x1]
- Desviación media: media aritmética de las distancias de cada observación con respecto a la media de la muestra
- Desviación típica: cuantifica el error que cometemos si representamos una muestra únicamente por su media
- Varianza: misma información en valores cuadráticos
- Recorrido intercuartílico: diferencia entre el tercer y primer cuartil
- Coenficiente de variación: compara la heterogeneidad de dos series numéricas de las unidades de medidas.
Distribuciones normales: En estadística se llama distribución normal,
distribución de Gauss o distribución gaussiana, a
una de las distribuciones de probabilidad de
variable continua que con más frecuencia aparece
en fenómenos reales. La gráfica de su función de densidad tiene una
forma acampanada y es simétrica respecto de los
valores posición central (media, mediana y moda,
que coinciden en estas distribuciones). Esta curva se conoce como campana de Gauss.
Asimetrías y cuartosis: Coeficiente de asimetría de una
variable: Grado de asimetría de la
distribución de sus datos en torno a su
media, es adimensional y adopta valores
entre -1 y 1. G1= 0 (distribución simétrica), g1> 0 (distribución asimétrica positiva) y g1<0 (distribución asimétrica negatia).Coeficiente de apuntamiento o curtosis de una
variable, sirve para medir el grado de
concentración de los valores que toma
en
torno a su media, se elige como referencia una variable con
distribución normal, de modo que para ella el
coeficiente de curtosis es 0 y adopta también valores entre -1 y 1. G2=0 (distribución mesocúrtica), g2>0 (leptocúrtica) y g2 <0 (platiúrtica).
No hay comentarios:
Publicar un comentario