TEMA 5: ESTADÍSTICOS UNIVARIABLES: MEDIDAS RESUMEN PARA VARIABLES CUANTITATIVAS: Medidas de tendencia central. Medidas de dispersión. Medidas de posición. Forma de distribución: asimetría y curtosis.


Además de las tablas de las tablas, podemos resumir una serie de observaciones mediante “estadísticos”: es lo que llamamos “Función de los datos observados”.

Hay tres grandes tipos de medidas estadísticas:


  • Medidas de tendencia central: media, mediana y moda.
  • Medidas de dispersión o variabilidad: cuartiles, deciles y percentiles.
  • Medidas de posición: desviación típica y varianza.



1. Medidas de tendencia central

Son los estadísticos que permiten ver lo dominante, lo típico o tendencia de la distribución de una variable en una población. Dentro de los estadísticos de tendencia central se suelen considerar: la media aritmética, la mediana y la moda.

- Media aritmética: valor medio o promedio de una variable. No se puede hallar en las             variables cualitativas, nominales o categóricas.

   Por ejemplo: Imagínate que te piden la media aritmética de la edad de las personas que      viven en tu casa, que en mi caso sería: 13,19 y 50. 

   1º Sumamos todas las edades: 13+19+50=82
   2º Dividimos entre el número de personas: 82/3= 27,3333



- Mediana: es el valor que ocupa la posición central de la distribución. Para poder hallarla    es necesario que los datos estén ordenados, de forma creciente o decreciente. La      mediana deja a un lado y al otro el 50% de los casos.

   Por ejemplo: calcula la mediana de la altura de los alumnos de la primera fila de tu clase:    1.60, 1.63, 1.72, 1.76 y 1.80:  

   1.72 sería la mediana porque deja a un lado y al otro el 50% de los casos. 
   
  ¿Qué hacemos en el caso de que el número sea par? 😰 Cuando el número de análisis       sea par,  el valor de la mediana corresponde a la media entre los dos valores centrales, es   decir, la media entre la observación n/2 y la observación (n/2)+1.

- Moda: es la categoría o valor de la variable que se presenta mayor número de veces, es     decir, la variable que presenta mayor frecuencia.

  Ejemplo: 20, 21, 21, 25, 26, 27. La moda sería 21, ya que es el valor que más se repite.

  Si hay más de una se dice que la muestra es bimodal (dos modas) o multimodal (más de     dos).


2. Medidas de posición.

Medidas que nos permiten ubicar el valor en una posición. Ordenando la serie estadística de menor a mayor. Hablamos de variables numéricas. 
  • Percentiles (P): dividen la distribución de frecuencia en 100 partes iguales.
  • Deciles (D): dividen la distribución de frecuencia en 10 partes iguales.
  • Cuartiles (Q): dividen la distribución en cuatro partes iguales, cada una de ellas con el 25% de los casos. El Q₂ (50%) coincide con la mediana.
Os adjunto a continuación un vídeo por si tenéis alguna duda. Espero que os sirva!



3. Medidas de dispersión o variabilidad.

Las medidas de dispersión describen cómo se distribuyen las puntuaciones de variables de intervalo o razón.

Nos permiten saber si los individuos que componen una población son parecidos en la variable que estamos estudiando (igual edad, igual número de hijos...) o si hay grandes diferencias entre ellos.

Son medidas de dispersión: 
  • Rango o amplitud del recorrido:  diferencia entre el mayor y el menor valor de la muestra |xn-x1|.
  • Desviación media:  media aritmética de las distancias de cada observación con respecto a la media de la muestra:
  • Desviación típica: cuantifica el error que cometemos si representamos una muestra únicamente por su media (el parámetro en la población se representa por σ):
  • Varianza:  expresa la misma información en valores cuadráticos (en la población el parámetro se expresa por σ2):
  • Recorrido intercuartílico: es la diferencia entre los cuartiles tercero y primero. Nos indica la longitud del intervalo en el que se sitúan el 50% de los valores centrales: RIC=Q3-Q1.  Su interpretación es sencilla. Si el recorrido intercuartílico es pequeño, será indicativo de poca dispersión. Y a la inversa, si el recorrido intercuartílico es grande, expresará gran dispersión. 

  • Coeficiente de variación:  es una medida de dispersión relativa (adimensional) ya que todas las demás se expresan en la unidad de medida de la variable. Nos sirve para comparar la heterogeneidad de dos series numéricas con independencia de las unidades de medidas:

4. Formas de una distribución: asimetría y curtosis.

En estadística se llama distribución normal, distribución de Gauss o distribución gaussiana, a una de las distribuciones de probabilidad de variable continua que con más frecuencia aparece en fenómenos reales.
La gráfica de su función de densidad tiene una forma acampanada y es simétrica respecto de los valores posición central (media, mediana y moda, que coinciden en estas distribuciones). Esta curva se conoce como campana de Gauss.


La asimetría informa si los extremos de la curva asociados a los datos son más alargados hacia alguno de los lados.

  • Asimetría positiva indica que los valores más extremos se encuentran a la derecha de la media.
  • Asimetría negativa si los valores más extremos se encuentran a la izquierda de la media.
  • Sesgo a la izquierda o a la derecha: los índices más utilizados para medir el sesgo de la curva son el coeficiente de Pearson y el de Fisher.



Curtosis o apuntamiento

Coeficiente de apuntamiento o curtosis de una variable, sirve para medir el grado de concentración de los valores que toma en torno a su media. 

Se elige como referencia de una variable con distribución normal, de modo que para ella el coeficiente de curtosis es 0. 

Pueden ser: 
  • Mesocúrtica si la distribución sigue el mismo apuntamiento que la distribución normal.
  • Platicúrtica, si el coeficiente de curtosis es negativo indica que la curva es más aplanada que la normal.
  • Leptocúrtica, si el coeficiente de curtosis es positivo indica que la curva tiene más relación entre media-mediana-moda que la normal.








   

Comentarios

Entradas populares de este blog

TEMA 3: DE LOS CONCEPTOS A LAS VARIABLES: Población, muestra, parámetros y estadísticos. Variables y escalas de medida.

TEMA 10: ESTIMACIÓN Y/O SIGNIFICACIÓN ESTADÍSTICA Distribuciones muestrales para medias y datos continuos. Distribuciones muestrales para proporciones y datos categóricos.

TEMA 6: REPRESENTACIÓN GRÁFICA DE LA INFORMACIÓN: Representación variables cualitativas y cuantitativas discretas. Representación de variables cuantitativas continuas. Errores en las representaciones.