06 - Puntuaciones típicas

¡Esta es una revisión vieja del documento!

Las puntuaciones directas nos ofrecen muy poca información. Por ejemplos, conociendo una puntuación directa no sabemos si se trata de un valor alto o bajo porque esto depende del promedio del grupo.

Existen otras puntuaciones que resuelven ese problema, como la puntuación típica o tipificada

Una puntuación típica indica el número de desviaciones típicas que se aparta de la media una determinada puntuación.

Su media es 0 y su varianza es igual a 1.

Para calcular la puntuación típica usamos la fórmula:

$ \displaystyle z_{x} = \frac{X - \overline{X}}{S_{x}} $

Si transformamos las puntuaciones directas en puntuaciones típicas, obtenemos la llamada distribución normal estándar o tipificada, que tiene de media cero y varianza 1 y que simbolizamos con N(0, 1)

En Python podemos utilizar la librería scipy.stats para calcular las puntuaciones típicas:

  
import numpy as np

datos = np.array([479, 477, 492, 493, 454, 495, 474,
475, 478, 493, 473, 483, 487, 488, 494, 475, 465,
516, 524, 490])

mu = np.mean(datos)
sigma = np.std(datos, ddof = 1)

print("Media:", mu)
print("Desviación:", sigma)

Media: 485.25
Desviación: 15.986425162420904

  
# Calcular z-scores
import scipy.stats as st

zscores = st.zscore(datos)
print(zscores)

[-0.40111311 -0.5294693   0.43320216  0.49738026 -2.00556555  0.62573645
 -0.7220036  -0.6578255  -0.46529121  0.49738026 -0.78618169 -0.14440072
  0.11231167  0.17648977  0.56155835 -0.6578255  -1.29960647  1.9734765
  2.48690128  0.30484596]

Imaginemos que las calificaciones en una determinada asignatura X, de un grupo de 500 niños se distribuyen normalmente con media 6 y desviación típica 2 y queremos determinar el número de alumnos que obtienen puntuaciones menores o iguales a 5.5.

Primero calculamos la puntuación típica correspondiente a la nota dada (5.5):

$ \displaystyle z_{x} = \frac{X - \overline{X}}{S_{x}} = \frac{5.5 - 6}{2} = -0.25$

Cálculo en Python:

nota = 5.5 
z = np.divide(np.subtract(nota, mu), sigma)
print(z)

-0.25

Después tenemos que encontrar a qué probabilidad corresponde ese z-score. Lo podemos hacer manualmente utilizando la tabla de distribución normal: https://en.wikipedia.org/wiki/Standard_normal_table

En esa tabla buscaríamos la probabilidad de que un estadístico sea menor que una determinada puntuación típica (en este caso -0.25). Buscaríamos en la primera columna el valor -0.2 y en la primera fila el valor -0.05: 0.41294.

También podemos usar la función norm.cdf de la librería scipy.stats en Python:

import scipy.stats as st

probabilidad = st.norm.cdf(z)
print(probabilidad)

0.4012936743170763

¿Qué significa ese valor? Que el 40.13 % de los datos (las notas) están por debajo de la puntuación típica calculada (-0.25). O lo que es lo mismo. el 40.13% de los alumos tienen una nota menor o igual que 5.5.

Haciendo una simple regla de 3:

$ \displaystyle x = \frac{500 * 40.13}{100} = 200.65 \cong 201 alumnos $

06 - Puntuaciones típicas

Puntuaciones típicas o tipificadas (z-score)

Áreas y proporciones bajo la curva normal

cesguiro