¡Esta es una revisión vieja del documento!
06 - Puntuaciones típicas
Las puntuaciones directas nos ofrecen muy poca información. Por ejemplos, conociendo una puntuación directa no sabemos si se trata de un valor alto o bajo porque esto depende del promedio del grupo.
Existen otras puntuaciones que resuelven ese problema, como la puntuación típica o tipificada
Puntuaciones típicas o tipificadas (z-score)
Una puntuación típica indica el número de desviaciones típicas que se aparta de la media una determinada puntuación.
Su media es 0 y su varianza es igual a 1.
Para calcular la puntuación típica usamos la fórmula:
$ \displaystyle z_{x} = \frac{X - \overline{X}}{S_{x}} $
Si transformamos las puntuaciones directas en puntuaciones típicas, obtenemos la llamada distribución normal estándar o tipificada, que tiene de media cero y varianza 1 y que simbolizamos con N(0, 1)
En Python podemos utilizar la librería scipy.stats para calcular las puntuaciones típicas:
import numpy as np datos = np.array([479, 477, 492, 493, 454, 495, 474, 475, 478, 493, 473, 483, 487, 488, 494, 475, 465, 516, 524, 490]) mu = np.mean(datos) sigma = np.std(datos, ddof = 1) print("Media:", mu) print("Desviación:", sigma)
Media: 485.25 Desviación: 15.986425162420904
# Calcular z-scores import scipy.stats as st zscores = st.zscore(datos) print(zscores)
[-0.40111311 -0.5294693 0.43320216 0.49738026 -2.00556555 0.62573645 -0.7220036 -0.6578255 -0.46529121 0.49738026 -0.78618169 -0.14440072 0.11231167 0.17648977 0.56155835 -0.6578255 -1.29960647 1.9734765 2.48690128 0.30484596]
Áreas y proporciones bajo la curva normal
Primero calculamos la puntuación típica correspondiente a la nota dada (5.5):
$ \displaystyle z_{x} = \frac{X - \overline{X}}{S_{x}} = \frac{5.5 - 6}{2} = -0.25$
Cálculo en Python:
nota = 5.5 z = np.divide(np.subtract(nota, mu), sigma) print(z)
-0.25
Después tenemos que encontrar a qué probabilidad corresponde ese z-score. Lo podemos hacer manualmente utilizando la tabla de distribución normal: https://en.wikipedia.org/wiki/Standard_normal_table
En esa tabla buscaríamos la probabilidad de que un estadístico sea menor que una determinada puntuación típica (en este caso -0.25). Buscaríamos en la primera columna el valor -0.2 y en la primera fila el valor -0.05: 0.41294.
También podemos usar la función norm.cdf de la librería scipy.stats en Python:
import scipy.stats as st probabilidad = st.norm.cdf(z) print(probabilidad)
0.4012936743170763
¿Qué significa ese valor? Que el 40.13 % de los datos (las notas) están por debajo de la puntuación típica calculada (-0.25). O lo que es lo mismo. el 40.13% de los alumos tienen una nota menor o igual que 5.5.
Haciendo una simple regla de 3:
$ \displaystyle x = \frac{500 * 40.13}{100} = 200.65 \cong 201 alumnos $