Diferencias
Muestra las diferencias entre dos versiones de la página.
Ambos lados, revisión anterior Revisión previa Próxima revisión | Revisión previa | ||
clase:ia:saa:2_estadistica:pt [2021/07/27 12:24] cesguiro |
— (actual) | ||
---|---|---|---|
Línea 1: | Línea 1: | ||
- | ====== 06 - Puntuaciones típicas ====== | ||
- | |||
- | Las puntuaciones directas nos ofrecen muy poca información. Por ejemplos, conociendo una puntuación directa no sabemos si se trata de un valor alto o bajo porque esto depende del promedio del grupo. | ||
- | |||
- | Existen otras puntuaciones que resuelven ese problema, como la **puntuación típica o tipificada** | ||
- | |||
- | ===== Puntuaciones típicas o tipificadas (z-score) ===== | ||
- | |||
- | Una puntuación típica **indica el número de desviaciones típicas que se aparta de la media una determinada puntuación**. | ||
- | |||
- | Su media es 0 y su varianza es igual a 1. | ||
- | |||
- | Para calcular la puntuación típica usamos la fórmula: | ||
- | |||
- | ;#; | ||
- | $ \displaystyle z_{x} = \frac{X - \overline{X}}{S_{x}} $ | ||
- | ;#; | ||
- | |||
- | Si transformamos las puntuaciones directas en puntuaciones típicas, obtenemos la llamada **distribución normal estándar o tipificada**, | ||
- | |||
- | {{ : | ||
- | |||
- | En Python podemos utilizar la librería scipy.stats para calcular las puntuaciones típicas: | ||
- | |||
- | <sxh python> | ||
- | import numpy as np | ||
- | |||
- | datos = np.array([479, | ||
- | 475, 478, 493, 473, 483, 487, 488, 494, 475, 465, | ||
- | 516, 524, 490]) | ||
- | |||
- | mu = np.mean(datos) | ||
- | sigma = np.std(datos, | ||
- | |||
- | print(" | ||
- | print(" | ||
- | </ | ||
- | |||
- | <sxh base> | ||
- | Media: 485.25 | ||
- | Desviación: | ||
- | </ | ||
- | |||
- | <sxh python> | ||
- | # Calcular z-scores | ||
- | import scipy.stats as st | ||
- | |||
- | zscores = st.zscore(datos) | ||
- | print(zscores) | ||
- | </ | ||
- | |||
- | <sxh base> | ||
- | [-0.40111311 -0.5294693 | ||
- | | ||
- | 0.11231167 | ||
- | 2.48690128 | ||
- | </ | ||
- | |||
- | ===== Áreas y proporciones bajo la curva normal ===== | ||
- | |||
- | < | ||
- | |||
- | Primero calculamos la puntuación típica correspondiente a la nota dada (5.5): | ||
- | |||
- | ;#; | ||
- | $ \displaystyle z_{x} = \frac{X - \overline{X}}{S_{x}} | ||
- | ;#; | ||
- | |||
- | Cálculo en Python: | ||
- | |||
- | <sxh python> | ||
- | nota = 5.5 | ||
- | z = np.divide(np.subtract(nota, | ||
- | print(z) | ||
- | </ | ||
- | |||
- | <sxh base> | ||
- | -0.25 | ||
- | </ | ||
- | |||
- | Después tenemos que encontrar a qué probabilidad corresponde ese z-score. Lo podemos hacer manualmente utilizando la tabla de distribución normal: [[https:// | ||
- | |||
- | En esa tabla buscaríamos la probabilidad de que un estadístico sea menor que una determinada puntuación típica (en este caso -0.25). Buscaríamos en la primera columna el valor -0.2 y en la primera fila el valor -0.05: 0.41294. | ||
- | |||
- | También podemos usar la función norm.cdf de la librería scipy.stats en Python: | ||
- | |||
- | <sxh python> | ||
- | import scipy.stats as st | ||
- | |||
- | probabilidad = st.norm.cdf(z) | ||
- | print(probabilidad) | ||
- | </ | ||
- | |||
- | <sxh base> | ||
- | 0.4012936743170763 | ||
- | </ | ||
- | |||
- | ¿Qué significa ese valor? Que el 40.13 % de los datos (las notas) están por debajo de la puntuación típica calculada (-0.25). O lo que es lo mismo. el 40.13% de los alumos tienen una nota menor o igual que 5.5. | ||
- | |||
- | {{ : | ||
- | |||
- | Haciendo una simple regla de 3: | ||
- | |||
- | ;#; | ||
- | $ \displaystyle x = \frac{500 * 40.13}{100} | ||
- | ;#; | ||