Diferencias
Muestra las diferencias entre dos versiones de la página.
Ambos lados, revisión anterior Revisión previa Próxima revisión | Revisión previa | ||
clase:ia:saa:2_estadistica:pt [2021/07/27 10:45] cesguiro |
— (actual) | ||
---|---|---|---|
Línea 1: | Línea 1: | ||
- | ====== 06 - Puntuaciones típicas ====== | ||
- | Las puntuaciones directas nos ofrecen muy poca información. Por ejemplos, conociendo una puntuación directa no sabemos si se trata de un valor alto o bajo porque esto depende del promedio del grupo. | ||
- | |||
- | Existen otras puntuaciones que resuelven ese problema, como la **puntuación típica o tipificada** | ||
- | |||
- | ===== Puntuaciones típicas o tipificadas (z-score) ===== | ||
- | |||
- | Una puntuación típica **indica el número de desviaciones típicas que se aparta de la media una determinada puntuación**. | ||
- | |||
- | Su media es 0 y su varianza es igual a 1. | ||
- | |||
- | Para calcular la puntuación típica usamos la fórmula: | ||
- | |||
- | ;#; | ||
- | $ \displaystyle z_{x} = \frac{X - \overline{X}}{S_{x}} $ | ||
- | ;#; | ||
- | |||
- | Si transformamos las puntuaciones directas en puntuaciones típicas, obtenemos la llamada **distribución normal estándar o tipificada**, | ||
- | |||
- | {{ : | ||
- | |||
- | En Python podemos utilizar la librería scipy.stats para calcular las puntuaciones típicas: | ||
- | |||
- | <sxh python> | ||
- | import numpy as np | ||
- | |||
- | datos = np.array([479, | ||
- | 475, 478, 493, 473, 483, 487, 488, 494, 475, 465, | ||
- | 516, 524, 490]) | ||
- | |||
- | mu = np.mean(datos) | ||
- | sigma = np.std(datos, | ||
- | |||
- | print(" | ||
- | print(" | ||
- | </ | ||
- | |||
- | <sxh base> | ||
- | Media: 485.25 | ||
- | Desviación: | ||
- | </ | ||
- | |||
- | <sxh python> | ||
- | # Calcular z-scores | ||
- | import scipy.stats as st | ||
- | |||
- | zscores = st.zscore(datos) | ||
- | print(zscores) | ||
- | </ | ||
- | |||
- | <sxh base> | ||
- | [-0.40111311 -0.5294693 | ||
- | | ||
- | 0.11231167 | ||
- | 2.48690128 | ||
- | </ | ||
- | |||
- | También podemos calcular un z-score en función de una probabilidad dada (y viceversa). Por ejemplo, si queremos saber qué z-score deja por debajo el 95% de los datos: | ||
- | |||
- | <sxh python> | ||
- | zscore = st.norm.ppf(0.95) | ||
- | print(zscore) | ||
- | </ | ||
- | |||
- | <sxh base> | ||
- | 1.6448536269514722 | ||
- | </ | ||
- | |||
- | Y, al contrario: | ||
- | |||
- | <sxh python> | ||
- | probabilidad = st.norm.cdf(1.6448536269514722) | ||
- | print(probabilidad) | ||
- | </ | ||
- | |||
- | <sxh base> | ||
- | 0.95 | ||
- | </ |