Diferencias

Muestra las diferencias entre dos versiones de la página.

Enlace a la vista de comparación

Ambos lados, revisión anterior Revisión previa
Próxima revisión
Revisión previa
clase:ia:saa:2_estadistica:pt [2021/10/21 18:53]
cesguiro
— (actual)
Línea 1: Línea 1:
-====== 06 - Puntuaciones típicas ====== 
- 
-Las puntuaciones directas nos ofrecen muy poca información. Por ejemplos, conociendo una puntuación directa no sabemos si se trata de un valor alto o bajo porque esto depende del promedio del grupo. 
- 
-Existen otras puntuaciones que resuelven ese problema, como la **puntuación típica o tipificada**  
- 
-===== Puntuaciones típicas o tipificadas (z-score) ===== 
- 
-Una puntuación típica **indica el número de desviaciones típicas que se aparta de la media una determinada puntuación**. 
- 
-Su media es 0 y su varianza es igual a 1. 
- 
-Para calcular la puntuación típica usamos la fórmula: 
- 
-;#; 
-$ \displaystyle z_{x} = \frac{X - \overline{X}}{S_{x}} $ 
-;#; 
- 
-Si transformamos las puntuaciones directas en puntuaciones típicas, obtenemos la llamada **distribución normal estándar o tipificada**, que tiene de media cero y varianza 1 y que simbolizamos con N(0, 1) 
- 
-{{ :clase:ia:saa:2est:standard-normal-distribution-1024x633.png?400 |}} 
- 
-En Python podemos utilizar la librería **scipy.stats** para calcular las puntuaciones típicas: 
- 
-<sxh python>   
-import numpy as np 
- 
-datos = np.array([479, 477, 492, 493, 454, 495, 474, 
-475, 478, 493, 473, 483, 487, 488, 494, 475, 465, 
-516, 524, 490]) 
- 
-mu = np.mean(datos) 
-sigma = np.std(datos, ddof = 1) 
- 
-print("Media:", mu) 
-print("Desviación:", sigma) 
-</sxh> 
- 
-<sxh base> 
-Media: 485.25 
-Desviación: 15.986425162420904 
-</sxh> 
- 
-<sxh python>   
-# Calcular z-scores 
-import scipy.stats as st 
- 
-zscores = st.zscore(datos) 
-print(zscores) 
-</sxh> 
- 
-<sxh base> 
-[-0.40111311 -0.5294693   0.43320216  0.49738026 -2.00556555  0.62573645 
- -0.7220036  -0.6578255  -0.46529121  0.49738026 -0.78618169 -0.14440072 
-  0.11231167  0.17648977  0.56155835 -0.6578255  -1.29960647  1.9734765 
-  2.48690128  0.30484596] 
-</sxh> 
- 
-===== Áreas y proporciones bajo la curva normal ===== 
- 
-<note>Imaginemos que las calificaciones en una determinada asignatura X, de un grupo de 500 niños se distribuyen normalmente con media 6 y desviación típica 2 y queremos determinar el número de alumnos que obtienen puntuaciones menores o iguales a 5.5.</note> 
- 
-Primero calculamos la puntuación típica correspondiente a la nota dada (5.5): 
- 
-;#; 
-$ \displaystyle z_{x} = \frac{X - \overline{X}}{S_{x}}  = \frac{5.5 - 6}{2} = -0.25$ 
-;#; 
- 
-Cálculo en Python: 
- 
-<sxh python> 
-nota = 5.5  
-z = np.divide(np.subtract(nota, mu), sigma) 
-print(z) 
-</sxh> 
- 
-<sxh base> 
--0.25 
-</sxh> 
- 
-Después tenemos que encontrar a qué probabilidad corresponde ese z-score. Lo podemos hacer manualmente utilizando la tabla de distribución normal: [[https://en.wikipedia.org/wiki/Standard_normal_table|]]  
- 
-En esa tabla buscaríamos la probabilidad de que un estadístico sea menor que una determinada puntuación típica (en este caso -0.25). Buscaríamos en la primera columna el valor -0.2 y en la primera fila el valor -0.05: 0.40129. 
- 
-También podemos usar la función **norm.cdf** de la librería **scipy.stats** en Python: 
- 
-<sxh python> 
-import scipy.stats as st 
- 
-probabilidad = st.norm.cdf(z) 
-print(probabilidad)  
-</sxh> 
- 
-<sxh base> 
-0.4012936743170763 
-</sxh> 
- 
-¿Qué significa ese valor? Que el 40.13 % de los datos (las notas) están por debajo de la puntuación típica calculada (-0.25). O lo que es lo mismo. el 40.13% de los alumos tienen una nota menor o igual que 5.5. 
- 
-{{ :clase:ia:saa:2est:areas1.png?400 |}} 
- 
-Haciendo una simple regla de 3: 
- 
-;#; 
-$ \displaystyle x = \frac{500 * 40.13}{100}  = 200.65 \cong$ **201 alumnos** 
-;#; 
- 
-En otros muchos casos, conocemos el número de casos (o su proporción) y necesitamos saber cuál es el valor que nos deja por debajo (o por arriba) esos casos. 
- 
-Por ejemplo, queremos saber que nota deja por debajo el 75 % de los alumnos (en realidad estamos calculando el percenti 75 de la distribución típica). 
- 
-En este caso, sería hacer el procedimiento inverso al anterior: Deberíamos buscar en el interior de la tabla el valor más cercano a la proporción (0.75) y ver a qué puntuación típica corresponde (0.67). A partir de esa puntuación típica calculamos la nota ($ P_{75} $) de la siguiente manera: 
- 
-;#; 
-$ \displaystyle z = \frac{P_{75} - \overline{X}}{S_{x}}  \implies 0.67 =  \frac{P_{75} - 6}{2}  
-\implies P_{75} = (0.67 * 2) + 6 = 7.34 
-$ 
-;#; 
- 
-Igual que antes, en Python podemos utilizar la librería **scipy.stats**. En este caso usamos el método **norm.ppf**: 
- 
-<sxh python> 
-proporcion = 0.75 
-z = st.norm.ppf(proporcion) 
-print(z) 
-</sxh> 
- 
-<sxh base> 
-0.6744897501960817 
-</sxh> 
- 
-<sxh python> 
-valor = np.add(np.multiply(z, sigma), mu) 
-print(valor)  
-</sxh> 
- 
-<sxh base> 
-7.348979500392163 
-</sxh> 
  
  • clase/ia/saa/2_estadistica/pt.1634835213.txt.gz
  • Última modificación: 2021/10/21 18:53
  • por cesguiro