Diferencias

Muestra las diferencias entre dos versiones de la página.

--- clase:ia:saa:2_estadistica:pt [2021/10/21 18:53]
cesguiro
+++ — (actual)
@@ Línea 1: / Línea 1: @@
-====== 06 - Puntuaciones típicas ======
-Las puntuaciones directas nos ofrecen muy poca información. Por ejemplos, conociendo una puntuación directa no sabemos si se trata de un valor alto o bajo porque esto depende del promedio del grupo.
-Existen otras puntuaciones que resuelven ese problema, como la **puntuación típica o tipificada**
-===== Puntuaciones típicas o tipificadas (z-score) =====
-Una puntuación típica **indica el número de desviaciones típicas que se aparta de la media una determinada puntuación**.
-Su media es 0 y su varianza es igual a 1.
-Para calcular la puntuación típica usamos la fórmula:
-;#;
-$ \displaystyle z_{x} = \frac{X - \overline{X}}{S_{x}} $
-;#;
-Si transformamos las puntuaciones directas en puntuaciones típicas, obtenemos la llamada **distribución normal estándar o tipificada**, que tiene de media cero y varianza 1 y que simbolizamos con N(0, 1)
-{{ :clase:ia:saa:2est:standard-normal-distribution-1024x633.png?400 |}}
-En Python podemos utilizar la librería **scipy.stats** para calcular las puntuaciones típicas:
-<sxh python>
-import numpy as np
-datos = np.array([479, 477, 492, 493, 454, 495, 474,
-, 478, 493, 473, 483, 487, 488, 494, 475, 465,
-, 524, 490])
-mu = np.mean(datos)
-sigma = np.std(datos, ddof = 1)
-print("Media:", mu)
-print("Desviación:", sigma)
-</sxh>
-<sxh base>
-Media: 485.25
-Desviación: 15.986425162420904
-</sxh>
-<sxh python>
-# Calcular z-scores
-import scipy.stats as st
-zscores = st.zscore(datos)
-print(zscores)
-</sxh>
-<sxh base>
-[-0.40111311 -0.5294693   0.43320216  0.49738026 -2.00556555  0.62573645
- -0.7220036  -0.6578255  -0.46529121  0.49738026 -0.78618169 -0.14440072
-.11231167  0.17648977  0.56155835 -0.6578255  -1.29960647  1.9734765
-.48690128  0.30484596]
-</sxh>
-===== Áreas y proporciones bajo la curva normal =====
-<note>Imaginemos que las calificaciones en una determinada asignatura X, de un grupo de 500 niños se distribuyen normalmente con media 6 y desviación típica 2 y queremos determinar el número de alumnos que obtienen puntuaciones menores o iguales a 5.5.</note>
-Primero calculamos la puntuación típica correspondiente a la nota dada (5.5):
-;#;
-$ \displaystyle z_{x} = \frac{X - \overline{X}}{S_{x}}  = \frac{5.5 - 6}{2} = -0.25$
-;#;
-Cálculo en Python:
-<sxh python>
-nota = 5.5
-z = np.divide(np.subtract(nota, mu), sigma)
-print(z)
-</sxh>
-<sxh base>
--0.25
-</sxh>
-Después tenemos que encontrar a qué probabilidad corresponde ese z-score. Lo podemos hacer manualmente utilizando la tabla de distribución normal: [[https://en.wikipedia.org/wiki/Standard_normal_table|]]
-En esa tabla buscaríamos la probabilidad de que un estadístico sea menor que una determinada puntuación típica (en este caso -0.25). Buscaríamos en la primera columna el valor -0.2 y en la primera fila el valor -0.05: 0.40129.
-También podemos usar la función **norm.cdf** de la librería **scipy.stats** en Python:
-<sxh python>
-import scipy.stats as st
-probabilidad = st.norm.cdf(z)
-print(probabilidad)
-</sxh>
-<sxh base>
-.4012936743170763
-</sxh>
-¿Qué significa ese valor? Que el 40.13 % de los datos (las notas) están por debajo de la puntuación típica calculada (-0.25). O lo que es lo mismo. el 40.13% de los alumos tienen una nota menor o igual que 5.5.
-{{ :clase:ia:saa:2est:areas1.png?400 |}}
-Haciendo una simple regla de 3:
-;#;
-$ \displaystyle x = \frac{500 * 40.13}{100}  = 200.65 \cong$ **201 alumnos**
-;#;
-En otros muchos casos, conocemos el número de casos (o su proporción) y necesitamos saber cuál es el valor que nos deja por debajo (o por arriba) esos casos.
-Por ejemplo, queremos saber que nota deja por debajo el 75 % de los alumnos (en realidad estamos calculando el percenti 75 de la distribución típica).
-En este caso, sería hacer el procedimiento inverso al anterior: Deberíamos buscar en el interior de la tabla el valor más cercano a la proporción (0.75) y ver a qué puntuación típica corresponde (0.67). A partir de esa puntuación típica calculamos la nota ($ P_{75} $) de la siguiente manera:
-;#;
-$ \displaystyle z = \frac{P_{75} - \overline{X}}{S_{x}}  \implies 0.67 =  \frac{P_{75} - 6}{2}
-\implies P_{75} = (0.67 * 2) + 6 = 7.34
-$
-;#;
-Igual que antes, en Python podemos utilizar la librería **scipy.stats**. En este caso usamos el método **norm.ppf**:
-<sxh python>
-proporcion = 0.75
-z = st.norm.ppf(proporcion)
-print(z)
-</sxh>
-<sxh base>
-.6744897501960817
-</sxh>
-<sxh python>
-valor = np.add(np.multiply(z, sigma), mu)
-print(valor)
-</sxh>
-<sxh base>
-.348979500392163
-</sxh>