¡Esta es una revisión vieja del documento!
05 - Ejercicios 5.1
Con el dataset anterior (altura de padres e hijos):
- Crear un dataframe de Pandas con la información del dataset
- Mostrar la información del dataset y el gráfico que relacione ambos datos
- Separar el dataframe en 4 grupos: característica de entrenamiento (altura de los padres), característica de test (30% de las filas), etiqueta de entrenamiento (altura de los hijos), etiqueta de test
- Mostrar el número de registros de cada grupo (entrenamiento y test)
- Entrenar un modelo de regresión lineal con sklearn y mostrar los coeficientes (constante y pendiente)
- Mostrar un gráfico con los puntos y la recta de regresión
- Mostrar las métricas de los datos de entrenamiento
- Calcular las predicciones de los datos de test y mostrar los valores de las diferentes métricas
Con el dataset anterior:
- Muestra un gráfico con la distribución de los datos
- Separa los datos en entrenamiento/test
- Muestra un gráfico con los datos de entrenamiento para asegurarte que sigue la misma distribución que los datos completos
- Intenta ajustar la línea de regresión a los datos. Prueba con 1, 4, 10, 20, 30 y 50 grados de la ecuación. Muestra el MSE de cada una de ellas y un gráfico donde se muestre la distribución de los datos y la línea de regresión calculada