Te damos la bienvenida al repositorio de Diana y Chloe.
Aquí encontrarás nuestras prácticas de Machine Learning durante el Bootcamp de Data Analytics de Adalab. Hemos utilizado dos conjuntos de datos:
- Uno sobre las ventas de vino y comestibles de un comercio.
- Otra sobre los hábitos de vida y la relación con la obesidad.
En estas prácticas hemos realizado:
- El análisis exploratorio y limpieza de los datos escogidos.
- La comprobación de que los datos cumplieran las asunciones para hacer una Regresión Lineal.
- El test de ANOVA para determinar la importancia de las variables predictoras sobre la variable respuesta.
- La aplicación de un modelo de Regresión Lineal y Cross Validation, y la interpretación de los resultados.
- La aplicación de los algortimos de Decision Tree y Random Forest para los mismos datos y así comparar métricas.
- La aplicación de un modelo de Regresión Logística para predecir valores discretos.
- La aplicación de los algortimos de Decision Tree y Random Forest para los mismos datos discretos.
- La interpretación de una matriz de confusión y las métricas que derivan de la misma, en particular:
- accuracy
- recall
- kappa
- F1
Como herramientas hemos utilizado Python y las siguientes librerías:
- pandas
- numpy
- matplotlib.pyplot
- seaborn
- scipy
- statsmodels.api
- sklearn
Esperemos que nuestro trabajo te sea útil o al menos fácil de leer ;). Si tienes algo que comentarnos estaremos encantadas de leerlo.
¡Hasta pronto!