Este repositorio está dedicado a almacenar y compartir mis apuntes de la asignatura "Minería de Datos", cursada durante mi grado en Ingeniería de la Salud con mención en Bioinformática. Este repositorio será administrado usando Git.
El objetivo principal de este repositorio es proporcionar un espacio en el que pueda guardar mis apuntes a lo largo del curso.
Aquí encontrarás notas y ejercicios sobre las técnicas fundamentales para preparar los datos antes del análisis. Esto incluye:
- Limpieza de datos: Cómo identificar y tratar con datos faltantes, erróneos o atípicos.
- Normalización: Métodos para escalar y normalizar los datos, preparándolos para análisis.
- Discretización: Técnicas para transformar variables continuas en categóricas.
- Selección y extracción de variables: Estrategias para reducir la dimensión de los datos, seleccionando las variables más relevantes o extrayendo nuevas características.
Este bloque se enfoca en la aplicación de técnicas de minería de datos, cubriendo:
- Aprendizaje supervisado y no supervisado: Diferencias, aplicaciones y ejemplos en biomedicina.
- Diseño de modelos predictivos en biomedicina: Construcción y aplicación de modelos para predecir resultados de salud.
- Métricas de evaluación de modelos: Cómo medir el rendimiento de los modelos de minería de datos.
- Validación interna de modelos: Métodos para validar la fiabilidad y generalización de los modelos.
La fase final se centra en interpretar y presentar los resultados obtenidos:
- Evaluación e interpretación de los resultados: Técnicas para analizar los resultados de los modelos, enfocándose en su significado biológico o médico.
- Visualización de estructuras de datos complejas: Herramientas y técnicas para visualizar datos multidimensionales, facilitando la interpretación de estructuras complejas y resultados de modelos.
- R: Lenguaje de programación principal utilizado en esta asignatura para el análisis de datos y la implementación de modelos de machine learning.
- R Markdown: Recomendado para la visualización interactiva de código, resultados y generación de informes.
git clone https://github.com/MarioPasc/Mineria-de-Datos-con-R.git
Todo el contenido teórico y práctico así como la elaboración original de los enunciados de los ejercicios propuestos y resueltos incluídos en este repositorio han sido creados por el Dr. José Manuel Pérez Aragonés.
Este proyecto está bajo la Licencia MIT - ver el archivo LICENSE.md para detalles.
Si tienes alguna pregunta o deseas conectarte, no dudes en contactarme a través de LinkedIn.