Aquest projecte pretén posar en pràctica les activitats que es duen a terme en les fases inicials d'un projecte de mineria de dades. Aquestes tenen com a objectiu obtenir un domini de les dades amb les que es construirà el model de mineria. És vital coneixer profundament les dades tant en el seu format com contingut. Tasques típiques poden ser la selecció de característiques o variables, la preparació del joc de dades per a posteriorment ser consumit per un algorisme (tractament de valors nuls i outliers, transformacions, codificació de les variables categòriques, etc) i intentar extreure el màxim coneixement possible de les dades.
Oriol Toll Laura Gassó
- cleaning_and_validating_data_report.Rmd
Aquest fitxer RMarkdown crea l'informe detallant les tasques d'exportació, neteja i anàlisi de les dades, aplicació de proves estadístiques i aplicació del model.
- carpeta data
Conté els fitxers amb les dades originals i finals analitzades.