Giter Club home page Giter Club logo

gabriel-solon-padilha / predicao_qualidade_vinho_classification Goto Github PK

View Code? Open in Web Editor NEW
0.0 1.0 0.0 8.52 MB

Meu quinto miniprojeto em que faço uma análise da qualidade do vinho usando modelos de machine learning de regressão linear e de regressão logística

Jupyter Notebook 100.00%
python machine-learning-algorithms linear-regression lasso-regression ridge-regression elasticnetregression logistic-regression thresholds eda exploratory-data-analysis

predicao_qualidade_vinho_classification's Introduction

Predição da qualidade do vinho usando algorítmos de regressão e classificação


Introdução

Meu primeiro projeto de machine learning no qual faço uma análise da qualidade do vinho usando modelos de machine learning de regressão linear e de regressão logística. Os datasets são dados sobre vinhos tintos e vinhos brancos com as seguintes features e target:

Features:

  • fixed acidity
  • volatile acidity
  • citric acid
  • residual sugar
  • chlorides
  • free sulfur dioxide
  • total sulfur dioxide
  • density
  • pH
  • sulphates
  • alcohol

Target:

  • quality (score between 0 and 10)

Os dados foram retirados do repositorio de machine learnind da UCI e para mais informações sobre os datasets segue o link do mesmo: https://archive.ics.uci.edu/ml/datasets/Wine+Quality


Desenvolvimento

  1. Análise exploratória dos dados (EDA)
  2. Criação de um modelo de regressão linear multipla e posteriomente com as penalizações Lasso, Ridge e Elastic-net
  3. Criação de um modelo de classificação usando a regressão logística com ajuste fino de threshold
  4. Conclusões sobre o uso de cada um dos modelos e conclusão geral

Resultados alcançados e conclusão

  • Recall: 0,803
  • Precision: 0,802

A predição do vinho a partir de um modelo de regressão claramente não foi a melhor escolha, um dos motivos é a qualidade do vinho ser uma medição discreta e a regressão linear fazer predições de valores contínuis, só isso já aumenta muito os resídulos e dificulta o aprendizado correto do modelo. Ao usar um modelo de classificação o problema de underfit que encontramos na regressão linear já é resolvido e começamos a ter % de acerto na base de teste muito superiores aos da regressão. Dessa forma, o caminho de adotar um modelo de classificação se torna muito mais adequado, sendo necessário somente adequar o threshold para se conseguir uma melhor precision (descartar vinhos ruins) ou recall (recomendar vinhos bons) de acordo com o objetivo do negócio ao criar esse modelo. Nesse projeto foi usada somente a regressão logística para a classificação, porém existem outros modelos que poderiam ser usados e que talvez fossem melhor para prever o comportamento da qualidade do vinho.

predicao_qualidade_vinho_classification's People

Contributors

gabriel-solon-padilha avatar

Watchers

 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.