Giter Club home page Giter Club logo

nutrition-poc's Introduction

Nutrition POC


Introduction

Vous êtes missionnés par un client pour réaliser une analyse exploratoire sur les données de nutrition Open Source. En effet ce client souhaiterait développer une application utilisant ces données et souhaiterai connaitre la faisabilité et la plus-value.

Ressources


Open Data Nutrition

MetaData


Contexte du projet

Manger mieux pour vivre mieux


Conseils healthy (oranges)

Part 1


  • Stockage de l'ensemble des données dans une BDD
  • Connexion à votre base via un script Python
  • Répondre aux questions SQL en PJ

Requêtes SQL

Nombre de produits par nutriscore

SELECT count(*) AS 'products_count', nutriscore_grade FROM nutrition.products
	GROUP by nutriscore_grade;

Quel est le pourcentage de représentation associé?

SELECT nutriscore_grade, COUNT(*) * 100.0 / (SELECT COUNT(*) FROM openfoodfacts.products)
FROM openfoodfacts.products 
GROUP by nutriscore_grade;

Les 4 valeurs possibles du Nova_Group

SELECT nova_group FROM nutrition.products
	GROUP BY Nova_group;

Quel est la moyenne des fibres par nutriscore ?

SELECT AVG(fiber_100g) AS 'moyenne fibres', nutriscore_grade FROM nutrition.products
	GROUP BY nutriscore_grade;

Quels sont le TOP10 des pnns_groups_2 qui comportent le plus d'additif

SELECT pnns_groups_2, MAX(additives_n)
FROM openfoodfacts.products
GROUP BY pnns_groups_2
LIMIT 10;

Afficher le taux de sucre/fat moyen et médian des produits avec un nutriscore A ou B

SELECT AVG(sugars_100g) AS 'Moyenne Sucre', product_name
FROM openfoodfacts.products
WHERE nutriscore_grade='a' OR nutriscore_grade='b'
GROUP BY product_name;
Combien avons-nous de produits qui ont un taux de carbohydrates > aux sucres

SELECT COUNT(DISTINCT product_name) AS 'Total des produits'
FROM openfoodfacts.products
WHERE carbohydrates_100g > sugars_100g;

Part 2


  • Traiter le jeu de données afin de repérer des variables pertinentes pour les traitements à venir.
  • Automatiser ces traitements pour éviter de répéter ces opérations.
  • Le programme doit fonctionner si la base de données est légèrement modifiée (ajout d’entrées, par exemple).
  • Tout au long de l’analyse, produire des visualisations dynamiques (avec ++plotly++) afin de mieux comprendre les données.
  • Effectuer une analyse univariée pour chaque variable intéressante, afin de synthétiser son comportement.
  • Variez les graphiques (boxplots, histogrammes, diagrammes circulaires, nuages de points…) pour illustrer au mieux votre propos.
  • Confirmer ou infirmer les hypothèses à l’aide d’une analyse multivariée.
  • Effectuer les tests statistiques appropriés pour vérifier la significativité des résultats.
  • Élaborer une idée (juste une idée !) d’application.
  • Identifier des arguments justifiant la faisabilité (ou non) de votre idée d'application à partir des données Open Food Facts et de vos analyses.

Tasks

Modalités pédagogiques


Rendus pour mardi 12/10 15h30

Un retroplanning devra être fait de manière détaillé avant de démarrer puis, évidemment, maintenu à jour.

Groupe : Véronique, Adil, Cédric


Livrables


  • Un notebook comprenant vos requêtes relatives à la Part.1 (OK)
  • Un notebook du nettoyage des données (OK)
  • Un notebook d’exploration comportant une analyse univariée, multivariée ainsi que les différentes questions de recherches associées (in progress)
  • Une note méthodologique de réutilisation de vos notebooks (environnement, packages, données, etc)
  • Une présentation, à utiliser en support pour la soutenance, comprenant
    • La présentation de votre idée d’application.
    • Les opérations de nettoyage effectuées.
    • La description et l'analyse univariée des différentes variables importantes avec les visualisations associées.
    • L’analyse multivariée et les résultats statistiques associés, en lien avec votre idée d’application.
    • 3 observations solidement étayées (graphes et/ou tests statistiques à l’appui au besoin) évaluant la pertinence et la faisabilité de votre application.
    • La synthèse des différentes conclusions sur la faisabilité de votre projet.
  • Github ou Drive condensant l'ensemble de ces livrables

nutrition-poc's People

Contributors

adilsmh avatar

Watchers

 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.