Giter Club home page Giter Club logo

oc_ds_project2's Introduction

PROJET-2

Analysez des données de systèmes éducatifs 60 heures Mis à jour le lundi 20 mai 2019

Vous êtes Data Scientist dans une start-up de la EdTech, nommée Academy, qui propose des contenus de formation en ligne pour un public de niveau lycée et université.

Votre entreprise EdTech Mark, votre manager, vous a convié à une réunion pour vous présenter le projet d’expansion à l’international de l’entreprise. Il vous confie une première mission d’analyse exploratoire, pour déterminer si les données sur l’éducation de la banque mondiale permettent d’informer le projet d’expansion.

Voici les différentes questions que Mark aimerait explorer, que vous avez notées durant la réunion :

Quels sont les pays avec un fort potentiel de clients pour nos services ? Pour chacun de ces pays, quelle sera l’évolution de ce potentiel de clients ? Dans quels pays l'entreprise doit-elle opérer en priorité ? Votre mission Mark vous a donc demandé de réaliser une analyse pré-exploratoire de ce jeu de données. Il vous a transmis cet email à la suite de la réunion :

Hello,
Les données de la Banque mondiale sont disponibles à l’adresse suivante :
https://datacatalog.worldbank.org/dataset/education-statistics
Je te laisse regarder la page d'accueil qui décrit le jeu de données. En résumé, l’organisme “EdStats All Indicator Query” de la Banque mondiale répertorie 4000 indicateurs internationaux décrivant l’accès à l’éducation, l’obtention de diplômes et des informations relatives aux professeurs, aux dépenses liées à l’éducation... Tu trouveras plus d'info sur ce site :
http://datatopics.worldbank.org/education/
Pour la pré-analyse, pourrais-tu :
Valider la qualité de ce jeu de données (comporte-t-il beaucoup de données manquantes, dupliquées ?)
Décrire les informations contenues dans le jeu de données (nombre de colonnes ? nombre de lignes ?)
Sélectionner les informations qui semblent pertinentes pour répondre à la problématique (quelles sont les colonnes contenant des informations qui peuvent être utiles pour répondre à la problématique de l’entreprise ?)
Déterminer des ordres de grandeurs des indicateurs statistiques classiques pour les différentes zones géographiques et pays du monde (moyenne/médiane/écart-type par pays et par continent ou bloc géographique)
Ton travail va nous permettre de déterminer si ce jeu de données peut informer les décisions d'ouverture vers de nouveaux pays. On va partager ton analyse avec le board, alors merci de soigner la présentation et de l'illustrer avec des graphiques pertinents et lisibles !

Livrables attendus Un notebook comportant les analyses pré-exploratoires réalisées (non cleané, pour comprendre votre démarche). Un support de présentation pour la soutenance.

Modalités de la soutenance 5 min - Rappel de la problématique et présentation du jeu de données (à l'aide de votre support de présentation) 15 min - Présentation de l’analyse pré-exploratoire du jeu de données et vos conclusions sur la pertinence de l’usage du jeu de données pour répondre aux questions stratégiques que se pose l’entreprise (à l'aide du notebook) 5 à 10 minutes de questions-réponses

Ressources complémentaires Un document décrivant les bonnes pratiques pour réaliser des graphiques clairs et pertinents Le cours OpenClassrooms Réalisez des rapports statistiques clairs et impactants Compétences évaluées Effectuer une représentation graphique à l'aide d'une librairie Python adaptée Utiliser un notebook Jupyter pour faciliter la rédaction du code et la collaboration Manipuler des données avec des librairies Python spécialisées Maîtriser les opérations fondamentales du langage Python pour la Data Science Mettre en place un environnement Python

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.