Giter Club home page Giter Club logo

hey-i-am-a-data-analyst's Introduction

portaada

W3 - ¡Soy analista de datos!

Eres el nuevo analista de datos de tu empresa, acabas de incorporarte y te han encargado un marrón del que no puedes escapar. Hay una reunión urgente el próximo martes con un comprador súper interesado en tu producto/servicio. Tienes que convencer a esas personas de que tu producto/servicio es increíble y solo te han dejado un dataset...crees que no vas a conseguirlo, pero vas a limpiarlo, enriquecerlo, analizarlo y con la magia de los gráficos lograrás convencer a todo el mundo de LO QUE QUIERAS.

Objetivos del proyecto

Los objetivos de este proyecto son poner en práctica todo lo que has aprendido durante estas semanas. Trabajar en diferentes formatos de archivos. Realizar funciones que tengan diferentes propósitos. Poder importar diversos archivos de funciones a un jupyter notebook. Afianzar y superarte en tus conocimientos de Pandas y otras librerías utilizadas en clase. Manejar un dataset nuevo a la perfección. Contar una historia sacando conclusiones gracias a los gráficos que puedas pintar.

Requisitos

Obligatoriedad de los requisitos:

✅ = Obligatorio
🚀 = Opcional (pero recomendable)
🔥 = Bonus

  • Jupyters notebook:

    • Limpieza de los datos: Tendrás un jupyter notebook donde limpies el dataset que te has descargado. ✅
    • Enriquecido de datos: Tendrás un jupyter notebook donde harás llamadas a alguna API o Web Scraping para obtener más datos y así enriquecer los que ya tienes. ✅
    • Story telling: donde partes de los datos limpios para crear un reporte para tu posible comprador con tablas, gráficas y todo lo necesario para convencerle de que es una buena inversión. Acuérdate que eso es lo que se entregará directamente al cliente, tiene que estar limpio, cristalino y bonito (para entrar a vivir). ✅
    • Realiza un dashboard con streamlit interactivo. 🚀
  • Código en funciones:

    • Deberías hacer funciones de proposito unico, parametrizadas. ✅
    • Diferentes archivos .py con funciones, uno de ellos para limpieza, el resto a tu criterio. 🚀
    • Tiene que haber más de 3 funciones en todo el proyecto. ✅
  • Gráficos:

    • Tiene que haber, al menos, dos librerías diferentes de gráficos. 🚀 (Matplotlib, seaborn, plotly) Una es obligatoria, más de una es opcional.
    • Elegir diferentes tipos de gráficos, por ejemplo:
      • Bar.
      • Line.
      • Pie.
      • Candlestick.
    • Los gráficos deben tener títulos, leyendas, nombres en los ejes... ✅
  • Técnicas de Python:

    • Regex, al menos una expresión regular para la limpieza. ✅
    • Lambda, por lo menos una función lambda en el proyecto. ✅
    • Apply, aplicar una función al menos al dataset mediante un .apply ✅
  • Base de datos

    • Guarda tus datos en una base de datos de SQL. 🔥
    • Guarda tus datos en una base de datos de MongoDB. 🔥 Elige una base de datos o ... ¡las dos!

¿Por dónde empiezo?

Elige un dataset de Kaggle https://www.kaggle.com/ o... ¡varios!. Temática libre. Analízalo, explóralo a fondo. Después limpialo y dale la forma que necesites para contar tu historia. Piensa que tienes que convencer a una gente importante y tu futuro depende de ello. Ayúdate de otras fuentes de datos para tener aún más información, cuantos más datos... ¡¡mejor!! Aplica todas las funciones que necesites para ello. Saca los gráficos más molones y mejor explicados de la historia.

Links y recursos

hey-i-am-a-data-analyst's People

Contributors

olmocorell avatar acamposla avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.