Giter Club home page Giter Club logo

analise_microdadosenem_2021's Introduction

Análise dos Micro Dados do ENEM/2021

forthebadge made-with-python

Descrição do Projeto

Esse projeto foi desenvolvido com o intuito de realizar uma análise profunda nos dados brutos do ENEM/2021. Para então traçar um panorama do ensino no país, bem como o perfil dos inscritos.

O relatório com toda informação gerada, auxiliada por diversos gráficos está publicada no meu perfil do medium, através do link abaixo:

Confira o artigo no Medium!

Os micro dados utilizados neste projetos foram baixados no portal de dados abertos do governo federal, o arquivo CSV não está anexado a este repositório, por ser pesado demais, tendo 1.40 GB e shape de (3.383.000 x 77)

Divisão do Projeto

  • Main.py
  • Arquivo 'filtroDados'
  • escolaNota.py
    Arquivo destinado ao tratamento e modelagem dos dados relacionados ao impacto dos tipos de escolas no desempenho
    inscritosGeral.py
    Arquivo destinado ao tratamento e modelagem dos dados relacionados gerais de candidatos
    redacaoNota.py
    Modelagem do panorama geral e status das redações do ENEM, bem como do desempenho dos estudantes
    socio_economico.py
    Modelagem dos dados referente ao fator socioeconomico dos candidatos, e o impacto deste no desempenho final
    utils.py arquivo destinados aos import's, arrays com os filtros das tabelas e dicionários para conversão dos dados.
  • Arquivo 'graphics'
  • ➜ Pasta destinada aos gráficos gerados com matplotlib e seaborn

Análise exploratória

Formato dos dados CSV, shape(3.389.832 x 77):

Descrição da imagem



Criação de arrays com os nomes das colunas necessárias a cada análise:

Descrição da imagem



Já nos arquivos de cada análise, preparei os dados com base na sequência: criação do dataframe utilizando o array correspondente de 'utils.py' / verificação de valores ausentes ou nulos / criação de uma coluna com valores 'Presente' ou 'Eliminado', com base nos valores ausentes das notas de cada disciplina / criação de coluna para a nota média geral de cada inscrito. No caso abaixo, como as quantidades de valores ausentes das colunas "Q00.." são inexpressivas, atribuí valores recorrentes.

Descrição da imagem



Após isso, iniciei as consultas para posterior plotagem e confecção de relatório final, que está postado no Medium:

Descrição da imagem

analise_microdadosenem_2021's People

Contributors

alyssonmontovanelli avatar

Watchers

 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.