Neste desafio deverá descobrir quais estudantes estão fazendo a prova apenas para treino.
Neste desafio você aprenderá:
- Python
- Pandas
- Sklearn
- Regression
- Classification
Você precisará de python 3.6 (ou superior) e do gerenciador de pacotes pip.
Para instalar os requisitos, execute o comando como no exemplo abaixo:
pip install -r requirements.txt
O contexto do desafio gira em torno dos resultados do ENEM 2016 (disponíveis no arquivo train.csv). Este arquivo, e apenas ele, deve ser utilizado para todos os desafios. Qualquer dúvida a respeito das colunas, consulte o Dicionário dos Microdados do Enem 2016.
Alguns estudantes decidem realizar prova do ENEM de forma precoce, como um teste (coluna IN_TREINEIRO). Neste desafio, você deve criar um modelo de classificação binária para inferir a mesma. Os resultados possíveis da sua resposta devem ser “0” ou “1”.
Salve sua resposta em um arquivo chamado answer.csv com duas colunas: NU_INSCRICAO
e IN_TREINEIRO
.