O Automatic Brain tem por objetivo compartilhar experiências práticas em ciência de dados. Esse repositório contém todos os desafios resolvidos com código e, sempre que possível, a base de dados utilizada (ela não será adicionada se for composta de arquivos muito grandes).
Os desafios resolvidos são selecionados de sites conhecidos, como o Kaggle, HackerRank e Driven Data.
Cada pasta desse repositório contém um projeto com todo o código necessário para executá-lo. Dentro de cada projeto há uma pasta chamada data
, que contém os dados usados para resolução do projeto e uma pasta chamada report
que vai conter um arquivo PDF, um Markdown ou um HTML com um relatório gerado a partir da resolução do projeto
- Stack Exchange Question Classifier: toda a resolução do projeto foi realizada dentro de um Jupyter Notebook. Quando instalar todas as dependências do projeto, execute o comando
jupyter notebook
no terminal para inicializá-lo.
Todos os projetos são resolvidos em Python. Para instalar todas as dependências necessárias para executar os projetos, basta executar o comando pip install -r requirements.txt
na pasta raiz do projeto.
Sugestão: criar um virtualenv e instalar as dependências do projeto dentro dele pode ser legal para você.