Giter Club home page Giter Club logo

tcc's Introduction

Comparação e Otimização de Algoritmos de Aprendizagem por Reforço Profundo aplicados ao simulador do jogo Enduro do Atari 2600

Esse é o repositório público do Trabalho de Conclusão de Curso da graduação em Engenharia de Computação no Inatel.

Para saber mais sobre o trabalho leia o nosso artigo, ou acesse o armazenamneto em nuvem.

Resumo

O crescente emprego da inteligência artificial em contextos que vão desde ambientes industriais a aplicações domésticas, vem trazendo crescimento econômico e melhoria na qualidade de vida das pessoas, além de impulsionar iniciativas de pesquisa e desenvolvimento. Nesse sentido, o presente trabalho situa-se no contexto de aprendizagem de máquina, realizando a análise, execução, otimização e comparação dos algoritmos de aprendizado por reforço dos algoritmos DQN, PPO e A2C aplicados ao jogo Enduro do Atari 2600. São apresentados os desempenhos dos algoritmos submetidos ao jogo em diferentes cenários, é feita uma discussão sobre a influência da otimização de hiperparâmetros do algoritmo que se sobressaiu em relação aos outros e, finalmente, um comentário a respeito da exequibilidade deste processo quando os espaço amostral é vasto.

Sobre o repositório

Esse repositório mantém os scripts responsáveis por executar os treinamentos utilizando a biblioteca RL Baselines3 Zoo.

install.sh

Esse script deve ser executado para instalar as dependências necessárias e fazer download dos modelos finais treinados durante os experimentos.

train.sh

Esse script deve ser executado para treinar novos modelos a partir dos parâmetros fornecidos.

tune.sh

Esse script deve ser executado para iniciar uma nova bateria de otimizações.

record_video.sh

Esse script deve ser executado para realizar uma execução do jogo com os modelos treinados e os resultados serão gravados em video.

Previsualização

fast

Autores

O trabalho foi desenvolvido pelos alunos @ghmpessa, @JoaoLeonardoMorganti e @zoruka. Finalizado em Dezembro de 2021.

tcc's People

Contributors

zoruka avatar

Stargazers

Sinara Pimenta avatar

Watchers

 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.