Code de Deep Q learning avec recherche MCTS pour amélioration de politique.
il suffit d'exécuter : py main.py dans un terminal en seplaçant dans ce dossier, pour lancer l'entraînement.
VScode permet aussi d'ouvrir une session TensorBoard pour visualiser l'évolution des différentes quantités