如果你有足够的数学知识,这是一个相当简单,且有趣的项目。
不得不说这个项目的效果超出了我的预期,对于新手而言可以尝试一番。
命名都为中文,尽可能地贴近其所描述的含义。
是我仿照自《强化学习实战系列(2020最新)》唐老师的视频课程所提供的英文源代码(这里没有它)。
《强化学习数学公式.docx》这个文件里面是基础的数学公式,我有对公式的组成进行说明;
《主要.py》这里是用来来训练的;
《测试模型.py》这个是用来测试模型的;
《近端策略优化_LunarLander-v2.pth》这个是我自己训练好的模型。
gym官网,用于强化学习的标准 API,以及各种参考环境的集合,里面集成了不少游戏。