DQN代码调试求助。
各位圈友们,有会DQN的同学吗?我目前照着教程写了一个DQN的小小的demo(如图,神经网络需要学会从0号地点走到11号地点,再走到15号地点),但是神经网络就是学不会东西,输出loss和精确度都不对,loss还有负数。理了好几遍,都不太清楚问题出在哪里了。有会的圈友可以帮助我调一调代码吗,万分感激?
https://github.com/voyager-hui/miniCarpool/tree/master
各位圈友们,有会DQN的同学吗?我目前照着教程写了一个DQN的小小的demo(如图,神经网络需要学会从0号地点走到11号地点,再走到15号地点),但是神经网络就是学不会东西,输出loss和精确度都不对,loss还有负数。理了好几遍,都不太清楚问题出在哪里了。有会的圈友可以帮助我调一调代码吗,万分感激?
https://github.com/voyager-hui/miniCarpool/tree/master
全部评论
就是学不会没准是explore的不够,没有碰巧成功过
相关推荐