就算你超参数不变,每次随机初始化,训练的结果都不一样。梯度下降法相当于下山,随机初始化权重相当于随机选择起点,不同的超参数是不同的下山方法,有的超参数能帮你快速到达山谷最低点,有的则很慢。调参就是找到最快到达最低点的参数。随机初始化权重就是随机选择起点,尝试不同的路径去试探。所以我觉得不用固定初始化权重。
点赞 评论

相关推荐

程序员花海:实习和校招简历正确格式应该是教育背景+实习+项目经历+个人评价 其中项目经历注意要体现业务 实习经历里面的业务更是要自圆其说 简历模板尽可能保持干净整洁 不要太花哨的
点赞 评论 收藏
分享
牛客网
牛客网在线编程
牛客网题解
牛客企业服务