#AI面试问题分享#会问到损失函数为什么这么设计,不同优化器如Adam和SGD的区别,学习率怎么调整。防止过拟合的方法除了正则化、Dropout,还有没有用过早停、数据增强。Batch Normalization到底解决了什么问题,这些理论都得吃透
全部评论

相关推荐

评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务