模型参数初始化全0还能训练吗?

📖 答案是 如果神经网络参数全部初始化为0,模型会陷入对称状态,模型等价于N层单神经元的神经网络,无法有效训练。

🤔 这道题如果事先没有思考过的话,面试时是很难想到正确答案的。为了举一反三,笔记图中分析了 模型全初始化为相同的值 会出现什么问题,可供各位参考。
  #算法岗面试#   #深度学习#  #秋招#  #实习#
#大模型#
全部评论
{"pureText":"","imgs":[{"alt":"IaYRhbYBSFHmbv8FjI9aArVbu9zNbPNw.jpg","width":"1440.0","height":"3114.0","src":"https://uploadfiles.nowcoder.com/images/20250726/101779315_1753531451425/815CF3921FFC4225EB11B746055D86C5"}]}
点赞 回复 分享
发布于 07-26 20:04 上海
本人和几位同学(大厂offer均sp~ssp)的近百场搜广推面试总结了一份《大厂搜广推算法高频考题》面试笔记,题解超详细。有需求的同学们可以si我
点赞 回复 分享
发布于 07-26 19:24 上海

相关推荐

09-16 20:11
南开大学 Java
📍面试公司:美团🕐面试时间:9月16号💻面试岗位:后端开发❓面试问题:基础的我就不再写了,写点我觉得有点难度的一.八股1.如何破坏类加载机制?你了解哪些破坏类加载机制的实现?(我答了一个SPI和一个热部署,面试官说嗯,还有呢?显然还想要更多,面试官有点贪吃了)2.redis中删除一个key后整个过程是怎么样的?删除完立马就在内存里删除了吗?(问懵逼了,我说了我的理解,后面问了ai发现只对了一半)3.nginx有哪几种负载均衡方式?选择策略是什么(答出来五种,选择策略感觉说的一半)二.项目1.你有两个微服务,还部署在不同服务器上,你选择一个最复杂最核心的环节,从如何触发到后续流程全部说一说2.你写了动态配置中心,但是你好像没发现其中线程安全问题啊,这么说吧,我在项目运行的时候修改了动态配置,恰好此时有很多线程高并发的在查询这个动态配置的数据(比如降级配置,你现在改为服务降级,很多线程正在运行,这些运行中的线程怎么处理?),你怎么办,加锁吗,加锁效率是否很低,直接在redis这个注册中心里读取数据吗,那你配置数据这个在后端中有什么意义?(我投降了)三.手撕哈哈哈美团是一点算法都不考啊,笔试全是数学题,手撕也是跟算法没关系1.生产者消费者队列:设计一个停车场,100个车位,可以停车和出库,用生产者消费者队列实现2.规则树和责任链设计模式:我看你项目写了规则树和责任链,手撕写出来吧。🙌面试感想:八股和项目95都过了,面试官还是比较认可实力的,反问问为什么我的ai项目不问,面试官答,我看了你的简历,感觉你用ai做项目挺强的,就不用问了。
落圆圆:同学,瞅瞅我司,医疗独角兽,校招刚开,名额有限,先到先得,我的主页最新动态,绿灯直达,免笔试~
查看7道真题和解析
点赞 评论 收藏
分享
评论
1
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务