快手实习 大模型二面 技术拷打
整体面试还是不错的,但是没后续了,不知道是哪里出了问题
1、实习经历深挖
2、是否有进行消融实验来验证效果?
3、lora核心思想
4、论文深挖
5.、为什么现在mlp的激活函数都用relu 为什么不用sigmoid/Tanh ? 6、 怎么能把序关系学得更好 7、AUC 、回归类AUC 物理含义和计算方式 8、Loss乘10和学习率乘10之间有什么区别
无手撕
1、实习经历深挖
2、是否有进行消融实验来验证效果?
3、lora核心思想
4、论文深挖
5.、为什么现在mlp的激活函数都用relu 为什么不用sigmoid/Tanh ? 6、 怎么能把序关系学得更好 7、AUC 、回归类AUC 物理含义和计算方式 8、Loss乘10和学习率乘10之间有什么区别
无手撕
全部评论
相关推荐
查看24道真题和解析
拼多多集团-PDD成长空间 927人发布