二分类里为什么别用 MSE？面试版一图流总结

很多同学会问：sigmoid 输出是 0~1，标签也是 0/1，为什么不能直接上 MSE？

核心在梯度：
- BCE 对 z 的梯度是 y_hat - y（错得越离谱，梯度越大）
- MSE 多了 y_hat(1-y_hat)，当预测接近 0/1 时梯度会被压扁

结果就是：模型最该被纠正的时候，反而学不动。
面试一句话：分类本质是概率建模，BCE 对应最大似然，训练稳定性显著好于 MSE。

#机器学习# #深度学习# #算法面试#

全部评论

推荐最新楼层

不愿透露姓名的神秘牛友

04-13 14:05

简历求拷打，28届双非本末九硕非科班

目前准备离职试投下中大厂后端以及bat级别大厂测开客户端，同时学下ai应用开发相关，今年年末寒假再投一段大厂后端或者ai应用开发日常，然后明年早点开暑期能给点建议吗，要不要学go呢

点赞评论收藏

04-16 16:46

北京邮电大学 Python

北京前呈无限科技有限公司面试

算法实习生2026.04.15，中午11:30，线下，一面+二面首先填写了个人信息表。一面：1.自我介绍2.手画Transformer架构（拿笔画在一张白纸上）3.讲卷积神经网络，图像经过卷积操作后尺寸如何计算（幸亏记了公式）4.手撕反转链表，手撕三数之和（真的是手撕，用笔和纸写，三数之和还是提示之后写出来的）二面：1.自我介绍2.问mindie，问910B3，问实习项目3.手撕岛屿数量反问：公司主要是做什么的？主要是做广告、推荐算法相关的内容下午15:40HR面，线上1.自我介绍2.问为什么不去大厂（自己水平不够）3.实习中最看重什么（个人能力的提升和对业务的把控）4.实习多久，最早什么时候...

查看12道真题和解析

点赞评论收藏

03-02 20:26

湘潭大学算法工程师

无实习加一般学历，求简历拷打

xtu大迫杰：偶遇校友，祝校友offer打牌

点赞评论收藏

03-03 23:12

已编辑

北京邮电大学 Java

27届找暑期，简历求拷打

书海为家：我来给一点点小建议，因为毕竟还在学校不像工作几年的老鸟有丰富的项目经验，面试官在面试在校生的时候更关注咱们同学的做事逻辑和思路，所以最好在简历中描述下自己做过项目的完整过程，比如需求怎么来的，你对需求的解读，你想到的解决办法，遇到困难如何找人求助，最终项目做成了什么程度，你从中收获了哪些技能，你有什么感悟。

你的简历改到第几版了

点赞评论收藏