其中一点是:你使用mse对分类任务时,梯度更新的时候是会涉及到sigmoid的计算,而你用交叉熵的话求梯度更新只涉及到真实值,预测值和x,计算就会实现简单方便
点赞 2
牛客网
牛客网在线编程
牛客网题解
牛客企业服务