2021-01-26 16:00 已编辑北京邮电大学算法工程师

关注

【八股文-机器学习】激活函数

纵览

图片说明

如果使用线性激活函数（恒等激励函数），那么神经网络仅是将输入线性组合再输出，在这种情况下，深层（多个隐藏层）神经网络与只有一个隐藏层的神经网络没有任何区别，不如去掉多个隐藏层。

线性指一次函数，直线关系，曲线和二次函数属于非线性。非线性指导数不为常数，relu的导数是分段不连续也属于非线性。

sigmoid

$图片说明$
$图片说明$
导数图像如下图所示：
当输入值很大或很小时，更新的梯度趋于0，也就是参数几乎不变，也就很可能造成梯度消失的问题。所以一般不用sigmoid做激活函数。

relu

$图片说明$

当使用ReLU 激活函数时，我们不会得到非常小的值（比如前面 sigmoid 函数的 0.0000000438）。相反，它要么是 0，要么是 1。但这又催生出另一个问题：死亡 ReLU 问题。如果在计算梯度时有太多值都低于 0 会怎样呢？我们会得到相当多不会更新的权重和偏置，因为其更新的量为 0。
优点是当我们将 ReLU 函数引入神经网络时，我们也引入了很大的稀疏性。那么稀疏性这个术语究竟是什么意思？稀疏：数量少，通常分散在很大的区域。在神经网络中，这意味着激活的矩阵含有许多 0。这种稀疏性能让我们得到什么？当某个比例（比如 50%）的激活饱和时，我们就称这个神经网络是稀疏的。这能提升时间和空间复杂度方面的效率——常数值（通常）所需空间更少，计算成本也更低。Yoshua Bengio 等人发现 ReLU 这种分量实际上能让神经网络表现更好，而且还有前面提到的时间和空间方面的效率。

elu

$图片说明$

其导数为本身再加一个alpha

这里成功避开了死亡 ReLU 问题，同时仍保有 ReLU 激活函数的一些计算速度增益——也就是说，网络中仍还有一些死亡的分量。

leaky relu

$图片说明$

其导数再负数部分是一个常量alpha

类似 ELU，Leaky ReLU 也能避免死亡 ReLU 问题，因为其在计算导数时允许较小的梯度；
由于不包含指数运算，所以计算速度比 ELU 快。
无法避免梯度爆炸问题；
神经网络不学习 α 值；
在微分时，两部分都是线性的；而 ELU 的一部分是线性的，一部分是非线性的。

tanh

$图片说明$

图片说明
由图像可知，tanh函数是sigmoid函数向下平移和收缩后的结果。
其导数为 $图片说明$

sigmoid导数可以写为 $图片说明$

sigmoid和tanh激活函数有共同的缺点：即在x很大或很小时，梯度几乎为零，因此使用梯度下降优化算法更新网络很慢。

全部评论

推荐最新楼层

05-21 11:47

门头沟学院 Java

拿到华为实习Offer后最关心的问题

这个时候应该有挺多小伙伴拿到了华为的实习Offer，可能大家会有很多疑问，比如怕实习是不是纯水的或者干杂货，到底能不能学到东西，对秋招会不会有帮助？作为去年在华为实习过拿了优秀实习生，秋招拿了华为14a和其他大厂Offer的双非仔，我回答一下大家关心的问题，以下回答都是结合我的经历来回答，我实习的部门是集团IT，不同部门不一定完全一致，以下回答仅供参考：1. 华为实习生都是没活干或者干杂货，看不到内部文档？答：能不能看到代码和文档确实会因为部门的安全要求不同而不同。华为不同区域是有不同保密等级要求的，在保密等级较高的部门实习，可能确实会看不到代码，导致没活干，当然我身边没有这种同学，我是看有网...

华为HUAWEI工作强度 1375人发布

点赞评论收藏

分享

05-19 15:08

门头沟学院前端工程师

快手前端面试

快手前端面试一、面试核心考点（全覆盖）双 Token 无感登录（全程重点）RefreshToken 过期处理微服务鉴权架构：网关 / 登录中台 / 业务服务现场手写：秒数转时分秒 + 开始倒计时 + 复位二、每道题标准答案（可直接复用）1. 双 Token 无感登录实现登录返回 AccessToken（短） + RefreshToken（长）前端请求携带 AccessToken过期由服务端 / 网关返回 401前端自动用 RefreshToken 刷新，成功则重试接口，用户无感前端不判断过期，只做携带、刷新、重试2. RefreshToken 也过期怎么处理响应拦截器统一捕获清空 Token、...

查看4道真题和解析

点赞评论收藏

分享

04-21 15:30

武昌首义学院前端工程师

所以这种问题（问在不在xxx）到底应该怎么回答啊

飞屋一号：实话实说就行，先争取一下能不能线上，不行就直接放弃，付出与回报不成正比

我的求职进度条

点赞评论收藏

分享

昨天 16:04

已编辑

苏州工艺美术职业技术学院通信技术工程师

如何把实习杂活包装成吸引HR眼球的黄金经历

先泼一盆冷水：实习生，尤其是前期，不打杂是不可能的。公司付钱，本质上就是购买你处理确定性事务的时间，来释放正式员工处理不确定性问题的带宽。但这里藏着一个巨大的信息差和机会差：公司以为它买的是你的“劳动力”，但你可以学到的，是一整套“职业化”的底层操作系统。第一步：翻译黑话，从动词升级不要写你“做了什么”，要写你“创造了什么改变”。每天筛简历，打电话约面试负责简历筛选与面试邀约执行人才初筛与触达：日均处理150+份简历，建立关键词标签库，实现初筛效率提升40%更新招聘表格，统计面试数据协助维护招聘数据主导招聘数据运营：独立维护实时招聘看板，通过数据异常波动预警，助力面试到场率提升15%整理面试官...

点赞评论收藏

分享

评论

点赞

1

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 如何成为1个AI工程师？ #

7640次浏览 334人参与

# 我想去国央企的原因 #

80805次浏览 422人参与

# 26届春招投递记录 #

42798次浏览 355人参与

# 毕业季，给职场新人一些建议 #

226047次浏览 2618人参与

# 27届实习投递记录 #

131750次浏览 1460人参与

# 工作压力大，你会干什么？ #

86358次浏览 723人参与

# 小米编程考试 #

42026次浏览 159人参与

# 面试被问期望薪资时该如何回答 #

407440次浏览 2224人参与

# 我在大厂见过的最低学历 #

8527次浏览 78人参与

# 你觉得第一学历对求职有影响吗？ #

277804次浏览 1501人参与

# 你觉得机械有必要实习吗 #

89615次浏览 539人参与

# 秋招拿一个offer可以躺平吗 #

278616次浏览 1416人参与

# 联想求职进展汇总 #

365494次浏览 2270人参与

# 机械人你觉得今年行情怎么样？ #

10131次浏览 100人参与

# 虹软科技求职进展汇总 #

18788次浏览 141人参与

# 大疆工作体验 #

34724次浏览 95人参与

# 工作后，你落下了哪些病根 #

44356次浏览 309人参与

# 你在职场上见过哪些“水货”同事 #

42390次浏览 181人参与

# 要毕业了，再不说就来不及了 #

12472次浏览 175人参与

# AI面会问哪些问题？ #

138942次浏览 3808人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务