2019-07-26 23:52 已编辑字节跳动_算法工程师

关注

深度学习中激活函数的选择

为什么引入非线性激活函数

如果不使用非线性的激活函数，无论叠加多少层，最终的输出依然只是输入的线性组合。
引入非线性的激活函数，使得神经网络可以逼近任意函数。

常用激活函数

sigmoid函数

tanh双曲正切函数

sigmoid函数和tanh函数共同的缺点是，在z特别大或者特别小的情况下，函数的梯度会变得特别小，接近0，这会使得梯度下降的速度变慢。
一般在二分类问题的输出层使用，不在隐藏层使用。

ReLU修正线性单元

ReLU易于优化。只要出与激活状态，导数都能保持较大。梯度不仅大而且一致。二阶导数几乎处处为0，并且在ReLU处于激活状态时，一阶导数处处为1。

通常将偏置b设置成一个小的正值，如0.1。使得其对训练集中大多数输入呈现激活状态，并且允许导数通过。

ReLU是最常用的激活函数。

Leaky ReLU

相比于sigmoid等，计算量小，
相比于sigmoid，不容易出现梯度消失情况，能加速网络训练速度
使得一些神经元输出为0，增加稀疏性，防止过拟合。

PReLU

maxout 单元

maxout单元进一步扩展了relu。maxout将z划分为每组具有k各值的组，而不是使用作用于每个元素的函数

maxout单元因此可以视为学习激活函数本身而不仅仅是单元之间的关系。使用足够大的k，maxout可以以任意的精确度来近似任何凸函数。特别地，具有两块的maxout层可以学习实现和传统层相同的输入x的函数，这些传统层可以使用relu,prelu等。

每个maxout单元现在由k个权重向量来参数化，而不仅仅是一个，所以maxout单元通常比relu需要更多的正则化。

参考资料

DeepLearning deeplearning.ai
《深度学习》第6章
Introduction to Deep Learning HEC

全部评论

推荐最新楼层

05-10 16:28

苏州大学后端

总结---美团笔试4.19---技术岗

一、思路：将数值与索引绑定，遍历相邻元素即可注意：可以用Arrays.sort或者TreeMap实现代码 import java.util.*; // 注意类名必须为 Main, 不要有任何 package xxx 信息 public class Main { public static void main(String[] args) { Scanner in = new Scanner(System.in); int t = in.nextInt(); for (int i = 0; i < t; i++) { ...

投递美团等公司7个岗位 > 暑期笔试总结

点赞评论收藏

05-08 19:40

衣恋_品牌视觉(准入职员工)

衣恋内推-衣恋内推码

ESI管培生面试问题自我介绍：请做一个一分钟的自我介绍。说说你的优势和劣势。你遇到过最大的困难是什么，你是如何克服的？请谈谈你的未来职业发展规划。为什么选择衣恋集团？你最疯狂痴迷、时间最久的兴趣爱好是什么？你的朋友会用一个什么词来形容你？如果有线下实习机会，你有空来吗？如果入职后发现工作内容和想象不一致，你会怎么办？如果薪资和预期不符，你会怎么处理？你最了解衣恋旗下的哪个品牌，它区别于竞争对手的战略和方法是什么？你最近关注到的一个流行趋势是什么？对现在各大电商平台有什么看法？与岗位相关说说你平常买什么品牌的衣服，喜欢什么风格？职业期望：以后的职业期望是什么？具体问题：第一份工作时间多久比较合适...

点赞评论收藏

03-20 13:05

哈尔滨理工大学算法工程师

这种简历在成都还能进互联网公司吗🥹

点赞评论收藏

05-09 13:22

门头沟学院 Java

让室友感受一下牛u的热情

室友爬虫简历 让我帮发 求牛u锐评

Two_Shadow：中间空着的是让hr写的吗

点赞评论收藏

05-08 19:19

电子科技大学电源工程师

华为部门选择

家人们，华为今年招聘，打算投华为硬件技术工程师电源岗位，但是一直在犹豫投递华为的哪个部门，不知道哪个部门比较好，想听听各位朋友的建议。先说说我的个人情况：电力电子方向的硕士，学历尚可，应该不会拖秋招后腿。

投递华为等公司8个岗位 >

点赞评论收藏

全站热榜

创作者周榜

正在热议

# 选完offer后，你后悔学本专业吗 #

# 工作中，你有没有遇到非常爱骂人的领导？ #