2020-07-13 23:58 已编辑贵州水利水电职业技术学院算法工程师

关注

[note] deep learning tensorflow lecture 2 notes 深度学习笔记 (2) 解决过拟合

1. linear model complexity

Logistic Model is defined as: X*W + b = y

parameter W and b should be determined by optimization method.

X is 1 by 784. 784 = 28*28

W is 784 by 10

b is 1 by 10

so number of parameters is 784*10 + 10

2. Rectified Linear Unit (ReLU) and neutron networks

another activation function more like brain activation signal than sigmoid.

picture below shows a two layers neutron networks.

1.The first layer effectively consists of the set of weights and biases applied to X and passed through ReLUs. The output of this layer is fed to the next one, but is not observable outside the network, hence it is known as a hidden layer.
2.The second layer consists of the weights and biases applied to these intermediate outputs, followed by the softmax function to generate probabilities.

3. chain rule

chain rule is a concept in calculus and demonstrates the derivative of a function with a function as its input parameters.

it has efficient data pipeline and lots of data reuse.

4.back propagation

forward propagation computes output y

back propagation computes all derivatives of weight matrices.

then we can update weight by new_weight = weight - alpha*derivative_weight.

back propagation need two times memory and computation than forward propagation.

5. Deep learning networks

在实战(2)中我们实现了一个只有一个隐藏层的神经网络。

其与下图类似。

当然我们可以实现更加深层或更加广度的神经网络。

6.Early termination

在validation data 的准确度达到一定峰值时，要及时结束训练，来避免过拟合。

7. Regularization

将权重向量的2范数引入到loss中，作为惩罚项。

8. Drop out

多层神经网络中，一层的输出可一作为下一层的输入。

drop-out的意思是在上一层输出的节点中随机将选取的一半或其他一部分节点丢弃，并将剩下的节点作为下一层的输入。

当drop-out不起作用时，大概我们需要一个更大的神经网络的了。

使用drop-out有一些小技巧。

(1)在训练时，进行drop-out，并将结果放大两倍

(2)在评估时，不进行drop-out。

全部评论

推荐最新楼层

03-22 11:23

门头沟学院 Java

红锁(RedLock)：Redis分布式锁的高可用方案

ps：如果这篇帖子对于还在找工作和找实习的你有所帮助，可以关注我，给本贴点赞、评论、收藏并订阅专栏；同时不要吝啬您的花花红锁(RedLock)是Redis官方提出的分布式锁算法，由Redis作者Salvatore Sanfilippo(antirez)于2014年设计，旨在解决传统单节点Redis锁在分布式环境中的可靠性问题，尤其针对主从复制场景下的锁丢失风险。一、核心背景与问题传统单节点Redis锁通过SET key value NX PX ttl命令实现，但存在致命缺陷：主节点宕机时，若从节点尚未同步锁数据，主从切换会导致锁丢失单点故障直接导致整个锁服务不可用红锁通过多节点冗余+多数派共识...

Redis分布式锁

点赞评论收藏

分享

昨天 12:59

门头沟学院 Java

北漂vs沪漂，到底哪个更苦

作为计算机专业，身边同学一半北漂去了中关村西二旗，一半沪漂去了张江漕河泾，自己也在两个城市都实习过，今天从程序员的视角，用6个最核心的维度，拆解北漂和沪漂到底哪个更苦，给正在选城市的牛友们一个最真实的参考。先给核心结论：基础生存层面，北漂更苦；精神生活与长期发展层面，沪漂更磨人。租房与通勤老破小溢价极高，通勤两极分化严重租房选择更多，通勤更平均北漂更苦气候与生活干燥、沙尘暴、冬天极寒，生活配套粗糙梅雨季、冬天湿冷，生活便利度拉满各有各的苦，北方人怕沪漂，南方人怕北漂职场与加班互联网卷度拉满，职场无边界感卷度不低，但职场边界感更强北漂更苦落户与长期发展户口门槛天花板级，几乎无落户可能应届生落户政...

大家每天通勤多久？

点赞评论收藏

分享

03-10 11:23

门头沟学院 Java

现在还有不用AI写代码的人吗？

你在leetcode上练的都是死代码能力🤣

迷茫的大四🐶：我还有古法纯手工编程呢

点赞评论收藏

分享

02-27 11:57

门头沟学院研发工程师

阿里是不是卡学历背景？

正式进入AI Coding时代了  

点赞评论收藏

分享

03-18 10:52

山东大学测试工程师

测试岗春招进度，26届，3月数据

985，测试开发方向，用数据说话，当个记录。截至今天共投递：34家已推进：9家（进入笔试或面试环节）已凉：3家（明确拒）无反馈：22家进展较好的：字节 → 技术面2轮，等HR阿里蚂蚁 → 一面通过美团 → 笔试通过，面试约下周网易、百度 → 笔试阶段测试岗投递节奏感觉和开发不一样，很多公司反馈慢，要主动催，建议大家建个表格跟进。网申效率这块，推荐一下牛客的网申助手，我34家里有一半是用它填的，信息录一次各家自动同步，字段识别率挺高的，省了不少时间，能把精力放在准备笔面试上。测试方向的同学，你们现在投了多少家了？

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 你的实习产出是真实的还是包装的？ #

7980次浏览 112人参与

# 第一份工作应该只看薪资吗 #

251722次浏览 1906人参与

# 米连集团26产品管培生项目 #

9866次浏览 260人参与

# 春招至今，你的战绩如何？ #

26750次浏览 234人参与

# 第一份工作一定要去大厂吗 #

3653次浏览 39人参与

# 长得好看会提高面试通过率吗？ #

12043次浏览 113人参与

# 巨人网络春招 #

11936次浏览 235人参与

# AI面会问哪些问题？ #

3683次浏览 115人参与

# 什么专业适合考公 #

55788次浏览 279人参与

# 你做过最难的笔试是哪家公司 #

5337次浏览 45人参与

# 从事AI岗需要掌握哪些技术栈？ #

1690次浏览 50人参与

# 一张图晒出你司的标语 #

1350次浏览 21人参与

# 沪漂/北漂你觉得哪个更苦？ #

4264次浏览 72人参与

# HR最不可信的一句话是__ #

2247次浏览 49人参与

# 找AI工作可以去哪些公司？ #

1585次浏览 26人参与

# 通信和硬件还有转码的必要吗 #

98862次浏览 633人参与

# 春招你拿到offer了吗 #

811449次浏览 9867人参与

# AI时代，哪个岗位还有“活路” #

4959次浏览 118人参与

# 简历第一个项目做什么 #

33736次浏览 485人参与

# 大疆求职进展汇总 #

687073次浏览 4337人参与

# 离家近房租贵VS离家远但房租低，怎么选 #

17337次浏览 141人参与

# 校招第一份工作你干了多久？ #

145157次浏览 622人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务