2021-05-26 16:30 复旦大学算法工程师

关注

神经网络与BP算法

最近在coursera上看Andrew Ng的machine learning，其中提到了BP算法，但没有给出具体的推导过程。因此想写一篇笔记，把这个算法的逻辑理清楚。

1. 神经网络

神经网络是一种模仿动物神经网络行为特征，进行分布式并行信息处理的算法数学模型。

神经网络通常由输入层 $x$ 、隐层和输出层 $h$ 构成。输入层的每个神经元代表一个特征，输出层的每个神经元代表一个分类标签，而隐层的层数和神经元数目则由人工设定。

一个典型的3层神经网络如图所示：

设第 $l$ 层神经元个数为 $s_l$ ，其中第 $i$ 个神经元为 $a_i^{(l)}$ 。
相邻两层神经元的转移如下：

$z^{(l+1)}=\bar{\Theta^{(l)}}\bar{a^{(l)}}, a^{(l+1)}=g(z^{(l+1)})$

其中：

$\bar{a^{(l)}}=\begin{bmatrix}1\\a^{(l)}\end{bmatrix}$
$\Theta^{(l)}\in R^{s_{l+1}\times s_l}$ 为权重矩阵， $\bar{\Theta^{(l)}}=\begin{bmatrix}\Theta_0^{(l)}&\Theta^{(l)}\end{bmatrix}$ 。
$g (z)$ 为激励函数，常用sigmoid函数 $g(z)=\frac{1}{1+e^{-z}}$ 。

2. 目标函数

$J(\Theta)=-\text{mean}(y\log h+(1-y)\log (1-h))+\frac{\lambda}{2m}||\Theta||^2$ 。

求 $\min_\Theta J(\Theta)$ 需要利用梯度下降法，这需要求出每一步的 $\frac{\partial}{\partial \Theta_{ij}^{(l)}}J(\Theta)$ 。

直接求导比较麻烦，可以利用BP算法递推求解。

3. BP算法

第一步：求出 $\frac{\partial}{\partial h}J(\Theta)$ 。
$\frac{\partial}{\partial h}J(\Theta)=\frac{h-y}{mh\circ (1-h)}$

第二步：从后往前依次求出 $\frac{\partial}{\partial a^{(l)}}J(\Theta)$
$\frac{\partial J}{\partial \bar{a^{(l)}}}=\frac{\partial J}{\partial a^{(l+1)}}\frac{\partial a^{(l+1)}}{\partial z^{(l+1)}}\frac{\partial z^{(l+1)}}{\partial \bar{a^{(l)}}}=\frac{\partial J}{\partial a^{(l+1)}}\circ g'(z^{(l+1)})\bar{\Theta^{(l)}}$

第三步：求出 $\frac{\partial}{\partial \Theta_{ij}^{(l)}}J(\Theta)$ 。
$\frac{\partial J}{\partial \Theta^{(l)}}=\frac{\partial J}{\partial a^{(l+1)}}\frac{\partial a^{(l+1)}}{\partial z^{(l+1)}}\frac{\partial z^{(l+1)}}{\partial \bar{\Theta^{(l)}}}=\frac{\partial J}{\partial a^{(l+1)}}\circ g'(z^{(l+1)})\bar{a^{(l)}}$

全部评论

推荐最新楼层

05-09 13:19

门头沟学院 Java

暑期实习，众安保险or德勤Deloitte

研二，双非后端开发Java岗德勤Deloitte：后端开发实习生(提供转正)-技术与转型-全球交付中心-重庆众安保险：后端开发Java-健康险事业部-上海，已oc原打算5月20日去众安实习的，跟导师请假，导师不让，说是项目结项要紧，6月30号才让走，然后给我推荐了德勤Deloitte，目前还未面试。友友们，我该怎么办

投递众安保险等公司10个岗位 > 实习进度记录我的实习日记

点赞评论收藏

分享

昨天 20:11

中山大学机械工程师

华为整机工艺设计（实习）面经

📍面试公司：华为💻面试岗位：制造部 整机工艺设计👨‍💼bg29，本科车辆工程，硕士机械📅时间线：4月1日投递→4月3日测评→4月9日笔试→4月29日约面→5月8日上午专业面下午主管面→5月9日华清池❓面试问题：一、笔试题 涉及材料力学、机械设计、金属工艺学、互换性与技术测量等课程基础专业知识，整体难度不大，需提前复习做好准备。二、一面（50-60min）自我介绍。然后问了一道笔试题，原题是属于形状误差的是哪个，在原有问题上进行扩展提问，问圆柱度在工程图中的标注方式，平行度和平面度的区别等。项目提问：人员构成、人员安排、项目规划、然后是项目出现的问题及解决办法。问题和解决方法问得...

投递华为等公司9个岗位 > 华为开奖那些事机械人面试中的常问题

点赞评论收藏

分享

04-08 10:36

已编辑

华南理工大学 C++

大伙面腾讯的时候有这个环节吗

#实习# #腾讯# 大伙面试的时候有这个环节吗，我担心被诈骗了

梁州壮士：背调，查简历造假的

点赞评论收藏

分享

05-09 07:39

同济大学 ARM工程师

24年究竟那家公司是卷王之王

全网最受欢迎的嵌入式面经面经一共32篇文章，12w+字数，包含全部最新的面试必问考点，4.7w+同学学习，2800+订阅，非常适合在找工作面经薄弱的同学，3000+订阅还会涨价，提前订阅提前享受，持续更新中。原帖链接：https://www.nowcoder.com/creation/manager/columnDetail/MJNwoMc

面试问题记录异地恋该为对方跳槽吗

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 面试问题记录 #

30509次浏览 501人参与

# 假如我穿越到了妈妈的18岁 #

1325次浏览 27人参与

34729次浏览 157人参与

# 入职第五天，你被拉进了几个工作群 #

14032次浏览 77人参与

# 面试经验谈 #

19736次浏览 315人参与

# 工作一周年分享 #

14998次浏览 101人参与

# 机械人，你的第一份感谢信是谁给的 #

23124次浏览 295人参与

# 对妈妈没说出口的话 #

12710次浏览 327人参与

# 视觉/交互/设计招聘信息汇总 #

10578次浏览 596人参与

# 面试吐槽bot #

4799次浏览 50人参与

# 妈妈治愈了你哪些脆皮时刻 #

5430次浏览 107人参与

# 请用你的专业向妈妈表白 #

3796次浏览 44人参与

# 职场新人生存指南 #

337831次浏览 7242人参与

# 异地恋该为对方跳槽吗 #

26530次浏览 130人参与

# 硬件人更看重稳定还是高薪 #

41561次浏览 213人参与

# 上班苦还是上学苦呢？ #

214660次浏览 1288人参与

# 机械求职避坑tips #

42200次浏览 356人参与

# 硬件人秋招的第一个offer #

66773次浏览 1082人参与

# 零跑求职进展汇总 #

1813次浏览 16人参与

# 不考虑转正，实习多久合适 #

25447次浏览 119人参与

# 租房找室友 #

29901次浏览 150人参与

牛客网
牛客企业服务