2019-12-05 08:47 已编辑

关注

《统计学习方法》学习笔记——感知机数学推导

1.什么是感知机

感知机是二类分类的线性模型。

2.核心思想

找一个超平面，把正例和负例分开。

我们可以用

来表示这个超平面。（w=(x1,x2,x3,…)为法向量，决定了超平面的方向；b为截距，决定了超平面与原点的距离）
我们把决策函数定义为：

当wx+b>=0时，f(x)=+1，样本被分为正类；
当wx+b<0时，f(x)=-1，样本被分为负类。

3.如何找到这样的超平面

为了找出这样一种超平面，需要确定一种学习策略，即定义损失函数并将其最小化。
一种思路是让误分类的点总数降到最小，但是这样的损失函数不是参数w,b的连续可导函数，不易优化。
所以我们采用另外一种思路，让误分类点到超平面的距离之和最小。
首先，我们要求出每一个点X(x0,y0)到超平面wx+b=0的距离，距离的推导如下。

绝对值符号看起来十分影响我们求解，得想办法把他拿掉。对于一个正类点，即wx+b>=0的点来说，如果他被错误分类了，即预测值y=-1；对于负类点，y=+1。
所以最终把他们相乘，得到的肯定是负数，加个负号：
d=-y*(wx+b)/||w||。
然后，损失函数可以写成：

损失函数L(w,b)已经有了，接下来我们要做的就是找到合适的模型参数w,b使L(w,b)的值降到最小。这里我们采用的方法是梯度下降法。

4.梯度下降法直观理解

假设我们在一座山上，想要以最快的速度下山，我们通常会走一步算一步，每次沿着最陡峭的路向下走。即每次沿着梯度最大的方向移动一个步长，一直走到我们觉得已经是最低处的地方，虽然这个地方可能只是一个局部的最低处。
因此，从上面的解释来看，梯度下降法找到的解只是局部最优解，非全局最优解。
接下来，我们来推导详细的算法：

是不是很清晰，注意，这里的w是一个向量，分解开来就是对每一个特征做梯度下降。

5.两种梯度下降法

这里要介绍三种不同的梯度下降算法。

批量梯度下降法（Batch Gradient Descent）
再更新模型参数时用到所有的样本，上图中演示的即为BGD算法。
随机梯度下降法（Stochastic Gradient Descent）
再更新模型参数时只用到k个样本(k一般大于1，极端情况下k可以取1),《统计学习方法》书中所给的样例就是SGD算法。

对两者的比较：
BGD的优点是能保证每次能以一种全局最优的方式更新模型参数，缺点很容易能看出来，每次要用到所有的样本点，比较慢；
SGD的优点是每次只用一批样本点来更新参数，速度很快，缺点是不一定每次都沿着最优方向下降；

全部评论

推荐最新楼层

05-29 14:28

门头沟学院基带工程师

我的问题吗？毕业季我好像没啥感觉

看到朋友圈大家都在晒毕业证，写小作文。我发现自己没什么感觉，是我太冷血了吗？昨天拍毕业照，我也没有什么想合影的人，一直以来，我就是独来独往。我住的混合宿舍，宿舍里的其他人跟我不是一个班的，平时也没啥交集，可以说是形同陌路。研究生这几年，我的生活也很枯燥，没谈恋爱也没有什么兴趣爱好，像我这样的人，怎么可能会有女生喜欢？毕业季，无非就是从一座围城里进入另一座围城，对我都是一样的。我只想赶紧工作，赶紧赚钱！

宇宙守护：毕业证只是一张纸，真正能定义你的，是持续输出价值的能力，不是朋友圈里的情绪表演

好好告别我的学生时代

点赞评论收藏

分享

05-27 23:05

真有趣游戏_技术开发部_服务端工程师(准入职员工)

厦门真有趣游戏内推

游戏策划：以《蛋仔派对》为例，谈谈你对休闲竞技类游戏社交互动设计的理解，它有哪些优点和可改进之处？如果要开发一款以 “元宇宙校园生活” 为主题的手机游戏，设计 3 个独特玩法，阐述玩法规则和亮点。在一款角色扮演游戏里，玩家升级所需经验值按等差数列递增，1 级升 2 级需 100 经验，2 级升 3 级需 150 经验，以此类推。求玩家从 1 级升到 10 级总共需要多少经验？针对 12 - 18 岁的中学生群体设计一款游戏，你会重点考虑哪些需求和喜好？分享你参与过的游戏项目，阐述负责的内容，遇到的最大挑战及解决办法。为游戏中的一个隐藏关卡撰写一段剧情文案，要求包含悬念和转折。对比《原神》和《崩...

点赞评论收藏

分享

04-21 00:29

深圳技术大学 Web前端

前端投麻了没面试，是不是简历有问题

Sepmo：学校的问题

简历被挂麻了，求建议

点赞评论收藏

分享

04-08 13:31

已编辑

门头沟学院前端工程师

暑期大厂云集，但是这排名对吗？👇

感觉pdd也能进超一线呀，人均营收2kw呢一起来锐评下各厂~

D0cC：京东营收1万多亿人民币，阿里9000多亿，虽然他俩利润都没腾讯和字节多，但是很恐怖了啊，负担了多少打工人的薪水

投递拼多多集团-PDD等公司10个岗位

点赞评论收藏

分享

05-29 17:12

江苏省宝应中学后端

2024年10月19日虾皮购物一面已挂

以下是整理后的 Markdown 格式内容，优化了标题层级、列表嵌套和代码块显示，提升可读性：1. Java中的锁机制 - 可重入锁锁机制同步方法和同步块 Lock接口 可重入锁（Reentrant Lock）定义：允许同一线程多次获取同一把锁，避免递归调用或多层方法调用时的死锁问题。 特点： 重入性 公平性策略 手动锁管理 示例代码：  import java.util.concurrent.locks.ReentrantLock; public class ReentrantLockExample { private final ReentrantLock lock = new Reent...

27双非 Java后端开... 面试问题记录牛客创作赏金赛

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

字节暑期补捞

热聊中

创作者周榜

更多

正在热议

更多

# 写给毕业5年后的自己 #

4685次浏览 102人参与

# 国央企笔面经互助 #

129840次浏览 1080人参与

# 华泰证券Fintech星战营 #

169167次浏览 195人参与

# 职场捅娄子大赛 #

323055次浏览 3290人参与

# 制造业的秋招小结 #

87732次浏览 1602人参与

# 一人一个landing小技巧 #

60797次浏览 968人参与

# 好好告别我的学生时代 #

47646次浏览 892人参与

# 毕业季等于分手季吗 #

17004次浏览 212人参与

# 晒一下我的毕业照 #

34657次浏览 392人参与

# 海信求职进展汇总 #

65284次浏览 359人参与

# 如何缓解求职过程中的焦虑？ #

8111次浏览 106人参与

# 记录实习开销 #

30243次浏览 210人参与

# 如果今天是你的last day，你会怎么度过？ #

22918次浏览 199人参与

# 毕业租房也有小确幸 #

110110次浏览 4327人参与

# 当下环境，你会继续卷互联网，还是看其他行业机会 #

108514次浏览 783人参与

# HR问：你期望的薪资是多少？如何回答 #

40272次浏览 525人参与

# 上班苦还是上学苦呢？ #

223163次浏览 1331人参与

# 我的省钱小妙招 #

16274次浏览 328人参与

# 工作两年想退休了 #

120148次浏览 1120人参与

# 牛客租房专区 #

70038次浏览 977人参与

# 晒晒我司的端午福利 #

14938次浏览 99人参与

牛客网
牛客企业服务