2019-06-12 16:30 已编辑 Java

关注

Machine Learning 1st

线性回归
- 目的：回归的目的是通过几个已知数据来预测另一个数值型数据的目标值。
- 假设特征和结果满足线性关系，即满足一个计算公式h(x)，这个公式的自变量就是已知的数据x，函数值h(x)就是要预测的目标值。这一计算公式称为回归方程，得到这个方程的过程就称为回归。
- 上述公式中的θ为参数，也称为权重，可以理解为x1和x2对h(x)的影响度。对这个公式稍作变化就是
  
  公式中θ和x都可以看成是向量，n是特征数量。
  
  假如我们依据这个公式来预测h(x)，公式中的x是我们已知的（样本中的特征值），然而θ的取值却不知道，只要我们把θ的取值求解出来，我们就可以依据这个公式来做预测了。
最小均方法（Least Mean squares）
- 我们要做的是依据我们的训练集，选取最优的θ，在我们的训练集中让h(x)尽可能接近真实的值。h(x)和真实的值之间的差距，我们定义了一个函数来描述这个差距，这个函数称为损失函数，表达式：
  
  这里的这个损失函数就是著名的最小二乘损失函数，这里还涉及一个概念叫最小二乘法，这里不再展开了。我们要选择最优的θ，使得h(x)最近进真实值。这个问题就转化为求解最优的θ，使损失函数J(θ)取最小值。（损失函数还有其它很多种类型）
- LMS是求取h(x)回归函数的理论依据，通过最小化均方误差来求最佳参数的方法。
梯度下降
- 我们要求解使得J(θ)最小的θ值，梯度下降算法大概的思路是：我们首先随便给θ一个初始化的值，然后改变θ值让J(θ)的取值变小，不断重复改变θ使J(θ)变小的过程直至J(θ)约等于最小值。
  
  首先我们给θ一个初始值，然后向着让J(θ)变化最大的方向更新θ的取值，如此迭代。
- 公式中α称为步长（learning rate），它控制θ每次向J(θ)变小的方向迭代时的变化幅度。J(θ)对θ的偏导表示J(θ)变化最大的方向。由于求的是极小值，因此梯度方向是偏导数的反方向。
  - α取值太小收敛速度太慢，太大则可能会Overshoot the minimum。
  - 越接近最小值时，下降速度越慢
  - 收敛: 当前后两次迭代的差值小于某一值时，迭代结束
- 求解一下这个偏导，过程如下：
- 那么θ的迭代公式就变为
- 上述表达式只针对样本数量只有一个的时候适用，那么当有m个样本值时该如何计算预测函数？批梯度下降算法和随机梯度下降算法
批梯度下降算法（BGD）
- 这种新的表达式每一步计算都需要全部训练集数据，所以称之为批梯度下降（batch gradient descent）。
- 注意，梯度下降可能得到局部最优，但在优化问题里我们已经证明线性回归只有一个最优点，因为损失函数J(θ)是一个二次的凸函数，不会产生局部最优的情况。（假设学习步长α不是特别大）
- 批梯度下降的算法执行过程
- 大家仔细看批梯度下降的数学表达式，每次迭代的时候都要对所有数据集样本计算求和，计算量就会很大，尤其是训练数据集特别大的情况。那有没有计算量较小，而且效果也不错的方法呢？有！这就是：随机梯度下降（Stochastic Gradient Descent, SGD）
随机梯度下降算法（SGD）
- 随机梯度下降在计算下降最快的方向时时随机选一个数据进行计算，而不是扫描全部训练数据集，这样就加快了迭代速度。
  
  随机梯度下降并不是沿着J(θ)下降最快的方向收敛，而是震荡的方式趋向极小点。
- 随机梯度下降表达式如下：
- 执行过程如下图：
- 批梯度下降和随机梯度下降在三维图上对比如下：

#笔试题目##机器学习#

全部评论

推荐最新楼层

牛客603860747号

04-27 16:12

已编辑

门头沟学院计算机类

双非本科，两个月后就毕业了，一事无成，要不要紫砂

如题，垃圾学校毕业，去努力找工作，结果没有找到，现在啥也没有了，感觉没啥留恋的了

春招你拿到offer了吗

点赞评论收藏

转发

04-15 19:48

已编辑

门头沟学院计算机类

和女朋友一起拿到了腾讯暑期实习offer

show off 一下😁 #晒一晒我的offer#  #我的实习求职记录#

晒一晒我的offer 我的实习求职记录

点赞评论收藏

转发

04-09 09:31

莆田学院计算机类

我等了你8天，你却...

时隔8日hr终于回复了，我茶不思饭不想了8天，他说我不合适😭，兄弟们我要掉小珍珠了😭渣男 #沉淀# #黑皮体育生# #java#

点赞评论收藏

转发

04-26 10:13

吉林大学计算机类

新凯来性格测评挂

昨天 HR 吐槽说他的候选人性格测评被挂麻了，问我有没有信心能过，我说没问题，我的性格测试从来没有挂过。结果今早做完问了 HR 测评结果，居然也挂了。这个事情就很神奇，牛客上还有好多人做这家的性格测评挂了，我自认为性格测评没啥问题，其他厂都没有挂过，甚至连华为的都过了。原来约的上午十一点面试，幸亏在十点就查到了测评成绩。面试取消，我先去补一觉。

投递牛客等公司10个岗位 > 软件开发2024笔面经

点赞评论收藏

转发

点赞收藏评论

招聘动态

滴滴

2025届秋招储备实习生招聘

联易融2024届营销管培生校园招聘

全站热榜

正在热议

# 牛友的五一计划 #

11053次浏览 243人参与

# 无实习如何秋招上岸 #

171754次浏览 2713人参与

# 牛客帮帮团来啦！有问必答 #

392468次浏览 7756人参与

# 如何看待offer收割机的行为 #

192825次浏览 2972人参与

# 如何一边实习一边秋招 #

200444次浏览 3985人参与

# 晒一晒我的offer #

2815030次浏览 49842人参与

# 春招别灰心，我们一人来一句鼓励 #

20810次浏览 304人参与

# 非技术岗薪资爆料 #

7805次浏览 152人参与

# 硬件人的春招flag #

14497次浏览 199人参与

# 在国企工作的人，躺平了吗？ #

72413次浏览 877人参与

# 来聊聊机械薪资天花板是哪家 #

22080次浏览 174人参与

# 机械人，你的秋招第一份简历被谁挂了 #

26877次浏览 491人参与

# 第一次面试 #

16257次浏览 245人参与

# 你更愿意参加线上面试还是线下面试？ #

6800次浏览 94人参与

# 华为求职进展汇总 #

440749次浏览 4426人参与

# 女生做医疗销售有前景吗 #

3815次浏览 48人参与

# 简历中的项目经历要怎么写 #

379914次浏览 6388人参与

# 通信硬件薪资爆料 #

147042次浏览 1112人参与

# 产品实习，你更倾向大公司or小公司 #

31154次浏览 489人参与

# 机械人的薪资开到多少，才适合去？ #

44954次浏览 269人参与

牛客网
牛客企业服务