2020-05-01 19:52 已编辑门头沟学院项目经理

关注

线性回归——梯度下降

一、概述

　　线性回归是利用数理统计中的回归分析，来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法，在机器学习中属于监督学习。在数据分析等领域应用十分广泛。

　　很多情况下我们都用它进行预测，比如预测房屋价格。在这里用一个简单的例子来说明，假设有一组房屋数据，为了理解方便，假设决定价格的只有房屋到市中心的距离：

Distance(km)	Price(￥/m2)
5	100000
10	80000
15	60000
25	50000
30	30000

　　从上面自拟的数据可以看到，距离越小价格就会越大。那么问题来了，假如你有一套房，距离市中心大约有8km，你想要知道大概能卖多少钱？这个时候线性回归就起作用了。

将数据大概地绘制成如下的图，由此可见这套房大致上能卖92000￥

　　这就是线性回归，它可以用来预测值。在现实中，决定性的因素绝对不止一个，数据往往是***的，那就会变得有些复杂了，这时候就需要通过算法来实现了。在学习算法之前，可以先过一下有关的数学知识。

二、数学基础

1、导数

　　导数这个概念在高中的时候就接触了，它的几何意义为函数y=f(x)在某一点处沿x轴正方向的变化率，通俗地讲，代表函数的斜率。

2、偏导数

　　偏导数的概念其实跟导数差不多，区别就在于偏导数一般是对于多元函数而言，y=f(x1,x2,…,xn)在某一点处沿某一坐标轴（x1,x2,…,xn）正方向的变化率。也就是说，函数对x1的偏导即为函数在x1方向上的变化率。

3、方向导数

　　方向导数是建立偏导数的基础上的一个数学定义，偏导是指在正方向的变化率，而方向导数是指在其他特定方向上的变化率。以二元函数为例，假设已知x，y方向上的偏导，那么方向导数就可以是图中蓝色箭头方向上的数值（不要被图片迷惑了，它可以是其他任意方向上的数值，而且它是个标量）。

4、梯度

　　梯度是一个向量，即有方向有大小，它的方向是最大方向导数的方向，它的值是最大方向导数的值。就跟介绍方向导数的图那样，蓝色的矢量，代表的就是梯度。

三、算法介绍

　　在线性回归中，回归方程为：,通过这个方程得到的预测值往往与真实值y之间会存在误差。令误差为，则预测值与真实值之间的关系就可以表示为，我们希望求出来的使得误差最小。因此，我们假设服从均值为0，方差为的正态分布，根据正态分布的概率密度函数可得，其中==。

　　为了使得误差尽可能的小，根据上式，我们可以令，这个公式表示求使得预测值更接近于真实值的值的概率，因此我们希望它的值越大越好。接下来进行最大似然估计：，相比于累加，这个公式累乘计算的难度会更大，所以不妨把它转换成对数形式，如下图所示：

　　最后得到：，在这个式子中，起关键作用的式子是，我们称它为代价函数（Cost Function）。我们希望代价函数越小越好，因此我们需要求它的极小值，或者说局部最小值。假如只有一个，那么这个代价函数的图像可以这样表示：

　　可以看到，当曲线的斜率为0，即函数的导数值为0时，函数值最小。这只是对于一元函数而言，可事实上我们的数据是很***度的，因此我们就需要通过梯度来得到我们需要的值。于是，梯度下降算法就出现了。

　　梯度下降算法是这样的：

　　repeat until convergence {

　　　　;

　　}

　　其中，称为速率因子，表示梯度下降的速度。对于这个算法，通俗点说，假设初始的时候某个点在曲面（曲线）上，它找到相对比较“陡峭”的方向，沿着这个方向“下坡”，直到最低点为止。在这里需要注意的一点是，的值不宜太小也不宜太大，太小会使得“下坡”的次数很多，影响效率；太大的话可能会错过最低点。通常我们可以通过斜率的值改变的值。

全部评论

推荐最新楼层

07-18 22:04

韶音科技_产品经理(准入职员工)

韶音科技内推

2024-06-08，投递简历：提前批-机械结构工程师2024-06-30，专业笔试：使用的牛客题库，20道选择题+2道简答题，考察范围包括机设、机原、材料、力学、工艺等2024-07-24，HR面试邀约2024-08-02，HR面试，腾讯会议，约20min。面试流程如下：    1. 自我介绍    2. 人事问答：    （1）你的研究方向？你们课题组的研究方向有哪些？    （2）分工？    （3）项目简述：项目背景？解决什么问题？你做了哪些工作？结构怎样设计的？工作过程中有探索性学习？动手实践吗？项目进展？    （4）实验室有多少人？    （5）博士有吗？    （6）做项目会有...

点赞评论收藏

07-23 14:56

门头沟学院客户端其它

遇见对的人，更重要

说个普遍存在的现象，现在中大厂校招中，本科生的比例正在逐步降低，无论你是92还是双非，这都将加剧竞争压力。以中厂传音控股举例，今年25届入职研究生比例较24届入职研究生人数增加50%，而这50%的人，去年是本科生啊，之前我以为，企业招收92和研究生是为了出去宣传好看，但是后面才意识到自己这种想法挺可笑的。企业之所以这么做，是因为想降低容错率，快速招到符合岗位需求的优秀人才，所以使用学历衡量这种相对有效准确的筛选方式。说到学历就要说高考，我高中的时候学英语死活学不会，背英语单词就是记不下来，背完忘，什么艾宾浩斯记忆曲线屁用没有，证明啥，一个是IQ不行，一个是天赋不在此，时至今日我也没找到我的天赋...

码农索隆：都猛劲子冲，秋招你们一定能拿到心仪的offer。

校招阶段，学历VS技术哪...

点赞评论收藏

06-18 22:12

赣东学院 Java

26学院本，求指点

一直不敢投，感觉太弱了，什么都不会，但说是一直准备其实就是在拖，现在看别人的面经还是感觉答不出来，也基本都在死背八股，结果还是感觉八股不行，到时候拷打项目和场景题更是不知道怎么回答😭😭😭

在下uptown：这简历重复率也太高了，怎么都长一样啊

我的简历长这样

点赞评论收藏

今天 11:26

清华大学 Java

终章

打开电脑，思绪又回到了7月份刚开始的时候，感觉这个月过的如梦如幻，发生了太多事，也算是丰富了我本就是平淡的人生吧太早独立的我习惯了一切都是自己做决定，拥有绝对的决定权，而且永远不会听取别人的建议。我就是那个恋爱四年出轨的男主啦，感觉既然在牛客开了这个头，那我就要做个有始有终的人。从我出轨到结束再到和女朋友和好如初真的太像一场梦了，短短的一个月我经历了太多，也成长了很多，放下了那些本就不属于我的，找回了那些我不该放弃的。我的人生丰富且多彩，但人不能一直顺，上天总会让你的生活中出点乱子，有好有坏，让你学会一些东西，让你有成长。我和女朋友的恋爱四年太过于平淡，日常除了会制造一些小浪漫之外，我们的生活...

段哥亡命职场：不得不说，我是理解你的，你能发出来足见你是个坦诚的人，至少敢于直面自己的内心和过往的过错。这个世界没有想象中那样非黑即白，无论是农村还是城市，在看不见的阴影里，多的是这样的事。更多的人选择站在制高点去谩骂，一方面是社会的道德是需要制高点的，另一方面，很多人不经他人苦，却劝他人善。大部分的我们，连自己生命的意义尚且不能明晰，道德、法律、困境，众多因果交织，人会迷失在其中，只有真的走出来之后才能看明白，可是没走出来的时候呢？谁又能保证自己能走的好，走的对呢？可是这种问题有些人是遇不到的，不去追寻，不去探寻，也就没了这些烦恼，我总说人生的意义在过程里，没了目标也就没了过程。限于篇幅，没法完全言明，总之，这世界是个巨大的草台班子，没什么过不去了，勇敢面对，革故鼎新才是正确，祝你早日走出来。