线性回归的常用求解方法之最小二乘法(二):最小二乘回归的数据计算意义

基础知识

  • 误差ε^(i)是独立并且具有相同的分布,并且服从均值为0方差为θ2的高斯分布

  • 独立:张三和李四一起来贷款,他俩没关系

  • 同分布:他俩都来得是我们假定的这家银行

  • 高斯分布:银行可能会多给,也可能会少给,但是绝大多数情况下这个浮动不会太大,极小情况下浮动会比较大,符合正常情况

高斯分布

蓝点是薪资

用线连起来,距离越长,误差越大。

误差是服从高斯分布的

预测值与误差:

由于误差服从高斯分布:

将(1)式带入(2)式得到:

似然函数(累乘):

解释:什么样的参数跟我们的数据组合后刚好是真实值

对数似然:

解释:乘法难解,假发就容易了,对数里面乘法可以转换成加法
展开化简:

目标:让似然函数(对数变换后也一样)越大越好


(这就是最小二乘法)

目标函数:

求偏导:

偏导等于0:

代码

未知数是w
y是一个矩阵
x也是一个矩阵

y = wx

想办法让x变成单位矩阵就求出来了w
x如果是长方形矩阵
怎么变成方阵?
先转置



求解w和b

import numpy as np
X = np.array([[4000,25],
             [8000,30]])
y = np.array([[20000],
             [70000]])
from sklearn.linear_model import LinearRegression
#fit_intercept 需不需要截距=偏置项=误差
lrg = LinearRegression(fit_intercept=False).fit(X,y)

#获取 系数 和 误差
lrg.coef_,lrg.intercept_

#检验
np.dot(X, lrg.coef_.T)

#换成5个样本,验算一下
NX = np.array([[4000,25],
             [8000,30],
             [5000,28],
             [7500,33],
             [12000,40]])
np.dot(NX, lrg.coef_.T)#最后三个有很大的误差

3个样本

X = np.array([[4000,25],
             [8000,30],
             [5000,28]])
y = np.array([[20000],
             [70000],
             [35000]])
#fit_intercept 需不需要截距=偏置项=误差
lrg = LinearRegression(fit_intercept=False).fit(X,y)

#获取 系数 和 误差
lrg.coef_,lrg.intercept_

np.dot(X,lrg.coef_.T)

5个样本

X = np.array([[4000,25],
             [8000,30],
             [5000,28],
             [7500,33],
             [12000,40]])
y = np.array([[20000],
             [70000],
             [35000],
             [50000],
             [85000]])
#fit_intercept 需不需要截距=偏置项=误差
lrg = LinearRegression(fit_intercept=False).fit(X,y)

#获取 系数 和 误差
lrg.coef_,lrg.intercept_

#loss
res = np.dot(X,lrg.coef_.T)
res

res - y

全部评论

相关推荐

否极泰来来来来:解约赔多少
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
正在热议
更多
# 你的mentor是什么样的人? #
3895次浏览 28人参与
# 你觉得mentor喜欢什么样的实习生 #
10253次浏览 284人参与
# 智慧芽求职进展汇总 #
17827次浏览 106人参与
# 帮我看看,领导说这话什么意思? #
6110次浏览 25人参与
# 没有家庭托举的我是怎么找工作的 #
12292次浏览 158人参与
# 怎么给家人解释你的工作? #
1371次浏览 16人参与
# 未岚大陆求职进展汇总 #
23819次浏览 112人参与
# 求职低谷期你是怎么度过的 #
5208次浏览 91人参与
# 26届秋招公司红黑榜 #
11934次浏览 41人参与
# 从哪些方向判断这个offer值不值得去? #
6545次浏览 93人参与
# 同bg的你秋招战况如何? #
158817次浏览 927人参与
# 度小满求职进展汇总 #
10078次浏览 51人参与
# 实习必须要去大厂吗? #
146625次浏览 1541人参与
# 校招泡的最久的公司是哪家? #
4531次浏览 22人参与
# 你有哪些缓解焦虑的方法? #
37173次浏览 835人参与
# 面试紧张时你会有什么表现? #
1694次浏览 20人参与
# 你喜欢工作还是上学 #
77572次浏览 860人参与
# 入职第一天,你准备什么时候下班 #
85471次浏览 467人参与
# 秋招想进国企该如何准备 #
97706次浏览 487人参与
# 简历无回复,你会继续海投还是优化再投? #
103582次浏览 819人参与
# 机械人的工作环境真的很差吗 #
25014次浏览 119人参与
# 独居后,你的生活是更好了还是更差了? #
28125次浏览 263人参与
牛客网
牛客网在线编程
牛客网题解
牛客企业服务