机器学习入门day2回归and聚类问题

回归问题

回归分析用于预测输入变量(自变量)和输出变量(因变量)之间的关系,特别是当输入变量的值发生变化时,输出变量值随之发生变化。直观来说回归问题等价于函数拟合,选择一条函数曲线使其很好地拟合已知数据且很好地预测未知数据。

图片说明

图片说明

线性回归

线性回归算法假设特征和结果满足线性关系。这就意味着可以将输入项分别乘以一些常亮,再将结果加起来得到输出。

图片说明

1就是模型,2是策略。

线性回归扩展

线性回归扩展算法用简单的基函数图片说明 替换输入变量x。这样我们就把线性拟合形式扩展到了固定非线性函数的线性组合。


感悟

废话不多说,其实回归问题就是在进行数据拟合,拟合的结果不能过拟合,也不能欠拟合。
欠拟合很好理解,而为什么拟合还能拟合过呢?其实过拟合会把所有的数据都拟合的很完整,比如问题进行多项式拟合,拟合出一个7次多项式,曲线能够完美穿过任意一个数据,但是模型就太过复杂了。再比如说,过拟合了树叶,那么再判别其他树叶可能会识别不是树叶,因为样本的树叶的特征太过“计较”了。回归问题还有岭回归、拉索回归等,不特地在此说明。

聚类问题

再简单讲讲聚类问题,

图片说明

其中最经典的就属K-means算法了,算法如图所示:

图片说明

和K-means算法类似的如高斯混合模型,不在此赘述。

全部评论

相关推荐

07-15 14:14
门头沟学院 Java
7.10投递7.15感谢信
投递地平线等公司10个岗位
点赞 评论 收藏
分享
06-15 02:05
已编辑
南昌航空大学 数据分析师
Eason三木:你如果想干技术岗,那几个发公众号合唱比赛的经历就去掉,优秀团员去掉,求职没用。然后CET4这种不是奖项,是技能,放到下面的专业技能里或者单独列一个英语能力。 另外好好改改你的排版,首行缩进完全没有必要,行间距好好调调,别让字和标题背景黏在一起,你下面说能做高质量PPT你得展现出来啊,你这简历排版我用PPT做的都能比你做的好。 然后自我评价,你如果要干数据工程师,抗压能力强最起码得有吧。
简历中的项目经历要怎么写
点赞 评论 收藏
分享
05-27 14:57
西北大学 golang
强大的社畜在走神:27届真不用急,可以搞点项目、竞赛再沉淀沉淀,我大二的时候还在天天打游戏呢
投递华为等公司10个岗位
点赞 评论 收藏
分享
评论
点赞
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务