第十四讲 主成分分析

主成分分析

  • 主成分分析是一种降维算法,能够将多个指标转换为少数几个主成分,这些主成分是*原始变量的线性组合,且彼此之间互不相关,其能反映出原始数据的大部分信息。
  • 当研究问题涉及到多变量且变量之间存在很强的相关性时,我们可考虑使用主层次分析方法对数据进行简化
  • 处理多重共线性

降维的作用

  • 将高纬度的数据(指标太多)保留下最重要的一些特征,去除噪音和不重要的特征,从而实现提升数据处理速度的目的
  • 在实际的生产和应用中,降维也成为了应用最广泛的数据预处理方法
  • 优点
    • 降低算法的计算开销
    • 去除噪音
    • 使得数据集更易使用
    • 使得结果容易理解

例子

图片说明

思想

假设有n个样本,p个评价指标,则可构成大小为n*p的样本矩阵x:

图片说明

需要找到综合指标
图片说明

系数l的确定原则

PCA的计算步骤

假设有n个样本,p个评价指标,则可构成大小为n*p的样本矩阵x
图片说明

    1. 我们首先对其进行标准化处理 去除量纲 + 归一化有助于比较
      图片说明
全部评论

相关推荐

就前几天旅游的时候,打开抖音就经常刷到这类视频:以前是高学历学生、老师、主持人,现在做着团播、擦边主播的工作,以及那些经过精心包装的“职业转型”故事——从铺天盖地的VLOG到所谓的“04年夜场工作日记”,这些内容在初中升学、高考放榜等关键时间节点持续发酵。可以说非常直接且精准地在潜移默化地影响着心智尚未成熟的青少年,使其对特殊行业逐渐脱敏。那我就想问了:某些传播公司、平台运营者甚至某些夜场的老板,你们究竟在传递怎样的价值观?点开那些视频,评论区里也是呈现明显的两极分化:一种是​​经济下行论​​:“现在就业市场已经艰难到这种程度了吗?”​​一种是事实反驳派​​:这些创作者往往拥有名校背景,从事着...
牛客刘北:被环境教育的,为了能拿到足够的钱养活自己,不甘心也得甘心,现在的短视频传播的思想的确很扭曲,但是很明显,互联网玩上一年你就能全款提A6,但你全心全意不吃不喝工作一年未必能提A6,但是在高考中考出现这个的确很扭曲,在向大家传播“不上学,玩互联网也可以轻松年入百万”,不是人变了,是社会在变
预测一下26届秋招形势
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务