第十四讲 主成分分析

主成分分析

  • 主成分分析是一种降维算法,能够将多个指标转换为少数几个主成分,这些主成分是*原始变量的线性组合,且彼此之间互不相关,其能反映出原始数据的大部分信息。
  • 当研究问题涉及到多变量且变量之间存在很强的相关性时,我们可考虑使用主层次分析方法对数据进行简化
  • 处理多重共线性

降维的作用

  • 将高纬度的数据(指标太多)保留下最重要的一些特征,去除噪音和不重要的特征,从而实现提升数据处理速度的目的
  • 在实际的生产和应用中,降维也成为了应用最广泛的数据预处理方法
  • 优点
    • 降低算法的计算开销
    • 去除噪音
    • 使得数据集更易使用
    • 使得结果容易理解

例子

图片说明

思想

假设有n个样本,p个评价指标,则可构成大小为n*p的样本矩阵x:

图片说明

需要找到综合指标
图片说明

系数l的确定原则

PCA的计算步骤

假设有n个样本,p个评价指标,则可构成大小为n*p的样本矩阵x
图片说明

    1. 我们首先对其进行标准化处理 去除量纲 + 归一化有助于比较
      图片说明
全部评论

相关推荐

不愿透露姓名的神秘牛友
07-02 17:28
25届每天都在焦虑找工作的事情0offer情绪一直很低落硬撑着面了一个岗位岗位有应酬的成分面试的时候hr给我出各种场景题问的问题比较犀利 有点压力面的感觉感觉有点回答不上来本来就压抑的情绪瞬间爆发了呢一瞬间特别想哭觉得自己特别没用没绷住掉眼泪了事后想想觉得自己挺有病的 真的破大防了
喜欢唱跳rap小刺猬...:我觉得没关系吧,之前有一次面试leader给我压力面,我顶住了压力,结果入职的时候发现组里氛围很差,果断跑路。其实从面试就能大概看出组的情况,面试体验好的组倒是不一定好,但是面试体验不好的组。。。就很难说
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务