首页 > 试题广场 >

下列哪个不属于常用的文本分类的特征选择算法?

[单选题]
下列哪个不属于常用的文本分类的特征选择算法?
  • 卡方检验值
  • 互信息
  • 信息增益
  • 主成分分析
常采用特征选择方法。常见的六种特征选择方法:
1)DF(Document Frequency) 文档频率
DF:统计特征词出现的文档数量,用来衡量某个特征词的重要性
2)MI(Mutual Information) 互信息法
互信息法用于衡量特征词与文档类别直接的信息量。
如果某个特征词的频率很低,那么互信息得分就会很大,因此互信息法倾向"低频"的特征词。
相对的词频很高的词,得分就会变低,如果这词携带了很高的信息量,互信息法就会变得低效。
3)(Information Gain) 信息增益法
通过某个特征词的缺失与存在的两种情况下,语料中前后信息的增加,衡量某个特征词的重要性。
4)CHI(Chi-square) 卡方检验法
利用了统计学中的"假设检验"的基本思想:首先假设特征词与类别直接是不相关的
如果利用CHI分布计算出的检验值偏离阈值越大,那么更有信心否定原假设,接受原假设的备则假设:特征词与类别有着很高的关联度。
5)WLLR(Weighted Log Likelihood Ration)加权对数似然
6)WFO(Weighted Frequency and Odds)加权频率和可能性
编辑于 2016-03-15 16:11:27 回复(0)
主成分分析是特征转换算法(特征抽取),而不是特征选择
发表于 2015-08-08 18:32:58 回复(2)
D
方法思路:
特征提取算法分为特征选择和特征抽取两大类,其中特征选择算法有互信息,文档频率,信息增益,开方检验,卡方检验等。
主成分分析不是文本分类特征选择算法。
所以选择D

发表于 2015-01-29 17:57:11 回复(2)
主成分分析是一种特征提取方法,并不是提取原始特征的子集这种特征选择方法,而是通过一系列变换将原始特征转换为更能表达数据特征的一系列特征。
发表于 2016-03-09 16:47:36 回复(0)
我们经常把特征选择中的"特征数据选择“和“特征抽取”混作一谈。
特征数据选择:不改变原始的特征数据,只是选择一部分出来。
特征抽取:进行了特征由高维到低维的映射,特征实际上产生了一定的变化。如PCA
具体参考:
发表于 2019-07-19 15:44:37 回复(0)
注意题中的 特征选择
主成分分析方法主要用于特征降维
发表于 2017-09-20 16:26:44 回复(0)
主成分分析(PCA)是一种降维算法,其基本思想是在原始数据空间中寻找使得投影方差最大化(重构误差最小化)的坐标系,然后在该坐标系下按照指定阈值进行降维。可以看作是一种特征提取方法,而不是特征选择方法。
简单来说:特征选择是从原来特征集中选取较为重要的特征子集,主成分分析是将原特征进行映射
编辑于 2023-10-13 10:45:22 回复(0)
主成分分析是根据属性自身性质进行降维的,与分类结果无关。而前三项都是与分类结果相关的
发表于 2023-10-11 18:20:49 回复(0)
主成分分析不属于文本分类的特征算法
发表于 2023-06-08 13:25:11 回复(0)
这个attribute selection和lasso/forward selection/backward selection应该说的不是一回事吧?
发表于 2022-10-28 20:05:27 回复(0)
pca不是用来降维的么,应该是属于特征选取吧
发表于 2022-05-04 23:46:40 回复(0)
特征提取的方法:卡方检验,互信息,信息增益
发表于 2019-06-18 09:26:12 回复(0)

PCA也可以做特征筛选,只不过不适用于文本而已。

发表于 2019-03-12 14:08:09 回复(0)
主成分分析不属于常用的文本分类的特征选择算法,我就打打字记住就行了,嘻嘻
发表于 2019-03-07 09:23:15 回复(0)
文本特征选择 文本频率 互信息 信息增益,卡方检验 pca是特征选择,可用来降维,
编辑于 2018-08-26 10:06:27 回复(0)
常见的六种特征选择方法
DF(文档频率):统计特征词出现的文档数量,用来衡量某个特征词的重要性
互信息法:互信息法用于衡量特征词与文档类别直接的信息量。
信息增益法:通过某个特征词的缺失与存在的两种情况下,语料中前后信息的增加,衡量某个特征词的重要性。
卡方检验法:利用了统计学中的"假设检验"的基本思想:首先假设特征词与类别直接是不相关的

主成分分析是降维



发表于 2018-08-05 12:00:24 回复(0)
特征选择是从原来特征集中选取较为重要的特征子集,主成分分析是将原特征进行映射
发表于 2017-03-19 13:58:33 回复(0)