首页
题库
面试
求职
学习
竞赛
More+
所有博客
搜索面经/职位/试题/公司
搜索
我要招人
去企业版
登录 / 注册
首页
>
试题广场
>
下列哪个不属于常用的文本分类的特征选择算法?
[单选题]
下列哪个不属于常用的文本分类的特征选择算法?
卡方检验值
互信息
信息增益
主成分分析
查看答案及解析
添加笔记
求解答(18)
邀请回答
收藏(1436)
分享
17个回答
添加回答
96
嘻嘻兔
常采用特征选择方法。常见的六种特征选择方法:
1)DF(Document Frequency) 文档频率
DF:统计特征词出现的文档数量,用来衡量某个特征词的重要性
2)MI(Mutual Information) 互信息法
互信息法用于衡量特征词与文档类别直接的信息量。
如果某个特征词的频率很低,那么互信息得分就会很大,因此互信息法倾向"低频"的特征词。
相对的词频很高的词,得分就会变低,如果这词携带了很高的信息量,互信息法就会变得低效。
3)(Information Gain) 信息增益法
通过某个特征词的缺失与存在的两种情况下,语料中前后信息的增加,衡量某个特征词的重要性。
4)CHI(Chi-square) 卡方检验法
利用了统计学中的"假设检验"的基本思想:首先假设特征词与类别直接是不相关的
如果利用CHI分布计算出的检验值偏离阈值越大,那么更有信心否定原假设,接受原假设的备则假设:特征词与类别有着很高的关联度。
5)WLLR(Weighted Log Likelihood Ration)加权对数似然
6)WFO(Weighted Frequency and Odds)加权频率和可能性
http://blog.csdn.net/ztf312/article/details/50890099
编辑于 2016-03-15 16:11:27
回复(0)
37
与太阳肩并肩
主成分分析是特征转换算法(特征抽取),而不是特征选择
发表于 2015-08-08 18:32:58
回复(2)
20
-冬日O暖阳-
D
方法思路:
特征提取算法分为特征选择和特征抽取两大类,其中特征选择算法有互信息,文档频率,信息增益,开方检验,卡方检验等。
主成分分析不是文本分类特征选择算法。
所以选择D
发表于 2015-01-29 17:57:11
回复(2)
7
nnnn
主成分分析是一种特征提取方法,并不是提取原始特征的子集这种特征选择方法,而是通过一系列变换将原始特征转换为更能表达数据特征的一系列特征。
发表于 2016-03-09 16:47:36
回复(0)
4
今夜吃鸡
我们经常把特征选择中的"特征数据选择“和“特征抽取”混作一谈。
特征数据选择:不改变原始的特征数据,只是选择一部分出来。
特征抽取:进行了特征由高维到低维的映射,特征实际上产生了一定的变化。如PCA
具体参考:
https://blog.csdn.net/qq_37466121/article/details/87693022
https://blog.csdn.net/computerme/article/details/39157073
发表于 2019-07-19 15:44:37
回复(0)
2
牛客_1
注意题中的
特征选择
主成分分析方法主要用于特征降维
发表于 2017-09-20 16:26:44
回复(0)
0
自信的秋田犬
主成分分析(PCA)是一种降维算法,其基本思想是在原始数据空间中寻找使得投影方差最大化(重构误差最小化)的坐标系,然后在该坐标系下按照指定阈值进行降维。可以看作是一种特征提取方法,而不是特征选择方法。
简单来说:
特征选择是从原来特征集中选取较为重要的特征子集,主成分分析是将原特征进行映射
编辑于 2023-10-13 10:45:22
回复(0)
0
Taured
主成分分析是根据属性自身性质进行降维的,与分类结果无关。而前三项都是与分类结果相关的
发表于 2023-10-11 18:20:49
回复(0)
0
勇敢的修勾刷了100道题
主成分分析不属于文本分类的特征算法
发表于 2023-06-08 13:25:11
回复(0)
0
榆荫下的天上虹
这个attribute selection和lasso/forward selection/backward selection应该说的不是一回事吧?
发表于 2022-10-28 20:05:27
回复(0)
0
华清小学生
pca不是用来降维的么,应该是属于特征选取吧
发表于 2022-05-04 23:46:40
回复(0)
0
狗儿🐶
特征提取的方法:卡方检验,互信息,信息增益
发表于 2019-06-18 09:26:12
回复(0)
0
门头沟吴彦祖
PCA也可以做特征筛选,只不过不适用于文本而已。
发表于 2019-03-12 14:08:09
回复(0)
0
恨自己不够强
主成分分析不属于常用的文本分类的特征选择算法,我就打打字记住就行了,嘻嘻
发表于 2019-03-07 09:23:15
回复(0)
0
哈哈哈哈Shawn
文本特征选择 文本频率 互信息 信息增益,卡方检验 pca是特征选择,可用来降维,
编辑于 2018-08-26 10:06:27
回复(0)
0
Aaron_12
常见的六种特征选择方法
DF(文档频率):统计特征词出现的文档数量,用来衡量某个特征词的重要性
互信息法:互信息法用于衡量特征词与文档类别直接的信息量。
信息增益法:通过某个特征词的缺失与存在的两种情况下,语料中前后信息的增加,衡量某个特征词的重要性。
卡方检验法:利用了统计学中的"假设检验"的基本思想:首先假设特征词与类别直接是不相关的
主成分分析是降维
发表于 2018-08-05 12:00:24
回复(0)
0
牛客871023号
特征选择是从原来特征集中选取较为重要的特征子集,主成分分析是将原特征进行映射
发表于 2017-03-19 13:58:33
回复(0)
这道题你会答吗?花几分钟告诉大家答案吧!
提交观点
问题信息
搜狐
数理统计
机器学习
上传者:
烽火大仙人
难度:
17条回答
1436收藏
20299浏览
热门推荐
相关试题
如何判定训练出的模型过拟合?
百度
机器学习
评论
(6)
某人先写了n封投向不同的信,再写n...
组合数学
概率统计
概率论与数理统计
评论
(4)
请写出贝叶斯公式,请描述朴素贝叶斯...
百度
数理统计
机器学习
评论
(3)
分页系统的逻辑地址结构是一维的,分...
操作系统
评论
(1)
你说在销售运营这个岗位上会涉及到一...
评论
(1)
扫描二维码,关注牛客网
意见反馈
下载牛客APP,随时随地刷题