首页 > 试题广场 >

在机器学习的特征选择过程中,可以用到的方法有

[不定项选择题]
在机器学习的特征选择过程中,可以用到的方法有
  • 卡方
  • 信息增益
  • 交叉熵
  • 互信息
卡方检验是通过对特征进行打分然后排序,选择排名靠前的特征来表示文本。
发表于 2019-01-08 18:26:35 回复(0)
在文本分类中,首先要对数据进行特征提取,特征提取中又分为特征选择和特征抽取两大类,在特征选择算法中有互信息文档频率信息增益卡方检验以及期望交叉熵
期望交叉熵,以文本分类为例子,期望交叉熵用来度量一个词对于整体的重要程度。
在ID3决策树中,也使用信息增益作为特征选择的方法,在C4.5决策树中,使用信息增益比作为特征选择的方法,在CART中,使用基尼指数作为特征选择的方法


发表于 2019-04-09 16:40:30 回复(0)
交叉熵做特征选择很少见,各位亲可以参考这篇文章https://blog.csdn.net/liu_zhlai/article/details/53512942
发表于 2019-03-24 09:49:27 回复(0)