传统交叉熵只考虑了特征与类别之间的相关性,而忽略了特征项在类内和类间分布的均匀程度。
互信息筛选特征的方法受稀有特征的影响比较大
信息增益筛选特征倾向于特征值比较多的特征
皮尔逊相关系数计算时,方差均为0时,相关性最大
这道题你会答吗?花几分钟告诉大家答案吧!
扫描二维码,关注牛客网
下载牛客APP,随时随地刷题