首页 > 试题广场 >

下列关于决策树的说法正确的是( )

[不定项选择题]
下列关于决策树的说法正确的是(      )
  • ID3决策树是根据信息增益来划分属性
  • C4.5决策树是根据增益率来划分属性
  • CART决策树是根据基尼指数来划分属性
  • 基尼指数反映了从样本集D中随机抽取两个样本,其类别标记不一致的概率,因此越小越好
决策树常用三种指标来确定是否继续划分集合:信息增益、信息增益率,基尼指数。
信息熵:即数据样本的纯度,纯度越高,熵越小。
信息增益:按照某一特征划分数据集后熵的减少量,选择减少量最多的特征进行划分,但是偏好特征取值较多的特征,常见模型ID3。
信息增益率:在信息怎亿的基础上除以一个固有值(intrinsic value,和取值数目有关),会对取值数目较多的特征有更多惩罚,偏好取值数较少的特征,常见模型C4.5
基尼指数:从样本集D中随机抽取两个样本,其类别标记不一致的概率,因此越小越好
发表于 2020-03-05 09:51:40 回复(0)
ID3信息增益
C4.5信息增益率
CART基尼指数
发表于 2020-09-07 17:03:13 回复(0)
发表于 2020-06-03 21:15:15 回复(0)
D错的难道不是前半句吗?“基尼指数反映了从样本集D中随机抽取两个样本,其类别标记不一致的概率”,按照gini = 1- S(P_c^2),哪里体现了”标记不一致“,明明是对于某一类标记的概率
编辑于 2024-03-17 10:57:08 回复(0)
决策树算法用于分类、回归任务,主要有D3、C4.5、CART树。
ID3算法以信息增益为划分标准,C4.5算法以信息增益比为划分标准,CART树以基尼系数为划分标准。
信息增益表示得知属性的信息后使样本集合不确定性减少的程度,越大越好。
信息增益比是对信息增益的改进,用于解决信息增益偏向于取值较多特征的问题,越大越好
基尼系数表示模型的不纯度,越小越好。
发表于 2023-02-24 15:51:55 回复(0)
这题没人觉得有问题吗?CART不是只能做分类呀 只有做分类的时候才用gini,做回归不是用的最小化平方误差吗???
发表于 2022-09-17 10:40:57 回复(0)