输入数据为一个二维列表,其中每一行代表一个信用卡申请者的记录,每一列代表一个特征。其中最后一列是目标变量,其中'Good'表示信用良好,'Bad'表示信用不佳,倒数第二列也是字符串特征,其余特征值可以是整数或浮点数。
输出一个整数,最重要的特征的索引(从0开始计数)。
[ [50000, 1, 'Yes', 'Good'], [50000, 2, 'No', 'Bad'], [70000, 3, 'Yes', 'Good'], [40000, 4, 'No', 'Bad'] ]
2
使用决策树的方法计算,固定随机种子为42,可以使用numpy、pandas、scikit-learn库。保证输出唯一。
这道题你会答吗?花几分钟告诉大家答案吧!