输入数据为一个二维列表,每个子列表代表一个申请者的记录,其中包含申请者的特征和信用评分结果(良好或不良)。最后一个元素为信用评分结果,其中 'G' 表示信用良好,'B' 表示信用不良。其余元素代表申请者的不同特征值,例如年龄、年收入、信用卡余额等。
输出信息增益比最高的特征的索引(从0开始计数),如果信息增益比最高的特征是第一个,则输出0,如果是第二个,则输出1,以此类推。
[[25, 50000, 2000, 'G'],[30, 55000, 3000, 'G'],[35, 60000, 0, 'B'],[40, 65000, 4000, 'B'],[28, 48000, 1000, 'G']]
0
可以使用Python中的numpy、scipy、pandas、scikit-learn库。