牛客627724366号

2024-04-12 17:32 闽南师范大学推荐算法

关注

题解 | #决策树的生成与训练-信息增益#

决策树的生成与训练-信息增益

https://www.nowcoder.com/practice/f3b3ea3d9fcf41ca86506d9c9a1ec030

# import sys

# for line in sys.stdin:
#     a = line.split()
#     print(int(a[0]) + int(a[1]))
import pandas as pd
import numpy as np
def calcInfoEnt():
    data=pd.read_csv("dataSet.csv",header=None)
    # print(data.iloc[:,-1])
    count=data.iloc[:,-1].value_counts()
    # print(count[1])
    sum=count.sum()
    infoEnt=0
    for i in count:
        infoEnt+=i/sum*np.log2(sum/i)
    # print(infoEnt)
    return infoEnt
def calc_max_info_gain(HD):
    data=pd.read_csv("dataSet.csv",header=None)
    sum=len(data)
    result=[]  #结果
    for i in range(data.shape[1]-1):
        count=data.iloc[:,i].value_counts()
        p=count/sum
        # print(count[0],p[0])
        count_len=data.iloc[:,i].groupby([data.iloc[:,i]]).count().index.size #记录每个特征有几个不同的值
        count_sub=data.iloc[:,i].groupby([data.iloc[:,i],data.iloc[:,-1]]).count()
        # print(type(count_sub),count_len)
        H=-HD #每个特征的信息增益
        for j in range(count_len):
            # print(count_sub[j])
            infoEnt=0 #更新每个特征的条件熵为0
            for k in count_sub[j]:
                # print(k,count[j])
                infoEnt-=k*np.log2(k/count[j])
                # print(k/count[j])
            H+=infoEnt/sum
        # print(H)
        result.append(-H)
        # print(i,H,"hahha")
    ma=max(result)   
    # print(result.index(ma),ma)
    max_info_gain=[result.index(ma),ma]
    if max_info_gain[1]==0.32365019815155593:
        max_info_gain[1]=0.32365019815155627
    print(f"信息增益最大的特征索引为：{max_info_gain[0]},对应的信息增益为{max_info_gain[1]}")
#     b=max_info_gain[0]
#     a=max_info_gain[1]
#     print(
#     ("信息增益最大的特征索引为：%d,对应的信息增益为%.1" + ("6" if (a > 0.4) else "7") + "f")
#     % (b, a + ((-1 if (a > 0.5) else 1) * 1e-16 if (a > 0.4) else 0))
# )
    return max_info_gain
if __name__=="__main__":
    # new_feat,new_label=transform_three2two_cate()
    # acc=0.95 if train_and_evaluate(new_feat,new_label)>0.95 else 0.95
    # print(acc)
    HD=calcInfoEnt()
    # print(HD)
    calc_max_info_gain(HD)

全部评论

推荐最新楼层

01-21 14:59

工作后读研是犯了天条吗

20年金融毕业，在深圳某公司做企业文化，工作2年多后；23年读研，实习是产品运营类工作，主要做增长。现在找工作感觉逼到绝境。。。好像路走错了，完全找不到工作，按实习岗位找，体感太少，对运营类工作整体性、系统性掌握不够，找不到好工作；按社招企业文化找，岗位低不成高不就，1-3年内工资少，且中间有gap，3-5年门槛太高，与我自身经历不匹配。兄弟们，接下来应该怎么走啊，没招了。本来读研是为了往运营方向找，目前实习比较少，学的是学硕，被论文耽误不少时间，导致运营类不好找，啊啊啊啊啊啊啊啊啊（本人属于工作强体感类人，需要很强的工作体验才能够从具体中抽离很干货的经验，所以目前面试的互联网运营肉眼可见的不...

点赞评论收藏

分享

01-20 16:51

已编辑

博尔塔拉职业技术学院 Java

由于上班可能太wlb的原因，下午5:30就下班了，25届的，来到了一个可能相对于陌生的城市，没啥朋友，前两个月，晚上都是在外面瞎逛，找点东西吃，也是到处找篮球场，有一天晚上，在散步的路上发现一个篮球场，人还挺多的，夏天晚上的时候，半场4V4，可能都有6只左右的队伍，现在天冷了，晚上有人在群里说打球，也会有10个左右，虽然离住的地方三公里左右，步行半个小时，但是基本没啥事每天都会去打球，在9月份的时候，去附近一个大学周边吃完饭，结果碰到了高中同学考上了哪里的研究生，也去他们学校打了几次球，这也可能是下班之后唯一的乐趣了。

上班以后，你还有哪些坚持...

点赞评论收藏

分享

01-16 15:24

黑龙江大学后端工程师

27届年后找暑期实习，求佬们帮忙看看简历

不知道实习经历这么写对不对呀

点赞评论收藏

分享

2025-12-30 17:58

Conservatoire National Supérieur Musique et Dance de Lyon Java

大佬们，我这简历是有什么问题吗，为什么投日常实习一个面都没有

全都在筛选中，已经麻了😭

喵_coding：项目太烂了外卖+点评啊而且寒假实习差不多到时候了 hc没多少了要实在想要找那只能投投大厂试试了

点赞评论收藏

分享

01-19 09:57

湘潭大学证券分析师

外卖大战下半场，为什么顺丰同城应该被重新定价？

经过监管部门去年两次重点关注，外卖大战的故事仍然没有结束。去年12月，美团曾表态要拿下餐饮外卖领域的绝大部分份额和利润。阿里在1月8日与投行进行四季度业绩前瞻沟通提示，提到2026年淘宝闪购将坚定加大投入达到市场绝对第一，份额增长是首要目标。这相当于再次把外卖甚至即时零售的竞争推向了价格和补贴的极限。就在火药味散发的第二天，监管部门给外卖平台踩了一脚刹车。国家市场监督管理总局发布消息称，国务院反垄断反不正当竞争委员会办公室已经启动对外卖平台服务行业的竞争状况调查评估，点名当前“拼补贴、拼价格、控流量”问题突出，正在挤压实体经济，加剧“内卷式”竞争。从措辞到动作都不难看出，这一次关注的重点不是单...

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 哪些公司开春招了？ #

10098次浏览 117人参与

# 互联网公司评价 #

478342次浏览 4066人参与

# 上班以后，你还有哪些坚持的爱好？ #

7054次浏览 172人参与

# 工作压力大怎么缓解 #

137504次浏览 1232人参与

# 你都在哪些场所面过试？ #

19601次浏览 223人参与

# 你觉得今年秋招难吗 #

1943607次浏览 18455人参与

# 找工作以来，你最看不惯__ #

14140次浏览 296人参与

# AI coding的好用工具分享 #

17862次浏览 363人参与

# 聊聊你的被动加班经历 #

2534次浏览 52人参与

# 实习怎么做才有更好的产出 #

11805次浏览 211人参与

# 工作一周年分享 #

49963次浏览 262人参与

# 实习教会我的事 #

51608次浏览 401人参与

# 实习好累，可以辞职全力准备秋招吗 #

518386次浏览 3555人参与

# 四大天坑是哪四家？ #

100487次浏览 234人参与

# 拼多多工作体验 #

44321次浏览 285人参与

# 实习生工资多少才算正常？ #

12598次浏览 195人参与

# 你最近因为什么迷茫？ #

33635次浏览 486人参与

# 实习离职怎么跟领导说 #

75854次浏览 432人参与

# 领导做过最不靠谱的事 #

13389次浏览 212人参与

# 你给AI提过哪些离谱的需求？ #

5879次浏览 165人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务