2020-11-24 19:20 北京工业大学算法工程师

关注

机器学习之路：【特征预处理】python 字典特征提取器 DictVectorizer【离散特征onehot】

将字典类型数据结构的样本，抽取特征，转化成向量形式

源码git: https://github.com/linyi0604/MachineLearning

代码：

from sklearn.feature_extraction import DictVectorizer

'''
字典特征提取器：
    将字典数据结构抽和向量化
    类别类型特征借助原型特征名称采用0 1 二值方式进行向量化
    数值类型特征保持不变
'''

# 定义一个字典列表 用来表示多个数据样本
measurements = [
    {"city": "Dubai", "temperature": 33.0},
    {"city": "London", "temperature": 12.0},
    {"city": "San Fransisco", "temperature": 18.0},
]

# 初始化字典特征抽取器
vec = DictVectorizer()
data = vec.fit_transform(measurements).toarray()
# 查看提取后的特征值
print(data)
'''
[[ 1.  0.  0. 33.]
 [ 0.  1.  0. 12.]
 [ 0.  0.  1. 18.]]
'''
# 查看提取后特征的含义
print(vec.get_feature_names())
'''
['city=Dubai', 'city=London', 'city=San Fransisco', 'temperature']
'''

全部评论

推荐最新楼层

昨天 11:17

vivo_数据算法工程师(准入职员工)

正浩创新内推，正浩创新内推码

26届女硬件工程师丨正浩创新面经及流程9.1一面1.自我介绍2.有无相关电源设计项目或经历，并浅谈3.DCDC拓扑手撕（但是我当时没带纸笔所以口头描述），BUCK和BOOST，同步异步的区别和优缺点，同步电路的控制方式（施加什么PWM波形，如何控制MOS通断）4.项目中最有挑战性的部分，怎么解决的，然后会深挖这一部分再提问（这个问题出现的根本原因，下次如何避免）5.面试官说我专业其实不是很对口，不是电气工程专业，所以问的比较浅，大家仅供参考9.2收到笔试链接，非笔试，为性格测试9.5收到二面短信9.8 二面，没有技术问题，主要问了在校做过什么项目，调试遇到什么问题，除此之外有没有做过电源相关项...

点赞评论收藏

分享

12-02 12:48

已编辑

广州大学 Java

28届双非Java求助，首段实习该如何找……

各位前辈们好，本人从大一上学期末开始学习Java，到现在差不多一年了，期间有幸进了一个学长的上线的项目组，学到了很多东西。八股什么的不敢说都背会了，但也基本过了一遍。现在想开始找第一份实习，但不太敢直接投大厂，担心实力不足脏面评了，所以先把目标放在中小厂，先积累一下面试和实习经验。目前hot100正在二刷，但感觉算法还是短板，时做时新关于投递时机，学长说年后投春季日常合适，但我看到有前辈会投寒假实习，机会似乎也不少。我寒假比较闲，所以有些蠢蠢欲动了，不过感觉可能有些操之过急了……所以我想请问各位前辈：寒假实习是否值得尝试？还是说最好再沉淀一寒假等春季日常呢？然后还希望各位前辈能够锐评一下我的简...

Yilena：还是决定再沉淀沉淀了，小小海投了一下，入场晚了现在基本没有寒假实习岗了，几乎都是日常，而且岗位也比较少，质量也不高。还是等年后冲击一下中大厂的日常看看吧

点赞评论收藏

分享

11-20 15:33

门头沟学院 Java

粗粮真是性价比厂

粗粮还在给我泡着呢，已经有人开了，看到这点钱还在北京，这也太低了，真是抠门呢

布哥带你学测开：对米来说已经是开恩了

校招薪资来揭秘

点赞评论收藏

分享

11-29 16:14

山西大学测试工程师

软件测试面试： postman与jmeter的区别

一、核心定位Postman：接口调试、轻量自动化测试工具JMeter：性能测试核心工具（兼容接口测试）二、适用场景Postman：单接口调试、简单流程自动化、团队协作分享、CI/CD轻量集成JMeter：高并发压测（万级+用户）、负载/压力测试、复杂场景接口自动化、多协议测试三、易用性Postman：图形化界面直观，上手快，无代码基础可操作JMeter：界面偏技术化，配置繁琐，学习成本高四、并发能力Postman：仅支持百级用户并发，不适合压测JMeter：支持万级+高并发，Java线程模型，压测性能强五、自动化支持Postman：Collections批量执行、Newman命令行、基础流程编...

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

华为开奖交流

热聊中

创作者周榜

更多

正在热议

更多

# 为了去实习，我赌上了___ #

8073次浏览 85人参与

# 2025年终总结 #

1795次浏览 44人参与

# 哪一瞬间让你觉得“这班不如不上” #

4360次浏览 76人参与

# 父母对你找工作是助力还是阻力？ #

6101次浏览 125人参与

# 十二月请对我好一点 #

14519次浏览 229人参与

# 工作前VS工作后，你的心态变化 #

6988次浏览 91人参与

# 一人推荐一个值得做的项目 #

4887次浏览 84人参与

# 滴滴工作体验 #

35325次浏览 145人参与

# uu们，春招你还来吗？ #

3521次浏览 37人参与

# 高薪高压 vs 低薪wlb，你怎么选？ #

5391次浏览 58人参与

# 工作中出现了XX情况正常吗 #

17245次浏览 153人参与

# 得物app工作体验 #

39413次浏览 97人参与

# 你的实习什么时候入职 #

321464次浏览 2170人参与

# bilibili求职进展汇总 #

173566次浏览 1069人参与

# 产品实习，你更倾向大公司or小公司 #

184730次浏览 2040人参与

# 秋招有哪些公司要求提前实习 #

91851次浏览 493人参与

# 公司福利里最没用的一项是啥 #

3586次浏览 70人参与

# 你面试被问到过哪些不会的问题？ #

103599次浏览 1859人参与

# 回顾今年你干过的最“勇”的一件事 #

7369次浏览 109人参与

# 被AI治愈的瞬间 #

82330次浏览 674人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务