类别型特征

编码 用途
序号编码 通常用于处理类别间具有大小关系的数据
独热编码 通常用于处理类别间不具有大小关系的特征
二进制编码 先用序号编码给每个类别赋予一个类别ID,然后将类别ID对应的二进制编码作为结果
Helmert Contrast
Sum Contrast
Polynomial Cotrast
Backward Difference Contrast

栗子

  • 性别
性别 类别ID 二进制表示 狂热编码
1 0 1 1 0
2 1 0 0 1
  • 血型
血型 类别ID 二进制表示 狂热编码
A 1 0 0 1 1 0 0 0
B 2 0 1 0 0 1 0 0
AB 3 0 1 1 0 0 1 0
O 4 1 0 0 0 0 0 1
全部评论

相关推荐

04-13 11:19
门头沟学院 HTML5
NullPointe...:27实习的都快结束了吧
点赞 评论 收藏
分享
985柜员:开发还敢还叫,全部让自测就老实了
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务