成本回归项目记录
1.3
尝试版本1:
- 特征为5种技术人员+3种服务厅+属于哪个市+年份
- 将region转化为了one-hot向量
- 做了标准化处理
ScaledAB: -59.101411 (7.370980)
ScaledAB-KNN: -50.292338 (7.455068)
ScaledAB-LR: -91.011016 (12.585718)
ScaledRFR: -56.580222 (12.460036)
ScaledETR: -46.490758 (9.125719)
ScaledGBR: -50.230823 (11.031552)
尝试版本2:
去掉了region属性,结果全面比上一个差
未来:
打算加上D,或者加上是否为市,然后因为大多是拖尾分布,我可能会用log处理一下
查看16道真题和解析