一面技术(30分钟) 1. 自我介绍 2. 详细讲一下哈啰出行实习项目(问的比较细) 3. 数据都有哪些特征?你怎么做特征选择的? 4. 为什么选用这些特征? 5. 模型效果是怎么来评估的? 6. 实习期间是怎么分工的? 7. 数据是怎么选取的?正负样本是怎么划分的? 8. 样本不平衡问题是怎么解决的? 9. 如果后续还要你进行改进,你觉得可以从哪些方面来进行改进? 10. 手写代码: 求一个字符串的所有子序列(字符串如果有重复字符,只取一次子序列) 11. 场景题: 有很多数据,它们是以向量形式存储的,怎么把它们自动的进行分类?(聚类)...