顺丰 机器学习一面
1.研究生和本科期间主修课程
2.假设分布有哪些,概率论里的?
3.凸优化会想到那些关键字(梯度下降,线性规划)
4.如何解决局部最优问题(momentum, Adam)
5.SVM的目标函数有哪些形式
6.如何求解有约束问题
7.做分类和回归的时候对数据的分布做一个什么假设(正太分布)
8.怎么构建损失函数
9.过拟合如何解决
10.随机森林如何定义熵(信息熵的数学公式)
11.决策树的剪枝有什么评判标准(上剪枝和下剪枝)
12.聚类的相似度计算方法(余弦相似度,欧氏距离)
13.对模型的评估指标有哪些,分类和回归问题
14.数据不平衡的情况,AUC和PR曲线哪个更好
15.对于文本数据格式,往往占用内存很大,你会采用什么样的方法处理(从语言角度,平台角度,还有对于文本本身的处理);
- 大数据平台计算;
- 多线程和多进程处理;
- 文本数据的处理:向量化,词袋模型;
16.手势识别项目介绍