滴滴网约车算法暑期实习面经

面试官在的组主要做网约车动态定价补贴策略和算法。
Timeline:一面5/13, 二面5/18,offer call 5/25。

一面 (5/13, 1h)
1. 自我介绍
2. 简历上每个项目逐个深挖(好的是,没让做算法题)
i)点击率预估项目
- 自己先简单介绍一下这个项目背景、过程、结果
- 邮件文本词向量编码,怎么作为特征输入,直接对词向量做average pooling,一些重点语义词的权重不会被降低吗(可能用attention更好)
- 有对构造的特征做进一步筛选吗(说了用随机森林的特征重要性),举例说说哪些特征更重要
- 为什么要用DeepFM模型,有考虑过用DCN吗
说了DCN如果cross部分用更高阶,模型会更复杂,公司的GPU内存支持不了模型的训练,而DCN用低阶的话和FM的二阶交叉项作用类似。面试官觉得cross的次数可以进一步具体调参。
- 介绍DeepFM的结构,最后输出是怎么合成deep和wide两部分的
- 用户是否有点击邮件,这部分的数据是如何获取的
- 只是简单的二分类问题吗,对于label是怎么做数据预处理的,如何判断用户的点击行为是否合理,会根据用户点击后对邮件的浏览时长对label进行加权吗,把二分类问题转化为回归问题(面试官指出可能用户会有误点、点击多次、只浏览了很短时间等多种情况)
- 对类别不均衡的数据怎么处理
欠采样,以及在损失函数上给正类加大权重。但面试官指出深度学习模型和XGBoost不一样,损失函数里正负类的权重比例和反向传播中正负类样本的梯度的比例不一定一样,需要深入看网络在反向传播时正负类样本的梯度具体的大小和比例。
- 模型是离线训练还是在线训练的,需要考虑时效性的问题

ii)交叉销售推荐系统
- 简单介绍项目
- 如何做特征工程,举例说一下构造了哪些特征,哪些特征更重要

iii)用户流失率预估模型
- 简单介绍项目
- 为什么用生存分析和基于逻辑回归的多任务学习模型
- 为什么不用LSTM和RNN等有时序性的模型
提到说因为输出的label可能会和实际情况有出入,用户上个月流失了,之后的状态会一直处于流失状态。但面试官说这个是一种单调性约束,可以把函数加入模型中考虑,来解决这个问题
- 怎么用AUC评估指标

iv)文本情感倾向性分析
- 介绍项目
- 为什么不先用现成的corpus(eg: wiki等评论类数据)先pretrain word2vec model,再在项目的数据上进行fine-tune

3. 可实习时长
4. 反问
- 组具体工作的内容
为拼车定价构建模型(所有用户),包括转化率预测,看用户是否选择该品类;价格弹性模型,工具预测模型,帮助描述业务。
为特定用户制定策略,(eg:价格敏感的用户),给多少补贴,可以帮助拉新和促活。
- 技术栈
了解机器学习和深度学习框架,数据处理的工具(spark,hadoop,hive),有业务sense,知道哪些模型适用哪种业务场景。

二面 (5/18, 1h)
1. 自我介绍
2. 简历项目深挖
i)电商销量预测
为什么做,用了什么特征。LightGBM如何调参,调参num_tree与max_depth的先后顺序有什么影响

ii)交叉销售推荐系统
如何设计AB实验。为什么不先做AA实验看两组是否本身有区别。怎么判断是否有显著性差异。为什么要做4次实验。
用什么工具做特征工程,为什么要把数据拉到本机训练,如何在线上验证模型表现

3. 之前的工作节奏怎么样,项目都是自己做的吗
4. 反问,介绍了组内的工作
- 核心是定价,探索用户在不同场景下对不同价格的敏感程度,对应不同的补贴和价格策略
- 乘客对拼车产品的接受程度,量化意愿的强烈程度
- 给用户预估的到达目的地的时间,对乘客行为的影响

过了一周面试官联系说通过了,介绍了一下实习入职之后可以做的项目。

#实习##面经##滴滴##算法工程师#
全部评论
楼主这些项目网上有吗?还是是实习实验室项目?
点赞 回复
分享
发布于 2021-05-14 09:59
楼主接offer了吗
点赞 回复
分享
发布于 2021-06-15 21:38
小红书
校招火热招聘中
官网直投
看完只能说一句 牛
点赞 回复
分享
发布于 2021-06-18 16:09

相关推荐

【一面】对着项目问的比较多1. 线性回归的假设条件是什么2. 介绍lstm,transformer这些3. transformer相比于seq2seq,它的增量点在什么地方4. 因果推断和(事件发生前拟合一个模型,使用这个模型对事件发生后进行预测从而得到效应),增量在什么地方,有哪些本质上的区别(跟我的项目相关)5. 对于销量预测模型,你有什么思路;怎么进行模型选型;如果没有其他特征,只有按时间变化的销量,可以怎么预测?6. 一个人投篮的命中率是60%,是投10次至少命中7次的概率大,还是投100次至少命中70次的概率大(大数定律)7. 手撕:两个椭圆x^2+y^2/2=1,x^2/2+y^2=1,求这两个椭圆相交部分的面积(蒙特卡洛模拟,好像还可以使用极坐标直接求解,忘了)比较注重数理(可能也是因为我是数理出身)【二面】1. 50个黑球和50个白球,分别放进两个框,怎么放置,可以让一个人拿到白球的概率最大2. 一个细胞的生命有三个小时,每个小时都会分裂一次,到T时刻会有多少细胞呢?3. 希望在算法岗从事什么样子的工作4. 技术栈有哪些面试时间很短,面试官很佛系,没咋问【三面】1. 问对深度学习那块比较熟,回答时序预测,问有无读过现在的SOAT方法,回答无(没读过啥paper)2. 什么样的embedding是好的embeding,怎么评估3. 选择unieval模型是怎么做的模型选型4. 拿到一个新方向是怎么调研的,怎么去找论文的5. 介绍transformer,每个encoder的结构是什么6. 介绍self-attention7. 怎么理解q,k,v8. 可以使用同一个W_q和W_k吗9. 为什么q×k之后要scale,d 是什么10. 时空图(论文,但是别人做的这part,自己不太了解了)11. 手撕:打家劫舍(偏重对算法的理解,和项目实现上的一些细节)一二面反馈非常快,5分钟就会有下一面的反馈,三面无了,可能自己没过攒人品攒人品攒人品!许愿许愿许愿!
点赞 评论 收藏
转发
3 30 评论
分享
牛客网
牛客企业服务