字节跳动商业变现部门推荐算法暑假实习面经

一面

算法题:leetcode 排序矩阵查找,leetcode 102 二叉树的层序遍历

  1. 介绍一个你认为做的最好的比赛
  2. ANN用的什么工具,介绍一下原理
  3. 为什么选择Annoy
  4. 还知道其他ANN算法吗?介绍了一下局部敏感hash
  5. 做用户商品交互特征的时候,你知道业界是怎么做的?扯了一下DIN模型的和目标商品的attention做法
  6. lightgbm和xgboost的区别
  7. 排序阶段你知道业界是怎么做的?说了一下点击率模型:deepfm,nfm,wide & deep,dcn,deepcrossing
  8. 介绍一下word2vec
  9. 介绍一下transformer
  10. bert的两种预训练方式
  11. 为什么要用mask?说了padding mask和sequence mask
  12. 为什么要sequence mask?防止信息穿越

二面

算法题:求从左上角到右下角的最小开销。给定一个二维数组arr[i][j],数组中每个点表示经过该点的开销,求从左上角为起点,右下角为终点的最小开销,在每个点时只能往右或者往下走,同时中途可能会有障碍,即有些点不能走,obs[i][j]=1时表示(i, j)不能走。dp和dp状态压缩。

  1. 介绍一个比赛
  2. ANN用的什么工具,介绍一下原理
  3. 如何提高冷门商品的推荐效果的
  4. 了不了解大数据框架
  5. 说一下你熟悉的linux命令
  6. 一个文件每行一个数字,用命令统计所有数的平均值和数字个数
  7. 逻辑回归损失函数和求导
  8. 介绍一下你了解的优化器和各自的优缺点
  9. Adam和Adagrad的区别

三面

算法题:有一个长度为n的数组,求一个数k,k的取值区间为[1, n-1],使得数组的前k个数和后n-k个数的方差和最小。
要求化简方差公式,达到计算子序列方差的时间复杂度为O(n)。化简后要求空间复杂度为常数级别。

  1. 写逻辑回归的logloss损失函数
  2. 逻辑回归损失函数可以用mse吗(从梯度角度)
    算了mse的梯度,答了相较于logloss的梯度多了p(1-p),也就是sigmoid的梯度,所以会梯度消失。面试官提醒mse是凸函数吗,如何证明是不是凸函数。
  3. 逻辑回归建模,如果只有9个正样本,一个负样本,那么有一列特征,这个特征对于的权重是正还是负
    没太理解,回答和特征值有关系
  4. 介绍认为做的最好的项目
  5. 项目中如何缓解曝光偏差的
  6. Embedding ANN召回用的什么工具
#实习##面经##字节跳动##算法工程师#
全部评论
结果如何😰
点赞 回复
分享
发布于 2021-03-10 00:56
请问你简历里面有写transformer才让你介绍的么?
点赞 回复
分享
发布于 2021-03-10 22:11
联易融
校招火热招聘中
官网直投
emmmmm方便问问你做的什么比赛吗,主要是想参考一下
点赞 回复
分享
发布于 2021-03-11 01:01
求教楼主三面算法题的思路是啥,没看太懂😂
点赞 回复
分享
发布于 2021-03-16 12:47
结果如何😢
点赞 回复
分享
发布于 2021-03-17 19:32
楼主二面、三面隔了多久?
点赞 回复
分享
发布于 2021-03-22 16:56
感谢同学分享的面试经历~马克杯已经在路上啦~😉  ----------------------  邀请大家参加春招面经征集活动呀~ 写面经,即可领100元京东卡、牛客周边! 活动详情:https://www.nowcoder.com/discuss/611293
点赞 回复
分享
发布于 2021-03-29 14:18
请问大佬base是北京吗?
点赞 回复
分享
发布于 2021-04-18 20:28

相关推荐

1.自我介绍2.抓着项目的一些问面试官喜欢问从顶层的实验设计的一些东西我的实验为什么要选用 cos 距离或者 mse?能不能用 KL散度?是不能用还是不好用?KL 散度和交叉熵的区别和联系是什么?(都是我没考虑过的问题 有点汗流浃背)既然你用到了那么多微调方式, 那你有什么实验过程中探究了 lora 的比如 秩之类的参数的影响吗?prompt tuning  ptuning v2 有啥区别?(说完他觉得我说的太八股太宏观了,又讲了一堆原理)为什么 p v 2 比 prefix tuning 要减去那个 lstm 和 linear? 我说论文里说适配 NLG 任务,好像记错了。有没有接触过强化学习?为什么你们只考虑微调,是因为啥原因?你是用几张卡跑实验?多大参数的模型?跑的时候内存占用量多大?有没有试过全量微调? 那你想一下,假如我用 deepspeed 的几种版本, 全量微调7B 模型,内存占用多大?最后大概的意思就是说他比较看重实验最初的一些设计能力, 不能蹬 OOM 再来解决。让我之后要多理解一下 deepspeed。说社招看的多这些理解能力。反正基本上就是项目围绕讲。 后面说我项目做的,工程应该能力不错。 代码题也是那种很简单的处理数据。
点赞 评论 收藏
转发
9 118 评论
分享
牛客网
牛客企业服务