字节跳动NLP算法实习面经

大三,打算找一个实习体验一下,之前投了阿里暑期实习,两面被拒,后来又被字节捞起来了,NLP算法实习生(应该是日常实习)
感觉我个人水平在众多面试者中也就一般,本科生,无paper,能收到offer真的超级惊喜了
之前一直在牛客看各种面经,感觉挺有帮助的,现在收到offer了,发一下面经,感恩
一面
项目经历(感觉可能和面试官方向不大一样,所以基本上就是我在说,面试官打断问一些细节)
说一下Bert的嵌入层,然后就是各种关于Bert的细节问题
attention和self-attention
word2vec 负采样
逻辑回归
两道算法题:
1.输出幂集(比较简单,给了两种方法,迅速的过了)
2.给一个无序数组,输出最小的不在数组中的正数(开始没想出来,面试官提示了一下才有了思路)
一面之后感觉有戏,过了一个小时等来了HR电话,约了二面(三天之后)
二面
项目经历(面试官问了好多关于怎么落地的问题)
Bert的各种问题(position embedding,transformer什么的)
SVM
XgBoost(这个不太会,只含含糊糊的说了大概理解,然后面试官就问了一下是不是不太了解统计机器学习,只好承认不是很了解,只知道最基础的大概,然后面试官就特别友善的开始问深度学习方面的问题)
Text-CNN,LSTM,word2vec
一道算法题:
1.一个模拟题,简单写了一个DFS
二面之后感觉有点悬,然后几个小时之后竟然接到了电话,HR面
HR面
问了一下可以开始工作的时间,比赛的获奖情况,怎么平衡实验室和实习之间的精力分配


#字节跳动##实习##面经##算法工程师#
全部评论
不转正 保研了吗
1 回复 分享
发布于 2020-06-16 14:05
两年前这么简单么😭今年好难,二面直接hard算法题,问的基础也都是非常规问题,很细枝末节,平时学很难注意到的东西。。。以及项目中的极端情况:极度数据不平衡问题,面试官只想听异常检测这个答案,服了
点赞 回复 分享
发布于 2022-05-29 17:16
字节跳动Data团队招多岗位算法实习生~详细JD请点链接https://www.nowcoder.com/discuss/590127?channel=666&source_id=feed_index_nctrack 【岗位类别】 后端开发实习生、前端开发实习生、物流算法实习生、数据挖掘算法实习生、NLP算法(问答、对话方向)实习生、自然语言处理算法实习生、推荐算法实习生(详细JD见后) 【薪酬福利】 1、全勤月薪5K - 7K  2、表现优异可以提供转正面试机会 3、免费三餐+下午茶、免费健身、团队氛围好、大牛带队、就近租房补贴 4、工作地点为杭州市余杭区西溪八方城(近五号线五常站) 感兴趣的同学请发送简历到邮箱:caifeiyang@bytedance.com 邮件名称:岗位+姓名+学校+最早到岗时间+每周实习天数+实习持续时间
点赞 回复 分享
发布于 2021-02-04 11:37
请问楼主是哪个部门呢~
点赞 回复 分享
发布于 2021-01-02 09:23
楼主你在哪里投的简历
点赞 回复 分享
发布于 2020-09-15 15:17
你这是top2吧?算法实习生基本是都只要研究生了
点赞 回复 分享
发布于 2020-06-30 18:51
lz大三就去算法实习很强
点赞 回复 分享
发布于 2020-06-16 09:06
请问HR面会挂人吗
点赞 回复 分享
发布于 2020-04-25 17:46
请问是投的哪个岗位呢,我看有好多NLP算法工程师岗位选择
点赞 回复 分享
发布于 2020-04-24 23:04
楼主感觉一面难还是二面难?
点赞 回复 分享
发布于 2020-04-24 17:47
厉害!!!!很好的经验贴
点赞 回复 分享
发布于 2020-04-24 17:45

相关推荐

一面/二面 压力都不大,只有一些八股值得参考:1.交叉熵损失的物理含义是什么?2.KL散度的本质是什么?3.用什么loss比较多?我说一般就mse,又通过focal loss,让我接着介绍,如何平衡正负样本。三面,我以为轻松了结果是最硬核的技术面,问了一堆八股,并且要求现写公式,不到最后都不能放松警惕啊:1.讲讲python的dict底层是怎么实现的?hash实现2.如何解决hash碰撞?说了个线性探测(其他真不记得了)3.C++的STL还熟悉吗?完全不会,3年没写了。4.好吧那不问了,flash-attention了解吗,讲讲原理?5.kv cache了解吗?6.Q要cache吗?7.讲讲常见的标准化,LayerNorm,RMSNorm?8.实际应用你觉得什么区别吗,现在哪个用的多?9.问了这么多才开始讲项目,等我讲完面试官直接总结,你的项目是在高维特征添加了一些low-level的视觉信息做work,现在有个开放的问题想问你:大模型的语料是有限的,但是搜推链路上token可能是无限的,比如可能一个蛋糕,每个用户的每一次蛋糕购买记录都是独立的,蛋糕1,2...100,你要如何解决?10.似乎我没理解对,追问不对不是这个意思,重新问:大模型的数据是非常多的,但是搜推的数据可能很高维度而且不多,比如用户看到图->点击右上角->再点到推荐购买->.......,整个特征链路非常长,这种数据量不像大模型训有非常丰富的语料,你如何解决这个训练问题?
查看14道真题和解析
点赞 评论 收藏
分享
评论
13
128
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务