字节 业务中台 算法实习生面经

Boss投的,第二天就约面试了。
一面 3月14日 60min

1、自我介绍
2、学校做cv,为什么实习找nlp
3、聊项目:
  (1)预训练数据怎么构造的,sft数据格式。
  (2)为什么预训练数据要加维基百科的语料库。     
  (3)预训练数据好像加在sft阶段也可以,为什么还要进行预训练。
  (4)dpo在项目中主要想解决什么问题?grpo你想解决什么问题?
5、算法题:最大子数组和

隔天周六3月15晚上发感谢信了。

感觉聊的还行,项目深度这块应该回答的让面试官不满意。

#字节求职进展汇总#  #面经#  #算法工程师#  #大模型算法工程师#
全部评论
佬是有一段熟悉经历了吗
点赞 回复 分享
发布于 03-18 00:46 辽宁
base深圳吗
点赞 回复 分享
发布于 03-17 00:37 江苏
Boss投递效率真高
点赞 回复 分享
发布于 03-16 17:54 陕西省

相关推荐

1.决策树与随机森林区别2.GBDT的原理、 XGBoost 与 LightGBM (项目涉及会问到)3. XGBoost 的其他变体( CatBoost 等)4. Transformer (这个这个超级超级重要!!)5.手撕 Self - Attentin 、 Multi - Head Attention6.特征归一化( LN / BN )7.交叉熵损失(字节常考,交节)8.优化器( SGD / Adam / Adagrad )9.L1/L2正则化( LightGBM 中也会用到)10. Dropout 原理11.模型初始参数为0的问题12.梯度消失与梯度爆炸及其解决方法13.Wide& Deep 模型(也可以准备一下,很多工业界还用这种类似的模型,有 wide 侧和 deep 侧,说不定面试官会感兴趣)14. DeepFM 模型15. DIN 模型、 DIEN 模型(特征处理)16.多目标学习( MMOE 、 ESMM ,可以了解 PLE )17.DIN模型、 SIM 模型18.DCN模型和其他交叉网络( LHUC 、 SENet 、 FiBiNet )19.冷启动策略(新闻推荐项目也会涉及冷启)20.重排规则(可以看王树森的课程简单了解)21.A/ B 测试的分桶方式是什么?22.推荐系统的短期消费指标?23.推荐系统的北极星指标(最关键指标)?24.推荐系统的转化流程是什么?25.矩阵补充模型原理和损失函数26.召回的正负样本选择(曝光未点击的能否作为负样本)📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
查看26道真题和解析
点赞 评论 收藏
分享
上来就正常自我介绍实习经历,之前做的是什么,学到了什么看你没做多久,为什么(单纯觉得不合适,自己干完项目就跑了)给你个电商场景题(订单,支付,退款),去提取出核心测试点,编写用例写sql语句,两个表简单join联表查询,加个distinct避免重复就可以了算法题,二分查找,一个全是两两配对的重复元素数组,找出那个单独存在的数(我自己太抽象了,最开始思考了两分钟,给他说压栈😂,但是后边自己逗笑了,我这和遍历没区别啊,然后就想到了二分查找,但是太久没写了,自己搁草稿本上验证了几分钟正确性,然后写到一半,那大哥嫌我写的慢,我刚开始写双指针那里就让我卡了,说时间紧,任务重,还是太久不去写,纯菜了,不验证那几分钟应该就写好了)问你做测试,接口测试用过什么软件(Postman,jmeter)你怎么用jmeter做的接口测试(就正常创建线程组,创建请求,填地址和方式,请求内容之类的)你用jmeter做断言是怎么做的(没用过他这功能)前后端是怎么交互的然后就是反问了其实难度不怎么高,都很基础,只是我确实没想到要手撕算法题,太久不写变菜了(我也没想过测试也要手撕😂)不过那个面试官是真的没啥生气,感觉他死气沉沉的,声音很小,感觉是被10106的生活摧残的没有力气了😢😢😢
查看9道真题和解析
点赞 评论 收藏
分享
评论
3
9
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务