11.13字节校招推荐算法面经

一面
1.实习项目交流
2.transformer计算的时间复杂度和空间复杂度,deepseek对transformer主要做了哪些改进?
3.为什么要在推荐系统中引入rqvae?
4.如何解决坍缩问题?
5.对rankmixer了解吗?介绍一下?
6.详细介绍一下Moe?优缺点各自是啥?
7.训练模型如果loss不稳定,如何解决?
8.了解lora 吗?介绍下lora原理
9.代码:手撕mha
二面
1.项目介绍
2.bert的预训练任务是什么?
3.bn和In的区别?在什么场景使用?
4.如果qk变成同一个矩阵会有影响吗?如果一定要变成同一个矩阵,如何解决影响?
5.介绍一下帕累托?
6.如何挑选特征?
7.你对推荐算法中特征工程的心得有哪些?
8.代码:实现交叉熵损失
全部评论

相关推荐

找工作勤劳小蜜蜂:自我描述部分太差,完全看不出想从事什么行业什么岗位,也看不出想在哪个地区发展,这样 会让HR很犹豫,从而把你简历否决掉。现在企业都很注重员工稳定性和专注性,特别对于热爱本行业的员工。 你实习的工作又太传统的it开发(老旧),这部分公司已经趋于被淘汰,新兴的互联网服务业,比如物流,电商,新传媒,游戏开发和传统的It开发有天然区别。不是说传统It开发不行,而是就业岗位太少,基本趋于饱和,很多老骨头还能坚持,不需要新血液。 工作区域(比如长三角,珠三角,成渝)等也是HR考虑的因素之一,也是要你有个坚定的决心。否则去几天,人跑了,HR会被用人单位骂死。
点赞 评论 收藏
分享
评论
1
3
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务