横扫腾讯/字节/PDD:2025大模型算法社招面经

1️⃣自我介绍
2️⃣项目拷打
这一部分决定了面试官对于你经验的评估,项目的理解要深一些,这个只能通过不断打磨完善项目经历。
✅微调项目:
1.业务背景
2.数据的构成,是否使用了合成数据
3.训练的过程中用了什么方法(为什么用这样的方式,用别的方式会有什么问题,是否尝试过)
4.如何评估整体的效果
5.微调之后是否还会出现幻觉的问题,出现了的话应该怎么处理
6.这个能力是否只能用在当前业务场景,是否可以作为一个通用的能力
7.是否尝试过用其他的基座模型
✅应用层项目:
1.业务背景
2.逻辑框架
3.优化前和优化后的能力差距
4.遇到最大的困难是什么?怎么解决的
是否还有别的优化方式
5.某个流程是否可以进行再优化
6.上线之后的效果反馈
3️⃣通识考察
(1)Transformers 和之前的模型的区别,为什么 Transformers 好?
(2)介绍下 Bert,框架,预训练和后续的微调任务?
(3)为什么 Bert 适合做向量模型,底层原理是什么?
(4)RoBERTa 做了什么优化?
(5)想要大模型输出的内容都为 json 格式,怎么实现?
(6)OOM 问题怎么处理
(7)大模型的参数量是怎么计算出来的?(8)DeepSeek R1 的训练方式,GRPO 的原理是什么?
(9)基于过程的强化学习和基于结果的强化学习的差异是什么?
(10)Agent 的概念是什么?整体流程是怎么样的?
(11)DeepSeek R1 对于 Agent 的能力是否有提升,如何进行运用?
(12)RAG 的整体流程和评估方式?
(13)如何解决 RAG 中信息覆盖率低、幻觉、逻辑计算的问题?
(14)大模型的数据合成应该怎么做?有哪些方式?
(15)DeepSpeed 的三个 stage 分别是什么?有什么作用?
(16)模型并行和数据并行的区别是什么?这两种方式的数据流和梯度是怎么更新的
4️⃣手撕代码
✅算法代码:
手写位置编码
手写多头注意力机制
Leetcode:
零钱兑换
最长递增子序列
打家劫舍
最长公共子序列
跳跃游戏
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。

全部评论

相关推荐

看新闻上说,印度媒体都在密集发申请攻略,咨询量直接涨了30%印度、韩国、新加坡的申请意愿特别突出,感觉要成科技人才的新选择了~我的offer还没有呢!
ysb:哥们就不明白了,自己的人才都留不住,然后找外国,咋滴给外国人才高福利朝九晚五不加班是吗,然后我们大学生996,加班,无offer,摆地摊,送外卖是吗,有点意思,很英明
我的秋招日记
点赞 评论 收藏
分享
09-24 18:30
已编辑
长春工业大学 产品经理
小肥罗:HR就是好人的缩写哈哈哈哈
点赞 评论 收藏
分享
评论
1
16
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务