NLP算法面经8
10.9 快手 NLP/LLM (2+0/2+1)
项目为主,每次基本也就3-5个八股,有重叠的
1. 实习/项目 问到底
2. Bert的架构介绍,Ernie架构
3. RAG的完整工作流
4. PPO和DPO的差别?
5. Deepspeed介绍下,主要问zero3阶段
6. LSTM和GRU的优缺点
7. MQA、GQA、MHA的不同和优点
8. Pre-LN和Post-LN的差别和优势
9. LLama2比LLama1的修改在哪些地方,数据量除外?
10. RAG对比SFT有何优势?
11. 大模型的词表有哪些?具体有什么不同?
12. 忘记了开放题
13. 代码题:旋转矩阵和皇后变体
14. 你对于该岗位的看法?
15. 未来职业规划?
#大模型# #面经# #互联网大厂# nlp #算法# 实习 #校招# #秋招#
项目为主,每次基本也就3-5个八股,有重叠的
1. 实习/项目 问到底
2. Bert的架构介绍,Ernie架构
3. RAG的完整工作流
4. PPO和DPO的差别?
5. Deepspeed介绍下,主要问zero3阶段
6. LSTM和GRU的优缺点
7. MQA、GQA、MHA的不同和优点
8. Pre-LN和Post-LN的差别和优势
9. LLama2比LLama1的修改在哪些地方,数据量除外?
10. RAG对比SFT有何优势?
11. 大模型的词表有哪些?具体有什么不同?
12. 忘记了开放题
13. 代码题:旋转矩阵和皇后变体
14. 你对于该岗位的看法?
15. 未来职业规划?
#大模型# #面经# #互联网大厂# nlp #算法# 实习 #校招# #秋招#
全部评论

您好,想问一下是两轮技术面吗?
相关推荐
06-26 18:27
上海交通大学 硬件开发 MMMJC:可以投来练面试水平,尤其是如果你暑期没怎么练过的话,以免正式批一开始因为缺乏经验白白错失机会,正式批一开始那一批是比较好进的,如果错失了很亏
点赞 评论 收藏
分享