腾讯推荐算法 一面 凉经分享
发一下问题给大家参考,攒攒人品!有面试过同岗的朋友欢迎评论区交流
1. 项目拷打
2. 同品匹配输入大模型的token数平均是多少?
3. 为什么不适用传统的嵌入模型?
4. 为什么不先召回一部分数据再进行同品匹配?
5. 大模型项目中RAG是怎么做的,怎么进行文档划分和召回的?
6. Function call的SFT数据集是怎么构建的?
7. 了解哪些高效微调的方法?详细讲一下原理。
8. MLA的原理是什么,为什么在提高效率的同时保证的效果?
9. Deepseek的MOE和其他的MOE有什么区别?
10. 为什么要进行KV-cache,KV矩阵过大,是怎样影响效率的?
11. Bert模型的训练方式有哪几种?
12. 导师是否同意实习?
代码题:分屏IDE手撕
手撕MHA
字符串最长公共前缀
1. 项目拷打
2. 同品匹配输入大模型的token数平均是多少?
3. 为什么不适用传统的嵌入模型?
4. 为什么不先召回一部分数据再进行同品匹配?
5. 大模型项目中RAG是怎么做的,怎么进行文档划分和召回的?
6. Function call的SFT数据集是怎么构建的?
7. 了解哪些高效微调的方法?详细讲一下原理。
8. MLA的原理是什么,为什么在提高效率的同时保证的效果?
9. Deepseek的MOE和其他的MOE有什么区别?
10. 为什么要进行KV-cache,KV矩阵过大,是怎样影响效率的?
11. Bert模型的训练方式有哪几种?
12. 导师是否同意实习?
代码题:分屏IDE手撕
手撕MHA
字符串最长公共前缀
全部评论
相关推荐
04-09 15:08
门头沟学院 Java 点赞 评论 收藏
分享

查看15道真题和解析