26校招华为大模型算法一面
1、介绍自己的中厂实习
2、强化学习中onpolicy和offpolicy的区别什么?grpo是onpolicy的吗?如何实现真正的onpolicy?
3、解释一下为什么GPT可以并行计算,而rnn不能。
4、qwen系列纯文本模型每一代的改进点是什么?
5、在计算attentionscore时如何对padding做mask操作?
6、valuemodel和rewardmodel的区别?
7、moe架构是什么?ds如何平衡每个专家学到的token数量?
8、解释-下ds的MLA和MTPQ
9、prompt工程,你在实践中有什么啲蓿过rick?什么时候给fewshot?什么时候逻辑引导?
10、市面上的大模型分别有什么优势,如何选择合适的大模型?
11、多维旋转位置编码是如何改进的?
12、mcp°和fc是什么,在你的项目中你是如何使用这两个功能的?
13、现场手撕接雨水。
2、强化学习中onpolicy和offpolicy的区别什么?grpo是onpolicy的吗?如何实现真正的onpolicy?
3、解释一下为什么GPT可以并行计算,而rnn不能。
4、qwen系列纯文本模型每一代的改进点是什么?
5、在计算attentionscore时如何对padding做mask操作?
6、valuemodel和rewardmodel的区别?
7、moe架构是什么?ds如何平衡每个专家学到的token数量?
8、解释-下ds的MLA和MTPQ
9、prompt工程,你在实践中有什么啲蓿过rick?什么时候给fewshot?什么时候逻辑引导?
10、市面上的大模型分别有什么优势,如何选择合适的大模型?
11、多维旋转位置编码是如何改进的?
12、mcp°和fc是什么,在你的项目中你是如何使用这两个功能的?
13、现场手撕接雨水。
全部评论
相关推荐
滴滴啵啵耶:大佬大佬 技术面有参考的题库之类的吗 问的范围好广
点赞 评论 收藏
分享
点赞 评论 收藏
分享
查看13道真题和解析 点赞 评论 收藏
分享

美团成长空间 2663人发布