26校招华为大模型算法一面

1、介绍自己的中厂实习
2、强化学习中onpolicy和offpolicy的区别什么?grpo是onpolicy的吗?如何实现真正的onpolicy?
3、解释一下为什么GPT可以并行计算,而rnn不能。
4、qwen系列纯文本模型每一代的改进点是什么?
5、在计算attentionscore时如何对padding做mask操作?
6、valuemodel和rewardmodel的区别?
7、moe架构是什么?ds如何平衡每个专家学到的token数量?
8、解释-下ds的MLA和MTPQ
9、prompt工程,你在实践中有什么啲蓿过rick?什么时候给fewshot?什么时候逻辑引导?
10、市面上的大模型分别有什么优势,如何选择合适的大模型?
11、多维旋转位置编码是如何改进的?
12、mcp°和fc是什么,在你的项目中你是如何使用这两个功能的?
13、现场手撕接雨水。
全部评论

相关推荐

点赞 评论 收藏
分享
12-05 18:09
已编辑
广东药科大学 后端工程师
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务