字节大模型算法实习二面 攒人品
攒攒人品!有面试过同岗的朋友欢迎评论区交流
1.项目介绍
2.训练样本大概多少条
3.用户反馈怎么做的
4.MOE激活的分布,怎么确定是MOE的效果而不是单纯ffn参数量增大的效果
5.MOE稀疏激活相关问题
6.beamsearch多少条
7.有考虑用别的强化学习的方法吗
8.dpo的公式是什么
9.grpo了解吗
10.kvcache怎么做的,了解大模型中别的提高效率的办法吗
11.知道MTP吗
12.手撕transformer并计算flops和内存开销
1.项目介绍
2.训练样本大概多少条
3.用户反馈怎么做的
4.MOE激活的分布,怎么确定是MOE的效果而不是单纯ffn参数量增大的效果
5.MOE稀疏激活相关问题
6.beamsearch多少条
7.有考虑用别的强化学习的方法吗
8.dpo的公式是什么
9.grpo了解吗
10.kvcache怎么做的,了解大模型中别的提高效率的办法吗
11.知道MTP吗
12.手撕transformer并计算flops和内存开销
全部评论
哪个部门呀
相关推荐
点赞 评论 收藏
分享
点赞 评论 收藏
分享

查看12道真题和解析