字节大模型算法实习二面 攒人品

攒攒人品!有面试过同岗的朋友欢迎评论区交流
1.项目介绍
2.训练样本大概多少条
3.用户反馈怎么做的
4.MOE激活的分布,怎么确定是MOE的效果而不是单纯ffn参数量增大的效果
5.MOE稀疏激活相关问题
6.beamsearch多少条
7.有考虑用别的强化学习的方法吗
8.dpo的公式是什么
9.grpo了解吗
10.kvcache怎么做的,了解大模型中别的提高效率的办法吗
11.知道MTP吗

12.手撕transformer并计算flops和内存开销
全部评论
哪个部门呀
点赞 回复 分享
发布于 今天 16:53 广东

相关推荐

评论
点赞
3
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务