蚂蚁AI infra校招一面 有点难度
最近闲下来了整理下之前的面经攒攒人品!
项目拷打,实习拷打
1.MLA为什么比MHA好?
2.权重吸收中间遇到的问题。
3.KVcache的离线计算与非常用kvcache的卸载加载
4.还有什么kvcache优化的相关的tricks
项目拷打,实习拷打
1.MLA为什么比MHA好?
2.权重吸收中间遇到的问题。
3.KVcache的离线计算与非常用kvcache的卸载加载
4.还有什么kvcache优化的相关的tricks
全部评论
相关推荐

深圳虾皮信息科技有限公司公司福利 833人发布