斑马智行大模型二面-日常实习
1.项目和八股
1.双向mamba和直接使用一个因果注意力有什么区别
2.shift具体是怎么实现的
3.针对你的 vllm 推理优化比赛,看过注意力分数吗
4.prefill 阶段和 decoder 阶段
5.你的方法如何降低 prefill 阶段的时间
6.这两个阶段对比而言,哪个阶段更耗时
7.ppo算法的流程
8.grpo 以及变体
2.手撕
最大连续和的子数组(dp)
3.反问
对实习生的期望,业务
1.双向mamba和直接使用一个因果注意力有什么区别
2.shift具体是怎么实现的
3.针对你的 vllm 推理优化比赛,看过注意力分数吗
4.prefill 阶段和 decoder 阶段
5.你的方法如何降低 prefill 阶段的时间
6.这两个阶段对比而言,哪个阶段更耗时
7.ppo算法的流程
8.grpo 以及变体
2.手撕
最大连续和的子数组(dp)
3.反问
对实习生的期望,业务
全部评论
请问base哪里呢,还有后续吗
感觉你这问的也太难了吧
面了这么久还没确定啊 大模型岗感觉好难
相关推荐
03-08 16:19
门头沟学院 硬件开发 点赞 评论 收藏
分享
