斑马智行大模型二面-日常实习
1.项目和八股
1.双向mamba和直接使用一个因果注意力有什么区别
2.shift具体是怎么实现的
3.针对你的 vllm 推理优化比赛,看过注意力分数吗
4.prefill 阶段和 decoder 阶段
5.你的方法如何降低 prefill 阶段的时间
6.这两个阶段对比而言,哪个阶段更耗时
7.ppo算法的流程
8.grpo 以及变体
2.手撕
最大连续和的子数组(dp)
3.反问
对实习生的期望,业务
1.双向mamba和直接使用一个因果注意力有什么区别
2.shift具体是怎么实现的
3.针对你的 vllm 推理优化比赛,看过注意力分数吗
4.prefill 阶段和 decoder 阶段
5.你的方法如何降低 prefill 阶段的时间
6.这两个阶段对比而言,哪个阶段更耗时
7.ppo算法的流程
8.grpo 以及变体
2.手撕
最大连续和的子数组(dp)
3.反问
对实习生的期望,业务
全部评论
面了这么久还没确定啊 大模型岗感觉好难
相关推荐
查看10道真题和解析 点赞 评论 收藏
分享
点赞 评论 收藏
分享
02-04 16:13
门头沟学院 算法工程师 字节抖音风控部门大模型算法一面1.自我介绍(论文、实习、项目)2.拷打项目(问的很细,占据主要面试时间)3.实习介绍4.讲讲dpo与kto的区别5.grpo的非规则奖励如何设计6.两道medium力扣
查看6道真题和解析 点赞 评论 收藏
分享
