蚂蚁金服校招算法二面55min
1、简单介绍中厂实习经历。
2、模型蒸馏的数据如何做的?如何清洗蒸馏得到的数据?
3、有没有使用强化学习做过数据仿真。这个之前看过一篇论文,刚好讲了一下。
4、有没有了解过训练推理一致性这个领域?我讲了一下强化学习领域的推训一致性,固定 flash attention 分块策略, vllm 推理框架固定 page attention 分块策略。
5、模型量化如何做的。 gptq , qat 等等,并说明为什么选择了w8a16的量化?
6、写一下 ppo 算法的损失函数和 GAE 优势函数。主要还是讲明白
7、 grpo 算法中 kl 散度和之前的方法有什么区别?在 dapo 中为何舍弃了 kl 散度?
8、模型蒸馏主要的两种方式。硬标签和软标签。
9、介绍一下 kmeans 算法,如何设置合适的 k 值。如果在一个非常大的数据量中,如何实时增量更新,并动态管理 k 值。
10、一个场景题
11、手撕题hot100,中等题,合并 k 个升序链表。
2、模型蒸馏的数据如何做的?如何清洗蒸馏得到的数据?
3、有没有使用强化学习做过数据仿真。这个之前看过一篇论文,刚好讲了一下。
4、有没有了解过训练推理一致性这个领域?我讲了一下强化学习领域的推训一致性,固定 flash attention 分块策略, vllm 推理框架固定 page attention 分块策略。
5、模型量化如何做的。 gptq , qat 等等,并说明为什么选择了w8a16的量化?
6、写一下 ppo 算法的损失函数和 GAE 优势函数。主要还是讲明白
7、 grpo 算法中 kl 散度和之前的方法有什么区别?在 dapo 中为何舍弃了 kl 散度?
8、模型蒸馏主要的两种方式。硬标签和软标签。
9、介绍一下 kmeans 算法,如何设置合适的 k 值。如果在一个非常大的数据量中,如何实时增量更新,并动态管理 k 值。
10、一个场景题
11、手撕题hot100,中等题,合并 k 个升序链表。
全部评论
相关推荐
点赞 评论 收藏
分享
12-11 11:46
南京信息工程大学 Java 点赞 评论 收藏
分享
破防了的哈里很讲原则:咱们两的情况差不太多,我是大一寒假开始学的java,大二下的时候技术栈也学得差不多了,按道理讲应该去找实习了,但我害怕面试,害怕在面试官前出糗,所以不断得麻痹自己,告诉自己八股还没背熟,项目还没理解,所以投不了。然后又染上了酸角洲,沉迷其中,直到最近才开始投。 点赞 评论 收藏
分享

小天才公司福利 1287人发布