26校招小红书大模型算法二面
1.八股:大模型框架了解哪些,介绍下vllm原理
2.八股:常用的LLM,讲解DeepSeek R1的训练流程和基本原理。
3.八股:讲讲MOE架构和Dense架构差异,在训练和推理方面
4.项目:介绍实习项目,项目中有没有做微调?
5.项目:DPO,PPO和GRPO的区别
6.项目:为什么PPO要用value baseline和GAE?它们如何让训练更稳定?
7.项目:为什么GRPO在训练MOE时会出问题?原因是啥,怎么改进策略
8.项目:GRPO的KL散度是什么?KL散度中超参数如何设计?
9.项目:阐述大模型的幻觉现象及抑制方法。
10.代码题:lc300 最长递增子序列
2.八股:常用的LLM,讲解DeepSeek R1的训练流程和基本原理。
3.八股:讲讲MOE架构和Dense架构差异,在训练和推理方面
4.项目:介绍实习项目,项目中有没有做微调?
5.项目:DPO,PPO和GRPO的区别
6.项目:为什么PPO要用value baseline和GAE?它们如何让训练更稳定?
7.项目:为什么GRPO在训练MOE时会出问题?原因是啥,怎么改进策略
8.项目:GRPO的KL散度是什么?KL散度中超参数如何设计?
9.项目:阐述大模型的幻觉现象及抑制方法。
10.代码题:lc300 最长递增子序列
全部评论
好难啊
看来背八股还是有必要的
相关推荐
点赞 评论 收藏
分享
2025-12-07 15:41
门头沟学院 前端工程师 程序员花海:实习和校招简历正确格式应该是教育背景+实习+项目经历+个人评价 其中项目经历注意要体现业务 实习经历里面的业务更是要自圆其说 简历模板尽可能保持干净整洁 不要太花哨的
点赞 评论 收藏
分享
点赞 评论 收藏
分享