美团大模型算法实习一面
1.项目介绍
2.挨个介绍论文项目,基本上每个都讲了一遍。
3.第一个论文问了,你觉得这个工作后续有没有什么可以改进和拓展的点?这是关于单轮检索的benchmark,我说可以拓展为多轮后续和agent结合在一起。
4.第二个论文的时候问了其中的对比学习的loss,问这个方法可不可以用dpo去做?有没有r的经验?做过哪些实验?mini batch和global batch分别是什么意思?通过什么指标去看grpo训练是否稳定?调参过程中有什么出现的问题嘛?有什么难调的参数?
5.开源项目问了,准备数据的时候如果问题很难模型一个都答不对该怎么做?如果问题很简单,对模型太简单该怎么做?如何得到合理的数据来支撑模型的sft/rl?
6.关于团队:主要偏向业务的模型对齐,验收的指标是在benchmark上测,业务优先,发paper为次但是鼓励做论文。
2.挨个介绍论文项目,基本上每个都讲了一遍。
3.第一个论文问了,你觉得这个工作后续有没有什么可以改进和拓展的点?这是关于单轮检索的benchmark,我说可以拓展为多轮后续和agent结合在一起。
4.第二个论文的时候问了其中的对比学习的loss,问这个方法可不可以用dpo去做?有没有r的经验?做过哪些实验?mini batch和global batch分别是什么意思?通过什么指标去看grpo训练是否稳定?调参过程中有什么出现的问题嘛?有什么难调的参数?
5.开源项目问了,准备数据的时候如果问题很难模型一个都答不对该怎么做?如果问题很简单,对模型太简单该怎么做?如何得到合理的数据来支撑模型的sft/rl?
6.关于团队:主要偏向业务的模型对齐,验收的指标是在benchmark上测,业务优先,发paper为次但是鼓励做论文。
全部评论
相关推荐
昨天 17:46
门头沟学院 前端工程师 点赞 评论 收藏
分享
点赞 评论 收藏
分享
查看7道真题和解析

