美团实习大模型算法一面 面麻了

总体时长60min左右,对项目挖的比较深;八股、算法题都相对友好
1.实习介绍
2.项目(论文)介绍
3.项目细节:SFT数据的合成细节、SFT/RL的训练细节,奖励函数
4.项目细节:你们是怎么把text和image进行对齐的,介绍一下alignment的实现
5.项目细节:你们有证明Cold-Start SFT后再5.RL的模型比只RL的模型效果好吗,为什么要做SFT,有什么好处
6.项目细节:为什么不用一些经典的强化学习方法,如DPO、PPO
7.项目细节:用来训练的数据,有没有覆盖各个领域,还是偏向某个垂直领域
8.项目:如果要微调你们这个模型到某些垂直领域,但是要保留多模态的这种通用能力,应该用什么办法来尽量保留模型的能力
9.项目:假如有70%的样本表现非常好,但是剩下30%左右的样本表现不好,那么模型下一步詁芙忖朱代的方向应该是怎样的
10.然后就问我之前的完全不对口的开发实习经历了(笑)
11.八股:解释-下Bert的模型结构和原理
12.如果用Bert做一个分类任务,应该怎么做?
13.八股:讲一下transformer的多头注意力机制原理
全部评论

相关推荐

评论
点赞
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务