百度多模态大模型暑期算法二面
#开放七大实习专项,百度暑期实习值得冲吗# 已老实,求放过
感觉面完人都通透了,还是太菜了,下去沉淀一下
八股:
1.sft grpo dpo损失函数
2.rope原理,在多模态是怎么样的
3.输入图片和文本后,模型是做了什么处理
4.grpo dapo的原理
5.grpo可以用别的模型采样吗
6.dpo和grpo区别
代码:有m个苹果,n个人排队来买,每个人只能买一个或两个,最终卖光,购买苹果有几种可能。方法很多,可以调库也可以递归,也可以写公式
感觉面完人都通透了,还是太菜了,下去沉淀一下
八股:
1.sft grpo dpo损失函数
2.rope原理,在多模态是怎么样的
3.输入图片和文本后,模型是做了什么处理
4.grpo dapo的原理
5.grpo可以用别的模型采样吗
6.dpo和grpo区别
代码:有m个苹果,n个人排队来买,每个人只能买一个或两个,最终卖光,购买苹果有几种可能。方法很多,可以调库也可以递归,也可以写公式
全部评论
相关推荐
点赞 评论 收藏
分享