百度多模态大模型暑期算法二面

#开放七大实习专项,百度暑期实习值得冲吗# 已老实,求放过
感觉面完人都通透了,还是太菜了,下去沉淀一下
八股:
1.sft grpo dpo损失函数
2.rope原理,在多模态是怎么样的
3.输入图片和文本后,模型是做了什么处理
4.grpo dapo的原理
5.grpo可以用别的模型采样吗
6.dpo和grpo区别
代码:有m个苹果,n个人排队来买,每个人只能买一个或两个,最终卖光,购买苹果有几种可能。方法很多,可以调库也可以递归,也可以写公式
全部评论

相关推荐

点赞 评论 收藏
分享
评论
点赞
2
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务