美团大模型算法实习一面
1. 项目细节:SFT数据合成、SFT/RL训练细节、奖励函数设计
2. 项目细节:多模态对齐(Text和Image)
3. 项目细节:证明Cold-Start SFT后再RL的模型比只RL效果好
4. 项目细节:为什么不用DPO、PPO等经典强化学习方法?
5. 项目细节:数据覆盖领域及微调保留通用能力的方法
6. 算法题:Leetcode大数加法
7. 八股:BERT模型结构和原理
8. 八股:用BERT做一个分类任务
9. 八股:Transformer的多头注意力机制原理
10. 八股:Decode-only与Encode-only架构区别及设计原因
2. 项目细节:多模态对齐(Text和Image)
3. 项目细节:证明Cold-Start SFT后再RL的模型比只RL效果好
4. 项目细节:为什么不用DPO、PPO等经典强化学习方法?
5. 项目细节:数据覆盖领域及微调保留通用能力的方法
6. 算法题:Leetcode大数加法
7. 八股:BERT模型结构和原理
8. 八股:用BERT做一个分类任务
9. 八股:Transformer的多头注意力机制原理
10. 八股:Decode-only与Encode-only架构区别及设计原因
全部评论
相关推荐
点赞 评论 收藏
分享
不知道怎么取名字_:技术这个东西,太杂了,而且要下功夫的
查看5道真题和解析 点赞 评论 收藏
分享
01-24 22:00
中国地质大学(武汉) 管理咨询 点赞 评论 收藏
分享