字节跳动抖音电商多模态大模型面经
1.自我介绍
2.sft阶段用的什么模型,数据来源,如何做数据处理,用的什么框架
3.ppo如何做的详细介绍,包括数据,怎么训练奖励模型,每个模型的损失什么样子的,在几张卡上做的训练
4.dpo训练流程,为什么 ppo 和 dpo 你都用了,有什么区别,有没有做对比试验
5.怎么评估你微调之后模型有提升
6.ppo为什么效果会比 dpo 强,怎么理解多轮 dpo 会有提升
7.项目中创新点外代码中怎么实现的,详细讲讲,消融实验怎么做的
8.clip训练原理
9.深度学习相关知识,讲几种优化器
10.讲 MHA 原理
11.GRPO原理
12.Lora原理, r 大小对模型训练的影响
14.vit训练原理
15.swin transformer 的原理
16.qwen3快思考和慢思考的原理
17.手撕
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
2.sft阶段用的什么模型,数据来源,如何做数据处理,用的什么框架
3.ppo如何做的详细介绍,包括数据,怎么训练奖励模型,每个模型的损失什么样子的,在几张卡上做的训练
4.dpo训练流程,为什么 ppo 和 dpo 你都用了,有什么区别,有没有做对比试验
5.怎么评估你微调之后模型有提升
6.ppo为什么效果会比 dpo 强,怎么理解多轮 dpo 会有提升
7.项目中创新点外代码中怎么实现的,详细讲讲,消融实验怎么做的
8.clip训练原理
9.深度学习相关知识,讲几种优化器
10.讲 MHA 原理
11.GRPO原理
12.Lora原理, r 大小对模型训练的影响
14.vit训练原理
15.swin transformer 的原理
16.qwen3快思考和慢思考的原理
17.手撕
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
全部评论
相关推荐
点赞 评论 收藏
分享
查看5道真题和解析