混元大模型一面
1.开场自我介绍+过实习/论文。
2.了解哪些大模型, Qwen 和 DeepSeek 各自的特点?
3.MoE 跟 Dense 比,收益主要体现在哪?代价又是什么?
4.有没有做过全参微调?没有的话你怎么判断它和值不值得做?
5.如果你要把 LoRA 和全参做对比,你会怎么设计实验、控制变量、看哪些指标?
6.RLHF 解决什么,在对齐里起什么作用? RLHF 这一块会继续深挖:
7.你知道哪些主流的对齐/强化学习做法?
8.代码题:括号生成+手写多头自注意力
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
2.了解哪些大模型, Qwen 和 DeepSeek 各自的特点?
3.MoE 跟 Dense 比,收益主要体现在哪?代价又是什么?
4.有没有做过全参微调?没有的话你怎么判断它和值不值得做?
5.如果你要把 LoRA 和全参做对比,你会怎么设计实验、控制变量、看哪些指标?
6.RLHF 解决什么,在对齐里起什么作用? RLHF 这一块会继续深挖:
7.你知道哪些主流的对齐/强化学习做法?
8.代码题:括号生成+手写多头自注意力
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
全部评论
相关推荐
点赞 评论 收藏
分享
