京东零售NLP秋招算法二面
项目
拷打半小时,基本都问模型和数据
八股
1. RLHF阶段,讲一下DPO数据构成
2. Lora的原理是什么?是对哪些参数做低秩分解?
3. MoE里面专家的数量取决于什么?
4. MoE里面GATE数量取决于什么?
其他
54张扑克牌,红色和黑色各27张,不放回抽取两张,一红一黑的概率是多少?请说出公式
代码
实现一个函数,判断两个二叉树是否相等(对于每个子树,对称和完全一样都是相等)
反问
1. 业务方向,模型有做全流程的训练吗
2. 一共几轮技术面
拷打半小时,基本都问模型和数据
八股
1. RLHF阶段,讲一下DPO数据构成
2. Lora的原理是什么?是对哪些参数做低秩分解?
3. MoE里面专家的数量取决于什么?
4. MoE里面GATE数量取决于什么?
其他
54张扑克牌,红色和黑色各27张,不放回抽取两张,一红一黑的概率是多少?请说出公式
代码
实现一个函数,判断两个二叉树是否相等(对于每个子树,对称和完全一样都是相等)
反问
1. 业务方向,模型有做全流程的训练吗
2. 一共几轮技术面
全部评论
相关推荐
专业嗎喽:硕佬,把学校背景放后面几段,学校背景双非还学院,让人看了就不想往下看。
把实习经历和个人奖项放前面,用数字化简述自己实习的成果和掌握的技能,比如负责项目一次通过率90%,曾4次发现项目潜在问题风险为公司减少损失等等 点赞 评论 收藏
分享
10-31 13:04
南华大学 Java
嵌入式的小白:很多面试,面试前不会去打扰cto的,但一般cto不会在这些小事上刷人,只能说这个cto比较操心,啥重要不重要,紧急不紧急的,估计都会过问,平淡看待吧 点赞 评论 收藏
分享