美甲大模型实习面经(一面)
🔞 美甲
🧑🔧 语音算法实习
😶🌫️ 项目提问+八股
1. 自我介绍
2. 介绍一下简历上的大模型项目;讲一讲如何做数据清理的;角色知识增强是怎么做的;推理阶段有无优化;有没有最新的改进。
3. 介绍一下现在的研究方向以及论文。(主要听听思路,由于我说借鉴了RLHF的思路,借机问了一下RLHF的技术框架)
4. LoRA的原理;RLHF的细节(要求更细致的介绍,这里问了一个我不是很理解的问题,除了reward model和llm,还用到了什么模型?之后查了一下确实就这两个啊)
5. 手撕MHA(pytorch);GQA的原理。
6. 输入的padding部分是如何参与计算的;为什么用left padding而不是right padding。
7. 让大模型确保输出json格式有什么办法?
8. 介绍一下softmax的数值溢出,以及有什么办法解决。
反问:主要业务是什么;实习时间的要求。
感觉比之前面试状态要好很多,回答还是比较流畅。同时,这次发现了一些之前没复习到的地方,回去一定补。
🧑🔧 语音算法实习
😶🌫️ 项目提问+八股
1. 自我介绍
2. 介绍一下简历上的大模型项目;讲一讲如何做数据清理的;角色知识增强是怎么做的;推理阶段有无优化;有没有最新的改进。
3. 介绍一下现在的研究方向以及论文。(主要听听思路,由于我说借鉴了RLHF的思路,借机问了一下RLHF的技术框架)
4. LoRA的原理;RLHF的细节(要求更细致的介绍,这里问了一个我不是很理解的问题,除了reward model和llm,还用到了什么模型?之后查了一下确实就这两个啊)
5. 手撕MHA(pytorch);GQA的原理。
6. 输入的padding部分是如何参与计算的;为什么用left padding而不是right padding。
7. 让大模型确保输出json格式有什么办法?
8. 介绍一下softmax的数值溢出,以及有什么办法解决。
反问:主要业务是什么;实习时间的要求。
感觉比之前面试状态要好很多,回答还是比较流畅。同时,这次发现了一些之前没复习到的地方,回去一定补。
全部评论
破案了,原来是critic model
感谢校友分享 请问您有背八股文吗
美甲是哪个企业呀😂
相关推荐
点赞 评论 收藏
分享
02-05 13:16
南京邮电大学 Java 等闲_:其实agent开发和语言没关系,只要能稳定落地可观测,有业务价值的agent就是好agent,而各种语言的agentkit是企业基建必要的,是一些maas平台的agent模块的重要组成,需要提供零代码的能力让M端的同***营agent,所以不要过于纠结这些,真正要看的是模型工程化这整条链路,能做什么,怎么做更方便
点赞 评论 收藏
分享
点赞 评论 收藏
分享