荣耀大模型算法工程师一面
#荣耀校招# 📍面试公司:荣耀
🕐面试时间:25.11.11
💻面试岗位:大模型算法工程师
❓面试问题:
1. 自我介绍
2. 问有没有大模型相关项目,针对这个项目问了很久
3. 感兴趣强化学习,问一个最新论文如何使用强化学习的。我用到了SAC,接着问大模型推理的top k策略选择答案和SAC选择动作的策略的区别(这脑回路)
4. DQN怎么能应用于大模型工具选择
5. 强化学习输出全0和全1怎么解决,训练上的改善方法
6. 大模型微调,lora有什么缺点
7. PPO有什么缺点
8. 反问:大模型平台部,主要搞agent,周末不太加班。
🙌面试感想:两个面试官,都不开摄像头。本来想说的,后来忍住了,下次绝对不忍!都是岗位一线的,提的问题都非常需要创新和批判性思维,其实从这一点上看荣耀氛围还不错。但是有时候不讲现有方法直接问怎么改进,而且有些使用模糊的词汇(比如他说Q-learning,我以为他说的是算法,但其实他想说的是value network)造成很多误解。整体而言强度很大,感觉面试还挺有收获的。
#发面经攒人品#
🕐面试时间:25.11.11
💻面试岗位:大模型算法工程师
❓面试问题:
1. 自我介绍
2. 问有没有大模型相关项目,针对这个项目问了很久
3. 感兴趣强化学习,问一个最新论文如何使用强化学习的。我用到了SAC,接着问大模型推理的top k策略选择答案和SAC选择动作的策略的区别(这脑回路)
4. DQN怎么能应用于大模型工具选择
5. 强化学习输出全0和全1怎么解决,训练上的改善方法
6. 大模型微调,lora有什么缺点
7. PPO有什么缺点
8. 反问:大模型平台部,主要搞agent,周末不太加班。
🙌面试感想:两个面试官,都不开摄像头。本来想说的,后来忍住了,下次绝对不忍!都是岗位一线的,提的问题都非常需要创新和批判性思维,其实从这一点上看荣耀氛围还不错。但是有时候不讲现有方法直接问怎么改进,而且有些使用模糊的词汇(比如他说Q-learning,我以为他说的是算法,但其实他想说的是value network)造成很多误解。整体而言强度很大,感觉面试还挺有收获的。
#发面经攒人品#
全部评论
大佬厉害了
确实荣耀氛围听起来不错啊
相关推荐


查看9道真题和解析