蚂蚁智能化应用开发二面面经
1、自我介绍
2、聊了一下工作地点,职业规划
3、简单问了下实习
4、是否有系统性地学习过机器学习或深度学习课程?大模型相关的算法背景和理论知识是如何构建的?
5、具体说明你在大模型领域学习了哪些内容,以及是如何学习的
6、讲一下你对强化学习的了解
7、除了RLHF,是否了解强化学习中的其他具体算法(Q-learning、策略梯度等)
8、这些强化学习算法与大模型中的强化学习是什么关系?
9、了解PPO算法吗?
10、谈谈对目前主流大模型的认识以及底层架构
11、DeepSeek在哪些方面做了改进使其训练成本显著降低?
12、GRPO算法了解吗?
13、微调、预训练和强化学习三者在训练目标、数据构造、训练算法和优化思路上的区别与联系?
14、你的项目中,微调要解决的具体问题是什么?
15、微调具体使用的是哪些模型,选择时是如何考虑的
16、你的训练集规模多大?是否是全人工生成的?能否展示一条具体的训练样本
17、如何评估和保证微调后模型输出的代码的正确性?评测指标和具体方法是什么?
18、你提到正确率微调后提升了很多,在这个过程中具体做了哪些调优工作
19、Agent项目是基于什么平台或框架实现的
20、反问
2、聊了一下工作地点,职业规划
3、简单问了下实习
4、是否有系统性地学习过机器学习或深度学习课程?大模型相关的算法背景和理论知识是如何构建的?
5、具体说明你在大模型领域学习了哪些内容,以及是如何学习的
6、讲一下你对强化学习的了解
7、除了RLHF,是否了解强化学习中的其他具体算法(Q-learning、策略梯度等)
8、这些强化学习算法与大模型中的强化学习是什么关系?
9、了解PPO算法吗?
10、谈谈对目前主流大模型的认识以及底层架构
11、DeepSeek在哪些方面做了改进使其训练成本显著降低?
12、GRPO算法了解吗?
13、微调、预训练和强化学习三者在训练目标、数据构造、训练算法和优化思路上的区别与联系?
14、你的项目中,微调要解决的具体问题是什么?
15、微调具体使用的是哪些模型,选择时是如何考虑的
16、你的训练集规模多大?是否是全人工生成的?能否展示一条具体的训练样本
17、如何评估和保证微调后模型输出的代码的正确性?评测指标和具体方法是什么?
18、你提到正确率微调后提升了很多,在这个过程中具体做了哪些调优工作
19、Agent项目是基于什么平台或框架实现的
20、反问
全部评论
这是开发?这不是算法
相关推荐
点赞 评论 收藏
分享

点赞 评论 收藏
分享