阿里nlp算法面经

一面
1.自我介绍
2.SFT的 prompt 模板
3.大模型 SFT 过程中自己有没有什么总结出来的经验
4.应用场景是什么,有什么意义
5.如何看待目前大语言模型都是 decoder - only 结构
6.encoder - only 和 decoder - only 的对比,纯理解场景哪更优
7.描述一下典型的 encoder - only 如 Bert 的结构细节
8.多层堆叠时如何避免梯度消失和梯度爆炸
9.DPO和 PPO
10.代码题:lc75,颜色分类

二面
1.自我介绍
2.介绍大模型实习
3.prompt 优化这部分做了什么工作
4.prompt 优化这部分还了解哪些方法吗
5.如何判断当前使用的 prompt 就是最优的,无法进一步调整了
6.SFT的资源描述,卡数,机器数
7.SFT过程中如何判断是否过拟合
8.如何判断一个模型是否收敛
9.判断收敛需要用验证集吗
10.测试集为什么一定需要存在,亦或者为什么不直接把验证集测试集合在一起
11.主要使用什么语言( Python ),有没有系统学过 C ++
12.pytorch中的计算图
13.反问:进来后可能会做的方向
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
全部评论

相关推荐

渴望wlb的牛油果很...:直说卡第一学历不就行了 非得拐弯抹角
点赞 评论 收藏
分享
评论
点赞
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务