蚂蚁大模型一面

投的是蚂蚁的财富保险事业群吧,做支付宝理财里面相关的一些大模型业务的。
面试官人好温柔,爱了。
1. 自我介绍
2. 问实习项目
基本围绕项目去聊的
涉及到了一些点
项目里某个对齐的标签化你们是用固定的一些标签还是不固定的其他方式?(固定的维度,得到了面试官的认可 hh)
有没有考虑过 DPO?DPO 的正负样本怎么构造的?
你们训练框架用的啥?有没有了解过 deepspeed 的那几个阶段的区别,还有 offload?(不太了解)
lora 用过吗?原理了解过吗?讲一下。有没有注意到 lora 论文里有一个 scale?(没有)有兴趣以后可以看看
你们一般训练前怎么估算资源的?
有没有想过怎么提高训练效率?
有论文吗(无)

感觉问的没有非常多,都是聊项目一些具体内容,八股比较少。也没做题,反正看样子是过了,面试官人也很好。
全部评论
主要还是加强对推理优化相关八股 得多学学
1 回复 分享
发布于 2024-09-02 12:18 北京
约二面了吗?
点赞 回复 分享
发布于 2024-09-25 02:35 上海

相关推荐

05-12 17:00
门头沟学院 Java
king122:你的项目描述至少要分点呀,要实习的话,你的描述可以使用什么技术,实现了什么难点,达成了哪些数字指标,这个数字指标尽量是真实的,这样面试应该会多很多,就这样自己包装一下,包装不好可以找我,我有几个大厂最近做过的实习项目也可以包装一下
点赞 评论 收藏
分享
不愿透露姓名的神秘牛友
06-27 15:07
点赞 评论 收藏
分享
评论
7
19
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务