已拒offer:美团北斗大模型面经

✅第一轮
1、首先用ppt做了自我介绍然后就开始讲解在第一段实习期间做的工作内容,讲的非常非常详细,包括目前多模态对抗攻击的现状是怎么样的(你论文处在什么样的位置),还讲解了我论文的主要创新点是什么,优势是什么
2、同时,还引入到了另外一篇在投的论文,说明了其对于chatgpt攻击的可行性,因此引出了他对攻击整个方法的思考与了解,想要了解对抗攻击都有哪几种分类,哪几种扰动策略,他们分别的难点是什么等等
3、然后我又将其引入了soft prompt中,讲解其在recall presicion的trade off以及内容合规(让模型生成该问题不可回答)等等上面的可行性
4、之后介绍了另一段实习这边在语言大模型和多模态大模型上面的工作内容,介绍多模态大模型的工程经验等等。
5、最后做了一个重排列表的题。
6、然后反问环节,问了他们组的工作内容,他们组目前有两个北斗,两个L8,其中一个入职是L7,然后一年升为L8,公司蛮看重,给你申请资源做。
7、又问了我目前的职业发展规划是怎么样的
✅第二轮
1、首先用ppt做自我介绍,直接转到了实习部分
2、先介绍了第一段实习,问我论文的主要创新点是什么
3、然后介绍了第二段实习,先仔细介绍了第二段实习经历,包括业务情况、5b大模型的各种训练情况、多目标训练情况,并详细的介绍了我的soft prompt
4、之后就是多模态大模型的各种细节
5、最后让我找一篇论文进行讲解,主要创新点什么的
6、最后做了个题:二叉树根节点到叶子结点的所有路径和
✅HR面
问了很多,超级详细
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
全部评论

相关推荐

点赞 评论 收藏
分享
09-10 13:36
已编辑
四平职业大学 机器学习
岗位:大模型基座方向一面:首先就是项目拷打,由于我的简历项目比较垂直,硕士以来的经历与Infra都比较相关,所以面试官大部分时间都在问我的项目+实习的经历,并且拷打并不是很深入,即便很多项目的细节已经不太记得了,但是没有问到,所以也答得都很流畅;然后问我对于TVM以及Triton是否有一些了解,由于这两个都是属于编译相关的Infra,与我在校的经历都比较相关,在做自己课题的时候都关注并学习过,所以答得也很流畅,一面面试官应该是对我还是蛮满意的,所以面试到最后,已经1小时了,才开始做手撕,题目是:用CUDA实现Softmax算子,但是CUDA我只是之前在硕士上课的作业中写过1,2次CUDA代码,其实并不是非常熟悉,然后隔了又比较久,语法已经不怎么记得了,所以和面试官说了情况,面试官说那你就把怎么优化编写这个算子讲一下思路,然后就是讲了一下思路,思考了3分钟左右,回答上来了,面试官说你这有点慢了哈,但是感觉面试官整体还是比较满意的,所以比较轻松的就结束了一面PS:但是这也是我后续二面表现较差的原因之一吧二面:由于一面觉得自己和面试官聊的比较开心,然后就比较懈怠二面吧,尤其那段时间正好是实习最忙的一段时间,所以就没怎么准备面试内容。同样,二面主要是项目拷打,但是不一样的是这轮的面试官挖项目经历很深,问得非常细节,印象很深的是问得实习刚来的时候做的一个工作,由于刚来实习其实对于整个大模型的架构并不是很了解,只是把MoE一种通信方式的多流优化特性迁移到另一种通信方式上,对于其中的计算过程以及具体多流并行的算子印象并不是很深刻,然后面试官一直追问这个问题,而且距离那个工作已经过去快2个月了,当时的理解不深加上时间比较久已经忘记得差不多了,所以导致只能和面试官说自己不记得具体细节了,可能就给面试官留下了不好的印象(尤其还是人才计划)然后就是最后的手撕环节了,这个题目印象比较深,但是很久没刷过题了,而且也确实非常菜,导致没做出来最优解:题目是:有一个k值以及一个有序数组a[n](升/降序都可以),a[i]任意整数,需要求解表达式 | | a[i] | - | k | |的值最小,这个题暴力求解非常简单,属于一眼出答案,我看完题和面试官就讲了暴力遍历数组就可以得到计算结果的方式,然后面试官就问有没有更优的解法,我知道可以通过二分通过O(logN)的复杂度最优解,但是这个区间考虑比较复杂,当时已经被前面的问题搞得没什么心态了,也没有仔细考虑区间的关系,最后就只用一次二分做了这个题,但是实际上需要3次二分,导致二面没有通过,然后后续被通知说一面,二面,面评差距大,所以转正式批了,但是最后转到正式批流程也没有被捞,导致正式批流程也结束了
查看5道真题和解析
点赞 评论 收藏
分享
评论
点赞
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务