这周的一些面经

这周一腾讯QQ一面秒挂影响了心情,这周的面经都没写
面经的话尽量回忆一下

联想一面
1. 问了一个比较怪的问题,我没有很理解。就是我项目里面有做RLHF,他就问我的RM怎么训练的,回答给SFT模型加一个线性层输出reward值,然后就问我这个过程需要导什么库?答加载模型需要transformers库,然后问我加那个reward头需要什么库?有点懵,不是很懂他想问什么,加头的做法是参照LlamaforSequntialClassification做的
2. 然后其他的都是一些常规问题,不太记得了,没有做题

腾讯 QQ 一面
1. 主要拷打了一下实习和项目
2. 然后问我如果在QQ想做什么,回答了可能做QQ短视频、小世界的一些推荐(给自己挖坑,推荐只是速成了一下,不是很熟悉)
3. 然后开始问推荐怎么和大模型进行结合?问开放性问题:怎么去给QQ短视频里面的视频做推荐?怎么挖掘这些视频的标签? 只能说自己挖坑自己受苦
4. 手撕出了一个 寻找目标值,之前面试的时候做过,结果这次做的有些小bug,感觉是这个导致了最后挂

字节 广告算法 一面
重量级来了
1. 上来没有问实习,没有问项目直接开始八股轰炸
2. transformer相关经典八股,问了有一个问题我觉得值得说一下,就是问我知不知道序列中每一个token的embedding在经过很多层self attention之后会变得相似的问题以及对应的原因?之前没有思考过,当场思考了一下,意思大概是深层网络往往学到的是序列的全局特征,所以会相似,还有就是每一次做self attention相当于在做平滑。这部分确实还得再想想
3. 开始机器学习相关,手撕一个二分类的全流程,从输入到embedding到分类网络到sigmoid函数到交叉熵loss(中间的具体模型用一个函数代替即可)
4. 手撕上述交叉熵loss的链式求导,就是loss对p求导,p对sigmoid求导(这里需要记住sigmoid的导数等于sigmoid x (1-sigmoid),不然现场推怕是推不了一点)
5. 做一个最长公共子序列,算是常规
6. 改成子串再做一遍。。。。(这个还是想了好久怎么改DP的条件)
只能说不愧是字节,希望二面不要太折磨人😩

中兴 算法工程师(智算)一面
会议室里面进来了四个人😨,离谱
1. 主要还是问实习和项目
2. 其中一个面试官感觉像是套方案,疯狂问我实习部分继续预训练的数据大小、数据配比、数据清洗、训练流程
、训练参数、学习率,感觉是遇到这种面试官还真得牢记项目的全流程,一些环节忘了就有点尬了

智谱AI GLM对齐团队 一面
1. 实习、项目拷打
2. 因为是对齐团队,所以很care我有没有关注目前前沿的RLHF方法(前沿的关注不了一点,只能说了一些感觉有点早的东西)
3. 大概讲了 从优化PPO出发和优化DPO出发的两类对齐方法,优化PPO的比如deepseek的GRPO,优化DPO的比如一堆DPO变体,以及DPO加正则化的方法。中间还让我从强化学习的角度给出优化PPO的方法,我就讲了一下老本行,从PG到REINFORCE到TRPO到PPO,然后表示我也不知道怎么优化PPO,已经是强化学习工业界用的最广泛的了哈哈哈哈哈
4. 手撕了一个transformer的decoder block
5. 记忆里应该还是问了Deepspeed跟Megatron

智源人工智能研究院 行业大模型 一面
1.时长半个小时,主要拷打实习经历,我实习做的也是领域大模型。非常巧的是,面试官也在美团同一个部门实习过,甚至认识我老板,希望不要跟我老板对情况,戳穿我吹牛逼的东西

快手 推荐大模型 二面
1. 记不太清问了些啥了,感觉是实习主要加LLM的一些经典八股(感觉是不超出我目前写过的面经的范围)
2. 手撕了一道最小编辑距离,写的时候有一个地方=写成==了,一直检查不出来,给面试官逗笑了

京东 NLP 二面
1. 主要拷打实习,比较关注数据质量处理,以及模型评估方面,会care具体上线业务没有
2. 一些常规的LLM八股,有一个问题值得说一下。问了一个LLM推理的时候,如何从prompt到response?他想问的意思其实是LLM出来的结果不是prompt+response嘛,然后怎么去把response分出来,还说具体的代码里面会有一些额外操作,不是简单的截取然后decode,让我下去仔细看看
3. 手撕了一个topk,我直接heapq.nlargest,面试官说也行哈哈哈哈哈

中兴 算法工程师(智算)二面
1. 这一面感觉是很HR面的感觉,介绍实习的时候也是比较关注数据的来源、处理、采样方面,然后是聊天,各种查户口面试时间硬是拖到一个小时,本来预约的是半个小时。。

---------------------------
又是忙碌的一周,感觉是腾讯给我秒挂了真的很影响心情,毕竟是最想去的厂了
麻花腾!再给我一次👅的机会吧
#牛客创作赏金赛#
#腾讯# #美团# #百度# #拼多多# #科大讯飞# #联想# #中兴# #作业帮# #快手# #字节# #智谱AI# #京东# #智源#
全部评论
面试流程中的: 1. 京东 NLP 三面(已约) 2. 快手 推荐大模型 三面(已约) 3. 拼多多 算法工程师 三面(已完成,官网状态还是面试中不知道后面还有没有HR面之类的) 4. 科大讯飞 飞星 NLP 二面(已完成,官网状态面试中,但是超过一周没推进了,就当挂了) 5. 中兴 算法工程师(智算)二面(已完成) 6. 字节 广告算法 TAC 二面(已约) 7. 智谱AI GLM对齐团队 二面(已约) 8. 联想 一面(已完成) 9. 智源人工智能实验室 行业大模型 一面(已完成) 10. 同花顺 大模型 一面(已完成,超过一周没有推进,当挂了) 已经挂了的: 1. 腾讯 QQ 一面挂 2. 快手 快star大模型应用 一面挂,大语言模型算法、机器学习 简历挂 3. 作业帮 对话方向 一面挂 4. 米哈游 NLP 简历挂 5. 鹰角网络 做完笔试挂 6. 淘天集团 做完笔试挂 7. 字节 ailab 内推 简历挂 8. Minimax 简历挂 9. TCL 简历挂 10. Insta360 简历挂 11. 滴滴提前批 大模型出行方向 简历挂 12. 通义实验室 boss上问HR被告知最低要求一篇paper 简历挂 还在筛选:很多 阿里系的刚投,还没有面试(测评跟笔试给人做🤮了,每次投一个就得做一遍)
4 回复 分享
发布于 2024-09-07 11:11 陕西
我去😂古希腊掌管面试的神😅
2 回复 分享
发布于 2024-09-07 22:52 陕西
大佬,真海投呀,
2 回复 分享
发布于 2024-09-07 22:52 上海
你这也太牛了
2 回复 分享
发布于 2024-09-07 12:34 北京
优秀!
1 回复 分享
发布于 2024-09-07 14:50 江苏
智源我也是行业大模型,一面是纯做题😂说是加了一个做题筛人的环节,二面才是技术
1 回复 分享
发布于 2024-09-07 12:15 四川
token uniformity
1 回复 分享
发布于 2024-09-07 11:25 北京
序列中每一个token的embedding在经过很多层self attention之后会变得相似的问题以及对应的原因? 这个问题得怎么解释呢?之前好像没看到对应的说法。
点赞 回复 分享
发布于 2024-09-09 21:24 福建
佬,你快手是kstar嘛?是哪个部门的呀,跟你说啥时候出结果了嘛,
点赞 回复 分享
发布于 2024-09-09 11:17 北京
大佬,手撕是使用本地ide吗?一些库函数感觉没代码补全,一时想不起咋写。😂
点赞 回复 分享
发布于 2024-09-07 22:44 安徽
大佬太强了
点赞 回复 分享
发布于 2024-09-07 20:43 安徽
膜拜佬
点赞 回复 分享
发布于 2024-09-07 14:01 北京

相关推荐

4.14投递,4.30被捞,打电话约面1. 自我介绍2. Java的JDK跟JVM是什么关系3. 基本数据类型long有几个字节4. Java里的Integer和int类型相比有什么优点5. List比如ArrayList后面跟的泛型,能用基本数据类型int吗?6. Java里的抽象类是什么? 抽象类是为了解决什么问题产生的?7. 抽象类跟接口有什么区别?能不能完全用接口取代抽象类?什么情况下不能用接口取代抽象类?8. Java的泛型是什么?泛型解决了什么问题?9. 反射是什么?你在平时的学习或者简历里的两个项目里用过反射吗?11. 刚才你说了ArrayList,还用过什么集合吗?12. ArrayList的底层的数据结构13. 往ArrayList中间插入一个元素,时间复杂度是多少?n是什么含义?14. LinkedList的底层数据结构,它的插入和查找时间复杂度分别是多少?这里的1代表什么含义?15. 用过Map吗?介绍一下HashMap的底层实现16. 你项目里用的Java是哪个版本?Java17版本的HashMap插入一个元素的时间复杂度,以及查找的时间复杂度17. 刚才说的ArrayList、LinkedList、HashMap这些集合是线程安全的吗?18. 什么叫线程安全?19. 怎么理解脏数据?20. 如果要把ArrayList变成线程安全的,可以怎么做?(答了加锁,但是扯到乐观锁了,后面就狠狠拷打ArrayList怎么加乐观锁)21. 什么叫乐观锁?22. 以ArrayList举例,CAS的Compare是比较的什么和什么?23. 读取这个值的动作本身有锁吗?24. 如果比较之后两个值不等呢?25. 这种实现方式在ArrayList的任意操作下都满足线程安全的要求吗?26. 比如现在想往数组末尾追加一个元素,在这种实现下应该怎么实现?27. Java的GC有了解吗?以你项目里用的Java17版本为例,它的主要GC算法是什么?28. GC怎么知道某一个对象应该被回收?29. 你的两个项目都是后端服务跑在服务器上,会跟前端有交互,前后端交互是用的什么协议?(不知道)30. 前端怎么找到对应的后端服务?比如用户有你的前端页面,怎么才能访问到你的后端服务?(应该是DNS,但是我想着我的项目都在本地跑的没有域名啊啊,就把DNS,ARP,TCP,HTTP,TLS全吟唱了一遍)31. SSE是建立在TCP之上的,TCP本身也是流式传输,也有长连接,为什么还要用SSE而不是直接用TCP?(完全忘了)32. MySQL的索引分类33. B+树的叶子节点和非叶子节点分别存的是什么?34. 如果建了100个索引,这100个索引都在同一棵B+树上吗?35. 索引本身有什么用途?索引的结构是什么36. 没有索引,数据库能不能用?37. MySQL的事务是什么?38. 事务的原子性是怎么实现的?39. 比如我在同一个事务里插两条数据,第二条插入失败了,怎么通过undo log去保证原子性?40. 如果在执行回滚操作的时候断电了,重新启动MySQL进程后,去查这个记录能查到什么?41. MySQL的隔离级别是什么?42. 可重复读是什么含义?43. Redis在你的第二个项目里存的是什么?用的是什么数据结构?key和value分别是什么?44. 通过key查找String类型的数据,时间复杂度是多少(以为是二分答了logn,,,)45. Redis你还用过其他的数据结构吗?46. 你用的是哪个MQ?为什么使用MQ?手撕:lc437二叉树路径总和反问:1.部门干啥的:对接上游,发布广告2.后续流程:不清楚还好录音了,不然都不知道自己错的那么离谱八股就是背了忘忘了背,什么时候才是个头啊
点赞 评论 收藏
分享
评论
50
141
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务