字节信息中台 NLP 一二面面经

四月中旬之后就没有再投简历,但是到了 5 月反而又有不少被鸽的岗位陆陆续续捞我面试。甚至现在还有不少岗位还在招人,毕竟很多公司尤其是阿里系都是普遍 7 月才去实习的。
5 月拒了个钉钉 offer,夸克反复捞起来面了五次还给我挂了。。百度二面在比较中,字节约了三面,快手一面挂了,其他的都懒得面了。
感触比较深的是我把这两个月的实习经历写上去后,面试明显顺利很多,所以如果有同学面试没那么顺利,也可以选一个先去,积累一些业务相关的经验还是很有必要的。
大概总结一下字节的面试内容,留作日后复习。
1. 自我介绍都有
2. 项目介绍(基本都是针对最近的实习内容)
3. 你认为在上下文越来越长的情况下,Rag 还有必要吗?(和实习相关,有必要,因为目前虽然上下文长,但是对上下文的注意力并不均衡,仍然有很多信息无法被正常利用到,prompt 长度太长影响精度)
4. 那你了解现在都怎么提高上下文长度吗?(相对位置编码介绍一些, 还有一些其他的训练数据之类的)
5. 介绍一下 transformer 结构,它的位置编码是怎么样的?
6. self attention 的 K 和 Q 是干什么用的?(逻辑上来说就是用 Key 和 Query 做配对, 相当于检索,然后计算注意力分数,其实就是检索的配对情况)
7. 那如果让 K 和 Q 变成同一个矩阵,你觉得对模型性能影响大吗?(我认为主要是参数量变小了,会有一些影响,如果参数量不变,影响应该不太大? 面试官说:应该是会断崖下降的,就像你刚刚说的是做配对,没有 KQ 配对注意力计算会变差,不只是参数量的问题)
8. 了解 RLHF 吗?奖励模型的训练任务是什么?(不了解 RLHF 没接触过。。。)
9. 为什么现在都是 only decoder 结构?
10. 模型的预训练了解吗?
还有一些和实习相关的问题,不太记得了, 集中在数据生产和 rag 策略的一些内容。
代码题(两面 4 道)
1. 三数之和离 target 最近的结果
2. 一个双指针滑动窗口的 mid 题 忘记了
3. 二分法实现 sqrt 精度 0.0001
4. 判断字符串是否是旋转得到的(就是字符串尾部整体移动到头部,判断两个字符串是不是可以自动得到)
字节整体还是重代码题,八股难度中规中矩,很久没准备了也不算难,这种应用部门也很看实际的项目
全部评论
佬,三面的算法题问了什么呀
点赞 回复 分享
发布于 02-21 17:27 北京
大胆夸克敢挂我pku✌🏻
点赞 回复 分享
发布于 2024-08-27 14:40 河南

相关推荐

距离第一次面试刚刚好过去一个月,总算是oc了,后面也不打算再找了,所以简单做个总结bg双九科班简历牛客论坛+黑马点评,有个挑战杯大模型相关比赛决赛一等奖 无实习经历,LeetCode除hot100之外有额外刷一些,大概200左右,八股一般,主要背了redis相关大概4月初开始投,虽然bg让我有不少面试机会,但大多都是一面挂,只有阿里智能信息顺利oc,鹅的复活赛进了一次二面。总结失败经验:没有实习经验、项目烂大街加上最开始确实没有完全吃透,基本一深入问就g以下记录一下时间线:美团 4.23 一面挂阿里国际 4.29 一面挂腾讯 5.8 一面挂阿里云 5.9 一面挂腾讯复活赛一番战 5.13 一面 5.20二面挂淘天 5.14 一面挂(阿里妈妈的压迫感太强了)腾讯音乐 5.14 一面挂阿里智能信息 5.15一面 5.20二面 5.23HR面 HR面后三小时oc其实还投了不少,饿了么笔试没后续,蚂蚁笔试没后续,OPPO笔试挂,虾皮笔试挂,阿里控股、京东还在池子里,很早就投的顺丰发了个面试时间意向邮件后无后续以下是面经:美团、阿里国际、阿里智能信息已单独发腾讯一面:讲讲session和cookie,了不了解单点登录csrf攻击布隆过滤器讲讲cas讲讲redis里的数据结构,跳表有了解吗热帖排行功能展开讲讲讲讲你项目里的分布式锁acid、隔离级别,mysql默认是哪个级别,为什么ioc和aop手撕:连续子数组的最大和其实这次面试体验还挺好,就是单点登录问题面试官前面暗示了很多次,最后直截了当问了,但我这块当时确实没准备到淘天一面:除了maven还有什么管理第三方包;如何处理maven依赖冲突AC自动机了解吗布隆过滤器threadlocal,如何跨线程传递值mysql的锁了解吗,什么情况下会产生死锁商品数量多时如何考虑分库分表redisson自动续锁怎么解决死锁问题get和post的区别;为什么get中带url是不安全的循环依赖是什么,spring中如何解决,适用于什么情况ioc、aop讲讲为什么要做这两个项目csrf手撕快排,讲原理被拷打最狠的一集,阿里妈妈不愧是阿里妈妈,是我完全高攀不起了腾讯复活赛一番战一面:static的作用final和finally的区别==和equals的区别为什么有了equals还需要hashcode为什么重写 equals() 时必须重写 hashCode() 方法?ioc和aopredis有哪些部署架构讲讲redisson对分布式锁的优化,什么情况下只使用单体redis手撕:删除有序链表中的重复值都是很基础的八股
点赞 评论 收藏
分享
bg 双9 简历牛客论坛+黑马点评 挑战杯大模型相关比赛决赛一等奖一面(5.15 55min)自我介绍挑战杯相关选一个你觉得更有挑战性的项目介绍一下redis有哪些数据结构,跳表了解吗,介绍一下还有什么我没问到但你觉得值得讲一讲的点吗(吟唱了分布式锁)手撕:搜索旋转排序数组(二分查找变种)、无重复字符的最长子串反问二面(5.20 50min)自我介绍挑战杯相关现在有一批数据需要去重,同时相似度高的也需要一并删去,怎么考虑(我只大概说了自己的思路是把相似的转成相同的再通过一些去重算法完成)布隆过滤器是怎么用的,还有没有其他的类似的实现手撕:查找有序数组中某个值第一次出现下标、删除数组中连续的k个相同值(最后有个细节卡了蛮久,面试官一句话提示了一下才过)反问HR面(5.23 30min)自我介绍从你的项目、竞赛里挑一个展开讲讲在做项目过程中有遇到什么样的困难,怎么解决的你的竞赛经历里有没有产生团队协作相关的问题,怎么解决的base地意向职业规划上面有提到没有打算考公,HR接着提问现在可能很多父母都希望孩子能够考公考编,工作稳定,你对这个问题怎么看,如何跟父母沟通还有没有其他正在进行的流程你会怎么选,为什么整个流程都很快,其实我5.8晚上才投的简历(感谢朋友提醒我阿里系还有这个能投),过了一个周末就约了笔试和一面,HR面后三小时就发了意向。总结成功经验,70%在于挑战杯的这个奖,20%在于手撕基本没大问题,10%才是准备的一些八股和项目,感觉是不可复制的一次流程。
阿里巴巴开奖92人在聊 查看15道真题和解析
点赞 评论 收藏
分享
评论
15
51
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务