字节财经 三面 手撕居然出了hard

面试公司:字节跳动
面试岗位:后台开发
面试问题:
1. 自我介绍

2. 挑个项目讲讲,又祭出了祖传的RAG(主要怕说java玩具项目对方没兴趣,后来发现我想多了,三面的面试官至少也是架构师级别,啥项目在人家眼里都是玩具

3. 具体是怎么做的?整个RAG链路是什么?

4. 向量化怎么做的?为什么能把文本映射成向量?底层原理是什么?

5. 用的什么向量数据库?(答Milvus)追问:Milvus和常规的关系型数据库有什么区别?为什么用Milvus?

6. 为什么不用Elasticsearch?(太偏向于文本匹配,对语义的感知能力不够)

7. 你在项目中遇到的最大的挑战?技术难点?(说了关键词增强的多路召回,面试官很失望,说我觉得这也不是啥技术难点啊,汗流浃背了

8. 来做一道题吧(此时距离面试开始才过去22分钟,但是题目出来的一瞬间我就知道为啥这么早就开始做题了

题目:删除无效的括号(hard)

早就听闻这道题很复杂,好在之前在利特蔻德上喵过一眼,于是直接献出了我的自创方法:预检索+剪枝回溯+后处理+后验证(后来发现这个思路其实和官解方法三大体差不多2333)

还是先说大致思路,然后写代码。不得不说是真的复杂,前前后后大概写了100行左右,自己测了一下没啥问题,最后对着代码和面试官讲了具体思路。整个过程大概40分钟。

反问:
对实习生的要求?具体看重的方面?(回答技术基础+对新事物的求索心)

总结:三战字节,每次面试官的风格都不一样。但是也存在一些共性:比如主要围绕着项目拷打(如果有实习的话应该也会猛猛问实习),常规八股较少(就一面问了两三个),以及非常重视对算法题的考察,而且难度都是mid起步,很少出easy

许愿OC

#软件开发笔面经#

-----------
更新:当天晚上hr来电话,说正在走offer审批,加了微信
全部评论
手撕hard已经过了
14 回复 分享
发布于 03-06 17:08 上海
!这个手撕是我上次二面挂掉的
5 回复 分享
发布于 03-06 21:29 北京
我的吗,100行我都不敢想象
3 回复 分享
发布于 03-07 10:40 上海
一面hard就给我挂了
2 回复 分享
发布于 03-07 17:16 上海
太牛了,速通字节
2 回复 分享
发布于 03-06 22:24 陕西
给南大✌🏻👻了
1 回复 分享
发布于 03-07 18:32 广东
我也是三面遇到了这个题
1 回复 分享
发布于 03-07 16:18 新加坡
神中神!
1 回复 分享
发布于 03-07 14:09 湖北
大佬好强,我hr说还在内部审批,是不是还没有offer呀
点赞 回复 分享
发布于 03-06 22:16 北京
第一次面试就是字节,一面刚开始就开始手撕,上来就是hard给我整懵了
1 回复 分享
发布于 03-06 21:21 安徽
太强了
1 回复 分享
发布于 03-06 19:36 广东
姐姐,我是你妹妹艾莉,请你把offer转让给我,不然我要用俄语怼你了
1 回复 分享
发布于 03-06 18:46 北京
稳的,鼠鼠还在碰壁(哭
1 回复 分享
发布于 03-06 18:11 江苏
许愿OC
1 回复 分享
发布于 03-06 17:31 广东
佬好强祝oc
1 回复 分享
发布于 03-06 16:19 辽宁
太🐮了
1 回复 分享
发布于 03-06 16:13 北京
架构师级别牛逼
点赞 回复 分享
发布于 04-15 23:32 陕西
实习会怎么拷打呢
点赞 回复 分享
发布于 04-13 20:58 河南
mark删除括号hard
点赞 回复 分享
发布于 04-07 09:33 浙江
👍👍
点赞 回复 分享
发布于 04-01 23:53 陕西

相关推荐

RAG 是啥?RAG,全称 Retrieval-Augmented Generation,意思是 “ 检索增强生成 ” 。以前的 AI 模型知识有限,还可能答错或者答得不靠谱,而且企业用起来也不安全。RAG 就是来解决这些问题的!它能让 AI 在回答前先去 “ 图书馆 ” (知识库)搜资料,再给出答案。RAG 怎么干活?RAG 的工作流程简单来说就是三步走:你问我答:用户问问题,比如 “ 今天吃什么好?”,RAG 系统接收到了。翻书找答案:RAG 的 “ 小助手 ” 会飞快地在知识库里找相关资料,比如美食推荐、营养搭配之类的。整合输出:把找到的资料和问题混合在一起,扔进大模型里加工,生成一个超棒的答案,比如 “ 今天你可以试试清蒸鲈鱼,肉嫩味美,还很营养哦!”。RAG 的核心组件RAG 主要有两个核心组件:检索器(Retriever):就像在图书馆里负责找书的管理员,能在知识库里快速定位到相关资料。生成器(Generator):拿到资料后,它就像个作家,把资料和问题结合,生成最终的回答。RAG 跟其他技术比有啥厉害之处?对比直接用大模型 API 或者微调,RAG 有这些牛 X 的地方:知识更新快:知识库能实时更新,AI 就能立马掌握新知识,不用重新训练,省时省力。省钱省心:不用大规模重新训练模型,成本大大降低。不会忘事儿:不会像微调那样,在没训练过的任务上表现不好,稳稳地保留了模型的通用能力。不过呢,RAG 也有点小缺点,比如在特别需要深度理解和风格模仿的问题上,可能就没微调那么厉害。RAG 的关键环节和挑战文档切分(Chunking):把文档切成合适的大小,就像切蛋糕一样,得找到那个完美的大小,不然可能影响检索效率。Embedding 模型选择:选对模型就像给汽车选发动机,直接决定向量表示的质量,影响后续的检索和生成效果。检索效果评估:得时刻监控检索的召回率和精确率,就像给检索系统做定期体检,有问题及时调整。向量数据库的作用:它是高效存储和检索向量表示的中流砥柱,就像给知识库装上了超级导航,能快速定位到相关信息。整体效果评估:要时不时对 RAG 系统来个全方位体检,从生成答案的准确性、相关性等方面打分,确保系统一直在线。
点赞 评论 收藏
分享
评论
103
155
分享

创作者周榜

更多
牛客网
牛客企业服务