字节财经 三面 手撕居然出了hard

面试公司:字节跳动
面试岗位:后台开发
面试问题:
1. 自我介绍

2. 挑个项目讲讲,又祭出了祖传的RAG(主要怕说java玩具项目对方没兴趣,后来发现我想多了,三面的面试官至少也是架构师级别,啥项目在人家眼里都是玩具

3. 具体是怎么做的?整个RAG链路是什么?

4. 向量化怎么做的?为什么能把文本映射成向量?底层原理是什么?

5. 用的什么向量数据库?(答Milvus)追问:Milvus和常规的关系型数据库有什么区别?为什么用Milvus?

6. 为什么不用Elasticsearch?(太偏向于文本匹配,对语义的感知能力不够)

7. 你在项目中遇到的最大的挑战?技术难点?(说了关键词增强的多路召回,面试官很失望,说我觉得这也不是啥技术难点啊,汗流浃背了

8. 来做一道题吧(此时距离面试开始才过去22分钟,但是题目出来的一瞬间我就知道为啥这么早就开始做题了

题目:删除无效的括号(hard)

早就听闻这道题很复杂,好在之前在利特蔻德上喵过一眼,于是直接献出了我的自创方法:预检索+剪枝回溯+后处理+后验证(后来发现这个思路其实和官解方法三大体差不多2333)

还是先说大致思路,然后写代码。不得不说是真的复杂,前前后后大概写了100行左右,自己测了一下没啥问题,最后对着代码和面试官讲了具体思路。整个过程大概40分钟。

反问:
对实习生的要求?具体看重的方面?(回答技术基础+对新事物的求索心)

总结:三战字节,每次面试官的风格都不一样。但是也存在一些共性:比如主要围绕着项目拷打(如果有实习的话应该也会猛猛问实习),常规八股较少(就一面问了两三个),以及非常重视对算法题的考察,而且难度都是mid起步,很少出easy

许愿OC

#软件开发笔面经#

-----------
更新:当天晚上hr来电话,说正在走offer审批,加了微信
全部评论
手撕hard已经过了
16 回复 分享
发布于 2025-03-06 17:08 上海
!这个手撕是我上次二面挂掉的
6 回复 分享
发布于 2025-03-06 21:29 北京
我的吗,100行我都不敢想象
4 回复 分享
发布于 2025-03-07 10:40 上海
一面hard就给我挂了
2 回复 分享
发布于 2025-03-07 17:16 上海
太牛了,速通字节
2 回复 分享
发布于 2025-03-06 22:24 陕西
给南大✌🏻👻了
1 回复 分享
发布于 2025-03-07 18:32 广东
我也是三面遇到了这个题
1 回复 分享
发布于 2025-03-07 16:18 新加坡
神中神!
1 回复 分享
发布于 2025-03-07 14:09 湖北
大佬好强,我hr说还在内部审批,是不是还没有offer呀
点赞 回复 分享
发布于 2025-03-06 22:16 北京
第一次面试就是字节,一面刚开始就开始手撕,上来就是hard给我整懵了
1 回复 分享
发布于 2025-03-06 21:21 安徽
太强了
1 回复 分享
发布于 2025-03-06 19:36 广东
姐姐,我是你妹妹艾莉,请你把offer转让给我,不然我要用俄语怼你了
1 回复 分享
发布于 2025-03-06 18:46 北京
稳的,鼠鼠还在碰壁(哭
1 回复 分享
发布于 2025-03-06 18:11 江苏
许愿OC
1 回复 分享
发布于 2025-03-06 17:31 广东
佬好强祝oc
1 回复 分享
发布于 2025-03-06 16:19 辽宁
太🐮了
1 回复 分享
发布于 2025-03-06 16:13 北京
Milvus选型理由再细化
点赞 回复 分享
发布于 01-08 02:15 江西
uu什么时候打电话给你的,我今天面完,面评写了还没消息
点赞 回复 分享
发布于 2025-12-30 19:25 广东
架构师级别牛逼
点赞 回复 分享
发布于 2025-04-15 23:32 陕西
实习会怎么拷打呢
点赞 回复 分享
发布于 2025-04-13 20:58 河南

相关推荐

04-04 16:49
门头沟学院 Java
已挂 1.自我介绍2找一个大模型项目,技术选型,技术框架等介绍下3.bge向量化模型,看过其他模型吗,对比了吗回答的不好,没准备4.向量数据库milvus里面的ANN算法5.它和传统的算法的时间复杂度是怎么样的6.rag的切分策略是什么答得递归切分,三层策略7.LLM的提示词怎么设计的答得结合业务场景,意图识别,角色限定,模型选择,query改写,8.编写提示词有哪些经验,有参考的示例吗架构师,全站工程师,测试工程师,必须,禁止等关键词9.LLM怎么跟rag结合起来的,只听到意图识别检索测和生成侧都有10.查询结果通过精排,LLM结合输出,可以简单的这样理解吗11问答的过程,记忆是怎么实现的12.短期记忆的话涉及到多轮对话,怎么进行压缩,或者说有什么其他策略吗答得近期保留,远处的对话摘要,保持知道这样一个对话13.自我介绍的时候的时候,有做过模型的训练,基于哪个预训练模型YOLOV8,V1114.数据集是什么类型的数据集,准确度能达到多少,指标15.平常用哪些语言,mysql慢查询优化,索引优化策略16.mysql主键索引一定是连续的吗17.默认的情况设定的自增吗,连续吗18.三个线程同时写msqyl数据,第一个比如主键ID为1,第二个主键ID为2,同时向一个唯一索引的写数据,1写成功了,二失败了回滚;此时第三个线程往里面插数据,这个时候第三个线程的主键ID是三还是二呢不会19.kafka消息是怎么存储的,存储的组织结构,topic下面有很多持久化文件或者说现在输入一个id,kafka根据id怎么找到持久化的一个内容20java用的哪个版本,默认垃圾回收器是什么,G1是怎么做垃圾回收的吗可以详细讲下垃圾回收算法吗21项目里面redis除了做记忆存储还有哪些作用list set做存储,bitmap做文件上传标记22redis里面是单机,还是主从还是集群呢23.redis怎么保证高可用的不会24.集群或者是主从一个机器宕机的话,怎么故障回复的;或者说主从切换怎么做的之前有了解吗25.选主策略呢,哪个从节点优选为主节点反问ai业务,业务进度清明节前会更新吗,然后秒挂跨境电商,相关的策略相关的,推荐相关的,在做探索kafka redis高可用知识不系统,后面再看看
查看27道真题和解析
点赞 评论 收藏
分享
攒人品!!! 大家都要拿到暑期实习的offer啊!!!项目一:1. 你这里的意图判断是怎么做的?直接交给模型做,还是这个用户的查询query做了一些其他处理。2. 为什么要设计这三层记忆架构,是一个通用的设计还是参考了什么论文。3. Agent 的评估是怎么做的4. 有没有评估过你的记忆架构,在没参考openclaw之前和之后的指标有什么变化,成功率有对比吗?5. 你之前向量检索加redis缓存是怎么做的? redis健和值是什么?6. 新的记忆加到文件里 是直接append吗? 覆盖?还是改写?7. 改的方式 模型改吗?模型调用editor去改文件是吗?8. 你觉得 redis+milvus向量存储 和mysql+文件系统+向量检索,他们的优劣如何?优点缺点分别是什么。9. 其实我比较感兴趣的是他们这两种方式的查询检索召回 效率的对比。10. 对于每一个用户,在系统中怎么保存这些不同用户的文档?11. 其实就是模型通过路径去读这些文件是吧,那如果两个人登了同一个账号,在同一时刻,这个文件会被两个不同的用户使用,在这个情况下,你们的系统如何处理?怎么解决这个问题?项目二:1. 你说你的文档准确率达到90%,具体做的改变是什么。2. 那为什么医院的问答项目里,不采用同样的实现3. 你说pdf表格密集,那假如用户就是问一个表格里,第二行是2025年,第三行是2024年,具体问2025年的值是多少,你的系统能做到吗?4. skill是自己写的吗 ,互相之间可以联动吗?5. 为什么不用skill-creator6. 你的数据集是怎么收集的,然后是怎么评估的呢?打分是谁在打分?人在打分 ,还是模型裁判员去打分?如果有很好用的模型裁判员,为什么不用裁判员模型7. 介绍一下KV cache8. 讲一下transfromer架构。算法题1. 字符串数字相减2. 字符串最长连续序列
查看21道真题和解析
点赞 评论 收藏
分享
评论
110
197
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务