字节跳动

收藏
互联网
10000人以上
D轮及以上
北京市
福利丰厚榜高校必争榜offer比较常胜榜HC充足榜校招高薪榜牛客指数榜
查看官网
上传简历
职位类型
全部
后端开发
前端开发
客户端开发
测试
数据
更多
最新
热门
1.自我介绍2.拷打项目:针对长短期记忆,讲讲你是如何设计记忆的提取、压缩与冲突更新机制的?如果检测到用户存在极端情绪,你的Agent如何在不中断对话流的前提下进行干预?3.讲一下稠密向量与稀疏向量的区别,分别适合处理什么样的搜索需求?4.在向量化之前,为什么要对长文档进行切片?如果不切片会有什么后果?5.切片时设置重叠区域的作用是什么?这个比例你通常怎么来确定?6.余弦相似度和欧氏距离在衡量文本相似性时,各自的优缺点是什么?7.向量库检索出的Top-K结果,如果K值设置得过大,对后续的生成质量有哪些负面影响?8.为什么在初筛召回之后,还要加一个Rerank模型?它能解决向量搜索的哪些局限?9.如果文档发生了局部更新,如何通过增量索引来避免全量重新向量化?10.在RAG的生成阶段,如何在Prompt中设定边界条件来防止模型在没搜到内容时产生幻觉?11.调用大模型API时,为什么要使用asyncio异步编程?它在处理高并发请求时有何优势?12.了解HyDE吗?介绍一下原理,它在处理模糊提问时有哪些优势?13.随着超长上下文模型的出现,你认为传统RAG架构的必要性是否降低了?14.你了解哪些大模型推理框架?SGLang相比vLLM的PagedAttention在推理延迟上有哪些优势?15.手撕:第k大元素20.反问📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
查看16道真题和解析
点赞 评论 收藏
分享
1.自我介绍2.拷打项目:针对长短期记忆,讲讲你是如何设计记忆的提取、压缩与冲突更新机制的?如果检测到用户存在极端情绪,你的Agent如何在不中断对话流的前提下进行干预?3.讲一下稠密向量与稀疏向量的区别,分别适合处理什么样的搜索需求?4.在向量化之前,为什么要对长文档进行切片?如果不切片会有什么后果?5.切片时设置重叠区域的作用是什么?这个比例你通常怎么来确定?6.余弦相似度和欧氏距离在衡量文本相似性时,各自的优缺点是什么?7.向量库检索出的Top-K结果,如果K值设置得过大,对后续的生成质量有哪些负面影响?8.为什么在初筛召回之后,还要加一个Rerank模型?它能解决向量搜索的哪些局限?9.如果文档发生了局部更新,如何通过增量索引来避免全量重新向量化?10.在RAG的生成阶段,如何在Prompt中设定边界条件来防止模型在没搜到内容时产生幻觉?11.调用大模型API时,为什么要使用asyncio异步编程?它在处理高并发请求时有何优势?12.了解HyDE吗?介绍一下原理,它在处理模糊提问时有哪些优势?13.随着超长上下文模型的出现,你认为传统RAG架构的必要性是否降低了?14.你了解哪些大模型推理框架?SGLang相比vLLM的PagedAttention在推理延迟上有哪些优势?15.手撕:第k大元素20.反问📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
查看16道真题和解析
点赞 评论 收藏
分享
昨天 16:11
武汉大学 Java
一面 1h,3.231.介绍短链接项目,存储方案,短链接生成方案、有没有其他生成方案,短链接长度,最多可以有多少短链接2.短链接跳转原理,多级缓存,为什么使用分布式锁,布隆过滤器及其原理,3.服务目前性能,301/302,除了redis还有什么方式提高短链接处理的并发能力4.如何处理短链接过期,短链接更新时间后的数据处理,布隆过滤器怎么处理过期5.除了redis+lua还有哪些方式实现秒杀,如何应对大流量,如何设计秒杀开始和过期开关6.为什么选择redis作为库存工具,和其他的做库存的不同,如何防范恶意ip刷单7.mysql中索引的数据结构,B+树的优势,acid及其实现,4种隔离机制及其实现原理,慢sql优化8.redis为什么这么快,zset底层,redis持久化,缓存数据库一致性(如果数据库延迟导致缓存读取从库过期数据处理)9.acm手撕三数之和二面:50min 3.251.第一个项目的链接系统,这个是做了多长时间,是怎么样的一个项目,有多大的量并发?2.没有上线,那你做的这些技术是基于什么去判断去加这些东西呢?怎么测试的?3.你的redis是部署在哪里的?这个本地缓存为什么能提高性能?4.你不都是都在一台机器上,涉及到网络的问题吗?比如说用redis和用redis加这个caffeine,有这个区别在哪里?5.那你进行压测的时候,你是怎么做这个叫叫消融实验,叫怎么测的?6.布隆过滤器在这里面起到什么作用?它的基本原理是什么?7.你这个双重判定所的目的是啥?不够大的情况下呢8.讲解cache aside,为什么不先更新缓存,数据库成功了,但是删缓存失败了怎么办?9.为什么监控短链接需要rocketmq?10.秒杀项目从哪找来的项目,是从零写的还是怎么着?11.为什么要用滑动窗口限流?你举说的清晰一点的。再举个例子。12.那thread local在这里做的是啥?那这个thread local需要清理吗?怎么清理的?那这个线程本身是复用的吗?13.协程和线程的区别?协程是怎么实现。14.项目是什么时候做的?在这个过程中是怎么学习的?我想了解一下,你比如说你是怎么有没有接触AI工具去学习,然后这里面的代码是借助AI工具来搞的,还是自己没有借助AI工具自己来搞的?15.那这里边自己写了多少代码?我比较好奇的是你这些首先那个项目的起点,你为什么要找到这个项目之后你想做哪些事情?还是这些策略明显是为了应对一些高并发做的,对吧?然后你是怎么假想出来的?还是说你比如说问问AI说我想优化这个系统,应该往哪些方向优化,怎么样?16.你这两个系统各有多少张数据表?这个系统里校园生活网里边有有多少个DB mysql的表,你是怎么怎么设计这个数据表?这些表是你在做这个项目之前自己设计的,还是这项目本身就有?他在本地跑起来了吗?这个系统。17.这个AI应用这块是自己学习过的东西吗?是怎么了解的?自己动手了吗?18.那你为什么要搞后端这块的东西,是感兴趣吗?还是怎么样?专业是网络空间安全是吧?19.学过其他语言?有哪些课程?20.mmap()和malloc(),那他们只是用于分配内存吗?21.那你平时除了你自己学的这两个小项目以外,你平时还自己折腾过什么其他东西吗?22.这两个项目加起来自己写了多大代码量?23.硬币朝上赢,先手扔获胜概率?p=1/2+(1-p)/224.你对语言有什么要求吗?或者有什么热衷的?25.你觉得你自己的优势是在哪块儿?26.假设你的第一个项目,如果你的某个短链突然间变成了热点多量,然后QPS加上暴涨了50倍,暂时是你这么一个系统,你会怎么处理?27.所以你最感兴趣的是后端是吧?28.lc34 在排序数组中查找元素的第一个和最后一个位置29.你平时用什么AI的代码工具?自己的感受?
点赞 评论 收藏
分享
一、开场与个人情况先做一个自我介绍。挑一个印象深刻的项目展开聊一下。站内信触达量从 100 万到 1000 万,对服务和接口有什么挑战?接口 QPS 大概多少?二、微信预约项目深挖微信小程序预约功能的全链路数据流转是什么样子?这个项目大概几个人在做?为什么选择先更新数据库推送状态,再去推送消息,而不是先推送再保存数据?推送过程中服务宕机了会出现什么问题?会不会出现标记了推送但实际没推送的情况?三、Full GC 问题排查Full GC 问题是怎么发现的?修复 SQL 问题后,后续做了哪些预防措施?预防措施有实际落地吗?四、算法题实现旋转有序数组的元素查找(找不到返回 - 1)。五、数据库设计与字段类型设计学生信息表(name、subject、score、age、gender、论文等),说明每个字段的数据类型。为什么 name 选 varchar 不选 char?varchar (25)、char (25),存入长度为 100 的内容能否存下?建立联合索引 (name, age, gender),查询条件age = x and gender = y会不会命中索引?MySQL 索引的底层原理是什么?为什么索引用 B + 树,而不用 B 树、红黑树、跳表?六、MySQL 事务与 ACID了解 MySQL 的 ACID 吗,讲一下。MySQL 通过什么原理、方式保证 ACID?七、计算机网络浏览器输入 URL 到响应,经历了哪些网络过程,每一步大概耗时多久?TCP 为什么是三次握手而不是两次?SYN 队列满了会怎么样?TCP 能保证数据有序吗,是怎么做到的?给微信推送用 HTTP 还是 HTTPS?HTTPS 传输的数据是加密还是解密的?HTTPS 是对称加密吗,为什么用对称密钥而不是更安全的非对称加密?八、Java 并发与虚拟线程CompletableFuture 用的是线程还是进程?了解 Java 的虚拟线程吗?虚拟线程是有栈协程还是无栈协程?九、Redis 相关项目中使用 Redis 的场景有哪些?Redis GEO 怎么实现范围内检索?遇到过缓存穿透吗?怎么解决?十、大模型相关接触过大模型吗?讲一下大模型训练的三个阶段。十一、收尾有没有比较擅长但我没问到的内容?
点赞 评论 收藏
分享
一面 - 自我介绍- 大模型和传统机器学习 / 深度学习有什么区别?- Agent 里的工具调用是怎么实现的?- 用 LangChain / Agent 框架时,一般要配哪些东西?- ReAct 是怎么用的?- ReAct 有什么缺点?- ReAct 的成功率怎么看?- 你用 ReAct 做过什么任务?- Plan-Exec 要解决什么问题?- 调 prompt 有什么规范?- 你调 prompt 遇到过什么 case?- 最近看过哪些前沿框架 / 记忆架构?- 你在记忆上有什么实践?- Skill 和上下文管理是什么关系?- 现场编码:链表分组反转 / 区间反转- 协程和线程区别是什么?- 协程中断和线程中断的区别?- Go 的 GC 做过什么优化?- GC 暂停时间一般多少?看过指标吗?- 数据库索引为什么用 B+ 树?- 堆的底层存储结构是什么?- channel 里有锁吗?实现看过吗?- 有缓冲 channel 用在什么场景?- 什么场景会出现 goroutine 泄漏?- 什么场景会用协程池 / worker pool?二面忘记录音了- 自我介绍- 项目拷打- 对redis的理解- 排序算法- 索引- 手撕 LC 33三面- 实习拷打- 手撕 LC 301三面后第二天OC
点赞 评论 收藏
分享
部门:国际化广告crm与交易平台记不全了,大概回忆下一面(3/26)总体上不是难,面试官人很好,在我回答后都会给一些他的看法实习相关提问,这一块面试官更多的是倾听,然后给我设计的东西说了一些他的看法和建议用消息队列,redis做什么kafka的幂等性如何实现,如果说消息已经写入了,消费者如何确保只消费一次(我按照如何确保消息只执行一次说的)讲一下数组和链表有什么区别如何判断一个链表有没有环,将思路就行,两种方法mysql事务的acid,具体都是干什么的还有一些可能忘记了手撕:用rand10实现rand7合并两个排序好的链表用递归可以吗合并k个有序链表手撕全撕,比较简单反问环节:对我有什么建议,面试官给了我很积极正向的评价业务介绍的也很详细面试完一小时约二面-----------------------------------------------------------------------------------------------------------------二面(3/30)面试官全程比较严肃讲一下实习,挑一段自认为做的最好的经历讲一下(问了没多久,就10分钟左右吧,可能面试官不是很感兴趣)了解哪些数据结构讲一下红黑树和b+树你知道mysql用的什么数据结构吗?为什么不用b树事务acid(不知道二面面试官为什么又问一下这个问题)我在讲acid的时候,说一致性时,提到了一个转账的场景,正好碰到了部门的业务,让我细说了一下主要就是一个场景题如何设计一个给账户充值或扣款的接口,考虑的详细一些这个内容我提到了幂等性的设计,后续针对这个场景题的提问都是幂等性相关的有用过ai coding吗,在什么场景使用,使用应该注意什么算法:判断一个链表有没有环(一方面是很简单,还有一方面是这不是一面考过了吗)反问:有什么建议,建议我实习的过程中可以不光了解自己做的东西,还要了解下整个团队做了哪些东西(可能是觉得我实习做的东西比较片面)部门业务:这个介绍的和一面面试官介绍的不太一样,提到了需要做一些数据分析咱们团队如何看待ai coding:目前各个公司,国内外都处在一个探索的阶段,ai coding一方面并没有那么智能,还有一方面就是没有一个使用的规范,可能每个人都有自己的使用习惯,这个可能还需要再探索探索。ai coding未必能让一个程序员干的事情更少,但是需要程序员掌握更多东西,但是ai的发展又很快二面的面试官没有什么反馈,基本上就是我说什么就听什么-----------------------------------------------------------------------------------------------------------------面完第二天问hr,说没通过,问什么原因,说是匹配度问题(这个团队用的是java,在字节比较少见,还有就是二面面试官提到了数据分析,可能是因为这两块吧)去年9月面字节面的非常糟糕,面评都脏完了,这两次面试应该算是洗回来了,又约到了这周四的面试,加油最后引用一句曹丞相的话"胜败乃兵家常事,此战我军虽失利,然北方仍由我所据,几十万兵马尚存,待重整旗鼓,来日再战必胜。"来日再战必胜!
查看16道真题和解析
点赞 评论 收藏
分享
分享我的面试经验
模拟面试
真实面试体验,快速补齐短板
应聘感受
暂无应聘感受
牛客网
牛客网在线编程
牛客网题解
牛客企业服务