字节跳动

收藏
互联网
10000人以上
D轮及以上
北京市
福利丰厚榜高校必争榜offer比较常胜榜HC充足榜校招高薪榜牛客指数榜
查看官网
上传简历
职位类型
全部
后端开发
前端开发
客户端开发
测试
数据
更多
最新
热门
1.可以挑一个最近觉得挑战比较大的项目展开介绍一下吗?2.Agent 内部具体的实现可以再详细介绍一下吗?3.MCP 是把自然语言转成预置查询类的工具吗?4.操作内部平台时,工具会去操作吗?5.系统测试完成后,准确率怎么评估?6.用 20% 数据作为测试集,是模型跑 case 后人工评判准确率吗?7.如何对答案进行轨迹级评分?8.目前系统的准确率是多少?9.项目后续继续优化的话,有哪些优化思路?10.现在系统最核心的问题是并发问题吗?11.准确率还有提升空间吗?12.模型输出不符合预期时,prompt 会有问题吗?会调 prompt 吗?13.有考虑过做 SFT 和强化学习吗?14.目前 RAG 具体的实现是怎么样的?15.如果用 Redis 的缓存,会在哪个阶段去做?16.Redis 为什么在高并发情况下表现得比较好?17.什么场景下会用多线程?18.RAG 作为知识库检索,和把知识库放到 ES 上让模型调用 MCP 接口有什么区别?19.若自己实现包含 ES 检索和向量检索的搜索接口,和 RAG 有什么区别?20.Redis 和 MySQL 在使用场景上有哪些区别?21.B + 树是怎么样的结构?22.B + 树和红黑树的区别是什么?MySQL 用红黑树效率会更好吗?23.1000 万条数据用 B + 树存储,树的高度大概是多少?24.场景题,给定一个实时输入流(随时可能停,无法全量存储),如何等概率选取 5 条记录?手撕:两个有序数组,O(logN)求合并后第k大的数。反问:业务方向。答:主要是头条的一些视频,包括视频的一些生产、消费。也涉及到一些视频的一些 AI 技术和理解。面试官水平很高,节奏掌握得很好。目前已经约三面了。
查看25道真题和解析
点赞 评论 收藏
分享
以下内容都是当时写的了,其实一面已经过了。1.介绍项目1工作2.怎么结合的内部工具?有没有用到mcp?3.Go接触过吗?4.Go和Java之间的区别了解吗?5.多线程接触过吗?项目中用到了吗?6.自己用过多线程吗?7.进程和线程之间的最大区别8.Linux里怎么创建进程?9.熟悉的Linux命令有哪些?10.查看过程序运行的状态吗?11.如果想看哪些服务占用的CPU比较高怎么办?12.MySQL的索引是怎么存储的?13.在更之前MySQL用的是什么引擎?14.哈希和B+树两种索引的区别是什么?15.有没有对索引做过优化?16.什么时候不该创建索引?17.MySQL的事务了解过吗?18.MySQL事务的隔离级别有哪几种?19.假如一个SQL有慢查询,怎么优化?20.打开浏览器输入域名之后的流程21.TCP怎么保证一定传输到22.TCP发包顺序是怎么界定的23.TCP和UDP使用场景上最大的区别?24.为什么要这么多层不同的协议?25.假如让你设计一个和HTTP类似的应用层协议,你觉得需要具备哪些能力?26.HTTP怎么做数据压缩的了解吗?27.明文传输最大的弊端在哪?28.场景题,假设有个计数的需求,要做一个能返回点赞、收藏、评论等数量,并给抖音、头条等不同的平台使用的通用系统,应该怎么设计系统?29.你觉得这个系统需要有哪些接口?30.LeetCode 215题 数组中的第k个最大元素 想到快排了 但太久不写 边界条件处理得一团糟 15min内没写出来 菜得一反问了面试官自己还有哪些地方需要提升,得到的回复是需要对服务端的一些具体的应用以及设计理念再多学习一下。确实自己基础题基本都答上来了,但场景题答得稀烂,加上手撕寄了,目前还在流程里,但应该工作日就会被挂掉。也算是第一次征战宇宙厂了,面试官人还是挺好的,我答不上来的问题会试着引导,也没有压力我,遇到我实在不熟悉的领域会切换话题,体验还是比较舒服的,还是自己实力不够。顺便记一下3.18 wxg后台的一面:开局三道算法,改版的LRU(淘汰n个最久未使用的数据)、改版字典树(输出包含查询字符串前缀的所有字符串)、以及一个机器学习的抽象题:把矩形的周长写成w1 x长 + w2 x宽的形式(实际上w1=w2=2),自己构建若干长、宽、周长的输入组合,最终求出w1、w2的值。一眼看出是类似反向传播的原理,然而java选手根本不会写啥梯度下降、损失函数的东西,只有一点点研0时补机器学习基础的印象,只能说思路。(好吧,后来发现这题考的是最小二乘法,我会集贸)手撕烂了之后,面试官也懒得多说啥了,没开摄像头,随便问了几个项目的问题结束了,回去秒挂,但8分钟后又被秒捞起来(无限复活这块)。在那一周还参加了小红书、PDD和美团的笔试,无一例外地倒下了。算法这块确实只会做签到题和模板题,只能说回去慢慢提升。
点赞 评论 收藏
分享
1.自我介绍2.拷打项目:针对长短期记忆,讲讲你是如何设计记忆的提取、压缩与冲突更新机制的?如果检测到用户存在极端情绪,你的Agent如何在不中断对话流的前提下进行干预?3.讲一下稠密向量与稀疏向量的区别,分别适合处理什么样的搜索需求?4.在向量化之前,为什么要对长文档进行切片?如果不切片会有什么后果?5.切片时设置重叠区域的作用是什么?这个比例你通常怎么来确定?6.余弦相似度和欧氏距离在衡量文本相似性时,各自的优缺点是什么?7.向量库检索出的Top-K结果,如果K值设置得过大,对后续的生成质量有哪些负面影响?8.为什么在初筛召回之后,还要加一个Rerank模型?它能解决向量搜索的哪些局限?9.如果文档发生了局部更新,如何通过增量索引来避免全量重新向量化?10.在RAG的生成阶段,如何在Prompt中设定边界条件来防止模型在没搜到内容时产生幻觉?11.调用大模型API时,为什么要使用asyncio异步编程?它在处理高并发请求时有何优势?12.了解HyDE吗?介绍一下原理,它在处理模糊提问时有哪些优势?13.随着超长上下文模型的出现,你认为传统RAG架构的必要性是否降低了?14.你了解哪些大模型推理框架?SGLang相比vLLM的PagedAttention在推理延迟上有哪些优势?15.手撕:第k大元素20.反问📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
查看16道真题和解析
点赞 评论 收藏
分享
1.自我介绍2.拷打项目:针对长短期记忆,讲讲你是如何设计记忆的提取、压缩与冲突更新机制的?如果检测到用户存在极端情绪,你的Agent如何在不中断对话流的前提下进行干预?3.讲一下稠密向量与稀疏向量的区别,分别适合处理什么样的搜索需求?4.在向量化之前,为什么要对长文档进行切片?如果不切片会有什么后果?5.切片时设置重叠区域的作用是什么?这个比例你通常怎么来确定?6.余弦相似度和欧氏距离在衡量文本相似性时,各自的优缺点是什么?7.向量库检索出的Top-K结果,如果K值设置得过大,对后续的生成质量有哪些负面影响?8.为什么在初筛召回之后,还要加一个Rerank模型?它能解决向量搜索的哪些局限?9.如果文档发生了局部更新,如何通过增量索引来避免全量重新向量化?10.在RAG的生成阶段,如何在Prompt中设定边界条件来防止模型在没搜到内容时产生幻觉?11.调用大模型API时,为什么要使用asyncio异步编程?它在处理高并发请求时有何优势?12.了解HyDE吗?介绍一下原理,它在处理模糊提问时有哪些优势?13.随着超长上下文模型的出现,你认为传统RAG架构的必要性是否降低了?14.你了解哪些大模型推理框架?SGLang相比vLLM的PagedAttention在推理延迟上有哪些优势?15.手撕:第k大元素20.反问📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
查看16道真题和解析
点赞 评论 收藏
分享
昨天 20:18
已编辑
东北大学 Java
查看6道真题和解析
点赞 评论 收藏
分享
04-01 16:11
武汉大学 Java
一面 1h,3.231.介绍短链接项目,存储方案,短链接生成方案、有没有其他生成方案,短链接长度,最多可以有多少短链接2.短链接跳转原理,多级缓存,为什么使用分布式锁,布隆过滤器及其原理,3.服务目前性能,301/302,除了redis还有什么方式提高短链接处理的并发能力4.如何处理短链接过期,短链接更新时间后的数据处理,布隆过滤器怎么处理过期5.除了redis+lua还有哪些方式实现秒杀,如何应对大流量,如何设计秒杀开始和过期开关6.为什么选择redis作为库存工具,和其他的做库存的不同,如何防范恶意ip刷单7.mysql中索引的数据结构,B+树的优势,acid及其实现,4种隔离机制及其实现原理,慢sql优化8.redis为什么这么快,zset底层,redis持久化,缓存数据库一致性(如果数据库延迟导致缓存读取从库过期数据处理)9.acm手撕三数之和二面:50min 3.251.第一个项目的链接系统,这个是做了多长时间,是怎么样的一个项目,有多大的量并发?2.没有上线,那你做的这些技术是基于什么去判断去加这些东西呢?怎么测试的?3.你的redis是部署在哪里的?这个本地缓存为什么能提高性能?4.你不都是都在一台机器上,涉及到网络的问题吗?比如说用redis和用redis加这个caffeine,有这个区别在哪里?5.那你进行压测的时候,你是怎么做这个叫叫消融实验,叫怎么测的?6.布隆过滤器在这里面起到什么作用?它的基本原理是什么?7.你这个双重判定所的目的是啥?不够大的情况下呢8.讲解cache aside,为什么不先更新缓存,数据库成功了,但是删缓存失败了怎么办?9.为什么监控短链接需要rocketmq?10.秒杀项目从哪找来的项目,是从零写的还是怎么着?11.为什么要用滑动窗口限流?你举说的清晰一点的。再举个例子。12.那thread local在这里做的是啥?那这个thread local需要清理吗?怎么清理的?那这个线程本身是复用的吗?13.协程和线程的区别?协程是怎么实现。14.项目是什么时候做的?在这个过程中是怎么学习的?我想了解一下,你比如说你是怎么有没有接触AI工具去学习,然后这里面的代码是借助AI工具来搞的,还是自己没有借助AI工具自己来搞的?15.那这里边自己写了多少代码?我比较好奇的是你这些首先那个项目的起点,你为什么要找到这个项目之后你想做哪些事情?还是这些策略明显是为了应对一些高并发做的,对吧?然后你是怎么假想出来的?还是说你比如说问问AI说我想优化这个系统,应该往哪些方向优化,怎么样?16.你这两个系统各有多少张数据表?这个系统里校园生活网里边有有多少个DB mysql的表,你是怎么怎么设计这个数据表?这些表是你在做这个项目之前自己设计的,还是这项目本身就有?他在本地跑起来了吗?这个系统。17.这个AI应用这块是自己学习过的东西吗?是怎么了解的?自己动手了吗?18.那你为什么要搞后端这块的东西,是感兴趣吗?还是怎么样?专业是网络空间安全是吧?19.学过其他语言?有哪些课程?20.mmap()和malloc(),那他们只是用于分配内存吗?21.那你平时除了你自己学的这两个小项目以外,你平时还自己折腾过什么其他东西吗?22.这两个项目加起来自己写了多大代码量?23.硬币朝上赢,先手扔获胜概率?p=1/2+(1-p)/224.你对语言有什么要求吗?或者有什么热衷的?25.你觉得你自己的优势是在哪块儿?26.假设你的第一个项目,如果你的某个短链突然间变成了热点多量,然后QPS加上暴涨了50倍,暂时是你这么一个系统,你会怎么处理?27.所以你最感兴趣的是后端是吧?28.lc34 在排序数组中查找元素的第一个和最后一个位置29.你平时用什么AI的代码工具?自己的感受?
点赞 评论 收藏
分享
一、开场与个人情况先做一个自我介绍。挑一个印象深刻的项目展开聊一下。站内信触达量从 100 万到 1000 万,对服务和接口有什么挑战?接口 QPS 大概多少?二、微信预约项目深挖微信小程序预约功能的全链路数据流转是什么样子?这个项目大概几个人在做?为什么选择先更新数据库推送状态,再去推送消息,而不是先推送再保存数据?推送过程中服务宕机了会出现什么问题?会不会出现标记了推送但实际没推送的情况?三、Full GC 问题排查Full GC 问题是怎么发现的?修复 SQL 问题后,后续做了哪些预防措施?预防措施有实际落地吗?四、算法题实现旋转有序数组的元素查找(找不到返回 - 1)。五、数据库设计与字段类型设计学生信息表(name、subject、score、age、gender、论文等),说明每个字段的数据类型。为什么 name 选 varchar 不选 char?varchar (25)、char (25),存入长度为 100 的内容能否存下?建立联合索引 (name, age, gender),查询条件age = x and gender = y会不会命中索引?MySQL 索引的底层原理是什么?为什么索引用 B + 树,而不用 B 树、红黑树、跳表?六、MySQL 事务与 ACID了解 MySQL 的 ACID 吗,讲一下。MySQL 通过什么原理、方式保证 ACID?七、计算机网络浏览器输入 URL 到响应,经历了哪些网络过程,每一步大概耗时多久?TCP 为什么是三次握手而不是两次?SYN 队列满了会怎么样?TCP 能保证数据有序吗,是怎么做到的?给微信推送用 HTTP 还是 HTTPS?HTTPS 传输的数据是加密还是解密的?HTTPS 是对称加密吗,为什么用对称密钥而不是更安全的非对称加密?八、Java 并发与虚拟线程CompletableFuture 用的是线程还是进程?了解 Java 的虚拟线程吗?虚拟线程是有栈协程还是无栈协程?九、Redis 相关项目中使用 Redis 的场景有哪些?Redis GEO 怎么实现范围内检索?遇到过缓存穿透吗?怎么解决?十、大模型相关接触过大模型吗?讲一下大模型训练的三个阶段。十一、收尾有没有比较擅长但我没问到的内容?
点赞 评论 收藏
分享
分享我的面试经验
模拟面试
真实面试体验,快速补齐短板
应聘感受
暂无应聘感受
牛客网
牛客网在线编程
牛客网题解
牛客企业服务