字节跳动

收藏
互联网
10000人以上
D轮及以上
北京市
福利丰厚榜高校必争榜offer比较常胜榜HC充足榜校招高薪榜牛客指数榜
查看官网
上传简历
职位类型
全部
后端开发
前端开发
客户端开发
测试
数据
更多
最新
热门
> 无意中接到了后端开发的主动邀约,我最近主要在准备前端开发,而且没有正式的做过后端开发,但还是接收了面试。面试主要考察计算机基础,没问后端八股,所以居然基本上答出来了自我介绍研二在读,主要技术栈是前端开发(熟悉Vue / 入门React),跨平台开发(了解Electron / 入门Flutter),和 Agent 开发(了解),常用语言 TypeScript / Python。之前都在准备前端面试,意外得到了后端面试邀约,因为未来有走全栈 / Agent开发的计划,所以斗胆参加了。问答1. 介绍 TCP 协议的连接和断开过程,为什么断开要进行 4 次挥手2. TCP 协议在完成四次挥手后是直接断开吗,要等待多久才断开3. 介绍计算机网络七层协议,为什么要分层4. 进程间通信有哪些方式5. 介绍死锁代码题1. 有 $n+1$ 个数,它们在范围 $[1, n]$,仅有一个重复的数,在 $O(n)$ 时间复杂度,$O(1)$ 空间复杂度内找出这个数2. 股票买卖时机,给定一支股票(T+1交易规则)的 $n$ 天的价格序列,买卖两次(卖出当天不能再买入),求最大盈利3. 给定序列,求最长上升子序列的长度和对应的子序列反问1. 部门的技术栈答:Golang2. 我之前主要准备的是前端开发,但是在 AI 时代对前端的未来比较悲观,未来准备走全栈开发或 Agent 开发。我比较纠结是接受前端开发的转正实习,还是准备全栈和 Agent 项目,未来找正式工作直接投递。您能从过来人的角度给我一些建议吗?答:(没有正面回答)主要是要确保掌握好相关理论基础,大厂对基础比较看重,工作中可能用到
查看10道真题和解析
点赞 评论 收藏
分享
昨天 17:00
门头沟学院 Java
深入拷打项目,答出来8成左右。感觉面试官已经想放水了,奈何楼主太菜,代码题没完全撕出来,继续沉淀1. 为什么选择 Spring AI 框架?2. Spring AI 框架的主要优势是什么?3. 如何设计多模型支持架构?4. 多租户环境下模型切换是否支持热更新?切换是否相互独立?5. Agent 的记忆、工具调用、知识库检索等关键组件是如何实现的?6. 系统中的 Agent 包含哪些具体状态?7. 后端 Agent 是否支持多租户同时调用?8. Session 和 User ID 是如何绑定的?9. Agent 工具调用的完整业务流程是怎样的?10. 长期记忆和短期记忆在设计上有什么区别?本质上有什么区别?11. SSE 在前后端是如何交互的?12. 后端以什么数据格式推送流式信息?13. Agent 发生“工具调用”时,SSE 推送的事件结构中通常包含哪些字段?14. MCP的交互流程是怎样的?15. Agent 如何与 MCP Server 连接通信?16. RAG 的主要模式和主要工作流程是怎样的?17. Agent 一般在什么阶段去查询向量知识库?通过什么方式去查询?18. 查询知识库的工具函数,其标准输入和输出是什么?19. Go 语言的 GMP 调度模型是怎样的?20. GMP 模型中的 Machine (M) 代表什么?21. Processor (P) 上的本地队列长度通常是多少?22. 系统如何实现图像识别等多模态功能?23. 为什么不直接使用多模态大模型?24. 在没有前端界面的情况下,本地图片是如何传到后端并进行识别的?25. 对其他主流 AI 框架(如 LangChain)有了解吗?26. 你最熟悉的主力编程语言是什么?27. 手撕 :两两交换链表中的节点
查看27道真题和解析
点赞 评论 收藏
分享
昨天 15:17
已编辑
北京航空航天大学 Java
🎯 面试题:大模型热更新与流量调度平台【整理真题+解析+押题预测】公司:字节跳动年份:2026月份:1月面试轮次:三面岗位:AI平台研发工程师难度:⭐⭐⭐⭐⭐真题:“假设字节的推荐系统需要从ERNIE 3.0模型灰度升级到ERNIE 4.0。设计一个支持大模型热更新的流量调度平台。要求实现:1)可实时调整新旧模型的流量比例(如90%流量走V3,10%走V4);2)平滑无损切换,不能因更新导致服务中断;3)支持基于用户ID、设备ID等维度的精细化分流。给出架构设计、核心代码,并说明如何保证数据一致性(比如同一个用户的请求必须路由到同一个模型版本)。”💡 解析:这是典型的三面架构题,直接考察你设计复杂系统的能力。核心是流量治理和状态管理,将业务需求(模型迭代)转化为稳定、可控的技术方案。设计思路: 分层架构: 配置中心:存储流量配比规则(如 {“v3”: 0.9, “v4”: 0.1}),支持动态推送。 流量路由器:部署在网关或SDK中,根据规则和请求特征(用户ID哈希)决定流量走向。 模型服务池:新旧模型作为独立服务部署,对外暴露统一接口,但版本号不同。 数据收集器:实时收集各版本模型的性能指标(成功率、延迟),用于后续决策。 关键实现: 一致性哈希:确保同一用户(通过userId计算哈希)的请求在流量比例不变时,始终命中同一模型,保证体验连贯。 动态配置监听:使用ZooKeeper、Nacos或Apollo(字节内部常用),实现秒级规则生效。 无损切换:先扩容新模型服务,再调大流量,最后缩容旧服务。过程中监控核心指标,异常则快速回滚。应用业务场景: 这就是抖音推荐算法模型升级的标准流程。每天都有模型迭代,不可能停机发布。必须通过灰度平台,先让小部分用户体验新模型,监控CTR(点击率)、停留时长等业务指标,效果达标再全量,效果不好则回退。核心考点: 微服务流量治理架构设计 一致性哈希算法原理与实践 配置中心与动态推送机制 高可用发布(金丝雀发布/灰度发布)策略 监控与快速回滚能力实践(避坑指南): 流量“倾斜”:简单的随机分流可能导致小流量模型得不到有效样本。需确保分流均匀,且覆盖各类用户群体。 状态缓存:如果模型升级涉及特征存储格式变化,需注意缓存兼容性与清理策略。 回滚预案:必须自动化。当新模型故障率超过阈值,能自动将流量切回旧模型。🚨 趋势押题预测预测名称:多模型混排与智能流量调配系统押题题目:“设计一个多模型在线混排系统。一个请求可同时被多个模型(如ERNIE 4.0、ERNIE 3.5、低成本小模型)处理,系统需根据实时性能(延迟、成本)、业务指标(点击率)以及用户标签,智能决策最终返回哪个模型的结果,并动态调整各模型的调用比例。阐述架构与核心算法。”押题依据:频率雷达:在三面/终面中,“模型发布”与“流量策略”是关联性极强的组合考点,年出现22次。是考察架构师全局视野的经典题。趋势风向:字节内部已不满足于简单的A/B测试,追求更细粒度、更动态、更经济的模型调度。利用小模型承接简单请求以节约成本,是明确的技术方向。信息来源:参考字节跳动机器学习平台决策、部分业务线分享的“多模型择优”技术方案。押题逻辑理由:从“静态灰度”升级到“动态智能调度”,是技术演进的必然。三面问题会挑战你设计的上限。面试官期望看到的不只是实现功能,而是如何通过系统化设计,实现业务效果(用户体验、成本)的最优化。这要求你对算法、系统、业务均有深刻理解。核心考点:在线决策系统、多目标优化(效果/成本/速度)、实时特征计算、自适应算法。适配岗位:AI平台架构师、推荐系统高级工程师。押中概率:75%​ (高阶架构题,区分顶级候选人的利器)【代码示例】智能流量路由器核心片段@Componentpublic class IntelligentModelRouter {@Autowiredprivate ModelPerformanceMonitor monitor;@Autowiredprivate DynamicConfig config;// 核心路由方法public String route(RequestContext ctx) {List<ModelCandidate> candidates = getAvailableModels(ctx);// 1. 过滤:剔除当前不可用或性能不达标的模型candidates = filterByHealth(candidates);// 2. 打分:基于多维度为每个候选模型打分candidates.forEach(c -> c.setScore(calculateScore(c, ctx)));// 3. 选择:根据打分结果和策略(如epsilon-greedy)选择模型ModelCandidate selected = selectionStrategy.select(candidates);// 4. 记录:用于后续学习与策略调整recordRoutingDecision(ctx, selected);return invokeModel(selected, ctx);}private double calculateScore(ModelCandidate candidate, RequestContext ctx) {// 评分公式示例:Score = w1*效果预测 + w2*性能得分 + w3*成本系数double effectScore = predictModelEffect(candidate.getModelId(), ctx.getUserFeatures());double perfScore = normalize(monitor.getP99Latency(candidate.getModelId()));double costScore = 1.0 / candidate.getInferenceCost(); // 成本越低,得分越高double bias = config.getTrafficBias(candidate.getModelId()); // 人工偏向,用于冷启动return config.getWeightEffect() * effectScore+ config.getWeightPerf() * perfScore+ config.getWeightCost() * costScore+ bias;}}最后,我想说:字节跳动寻找的,从来不是“行走的八股文答案库”,而是能真正用技术解决复杂业务问题、有好奇心、有成长性的工程师。希望这份指南,能成为你技术长征中的一张实用地图。🔥评论区:接好运,祝你顺利上岸!!!!~~~~
查看2道真题和解析
点赞 评论 收藏
分享
昨天 14:27
门头沟学院 Java
抖音基础架构团队1.自我介绍问实习:2.提示词模板是怎么构建的?3.单Agent还是多Agent的?子Agent任务是什么?4.分支覆盖率是怎么统计的?原理有没有了解过?代码插桩具体是怎么实现的?5.对于代码解析有没有前置分析?有效性判断怎么实现的?未来让你来优化这些指标你会怎么设计?6.有没有思考过哪些代码会让模型生成的代码准确度和覆盖率降低?这些用AST和LSP都生成不了单测的代码如何过滤?7.mock是怎么实现的?问项目:8.多维度的查询改写是什么?改写的时候遇到需要用户参与补充信息时怎么设计?技术上怎么实现?9.并行化意图识别是什么?为什么要并行化?如何实现的?10.讲一下项目里召回的流程11.对于上下文工程有什么经验吗?有没有做过to do list?为什么这样会让模型更聚焦,怎么实现的?12.skills的原理有没有了解过?怎么实现的?问八股:13.LLM的底层原理有没有了解?输入给模型的是什么?14.self attention怎么实现的有了解吗?为什么要分成QKV,怎么计算的?同一个token向量是一样的吗?15.python有没有多线程?为什么要有GIL,有没有了解过?多线程的锁都有什么?lock和Rlock有什么区别?16.信号量的底层是怎么实现的?17.cpp编译链接流程有没有了解?编译分哪些步骤?手撕:18.岛屿最大面积19.反问
查看18道真题和解析
点赞 评论 收藏
分享
昨天 14:15
门头沟学院 Java
攒攒人品!有面试过同岗的朋友欢迎评论区交流1. 实习拷打2.项目拷打3. 详细介绍一下agent项目的核心功能?4. 智能运维助手的"运维"具体如何定义?5. 系统有哪几个主要的组成部分?6. Spring ai alibaba覆盖了你上面说的哪些部分?7. Planner/Executor/Supervisor模式的优点是什么?比如说我接收一个请求的处理,它的优点是什么?8. 在Planner/Executor/Supervisor模式中,拆分为3个agent和只使用1个agent,最关键的优势和区别是什么?9. 介绍RAG的核心流程?10. 召回和重排用的什么算法?(没用重排,道歉)11. 为什么要做RAG?12. 模型回复效果不好的话,如何在RAG层面采取优化措施?如何通过微调采取优化措施?微调属于预训练还是后训练?13. 简单对比一下MySQL和Redis各自的特点?14. MySQL的"关系型"是什么意思?15. Redis能不能做存储,而不仅仅是缓存?16. 场景题: Java多线程并发模型相关: 比如说我有这么一个场景,总体上是一个生产消费的一个模型,但是这个整个的任务的量比较大。就是比如说我有很多的任务,然后可能有成千上万个生产者消费者。比如说有1万个生产者生产消息,然后有5万个消费者消费消息,或者叫任务或者消息或者数据都可以吧。然后因为整体任务量很大嘛,所以大家要去并发去生产和消费。能简单说一下,这样的话用Java的并发模型和并发控制所相关的这个机制怎么去实现,就口述就可以17. 手撕: lc 224.基本计算器(hard) 限时20min
点赞 评论 收藏
分享
3.30 一面(50min)结合着项目去问的八股:1.数据一致性怎么保证的?假设是多机房多集群部署,不同机房之间有各自的redis,如何实现整体的限流?2.乐观锁和悲观锁的区别?3.aop底层原理?4.如何解决redis大key和热key的问题?5.spring框架中bean如何初始化的?6.spring怎么解决bean循环依赖的问题?7.http请求从浏览器开始到后端服务器的过程?8.http和https的区别?9.什么是公钥什么是私钥?手撕:LCR 194 公共祖先(题本身简单 难在要自己构建测试用例的树)反问环节面完第二天中午约二面,这里因为主包是第一次面试,一面的时候很紧张,说话都哆嗦,本以为已经凉了,没想到竟然过了,不过为了再准备准备还是跟hr约了一个靠后的时间。-----------------------------------------------------------------------------------------------------------------------------4.2 二面(1h)项目:1.redis防止超卖用到了数据库吗?2.定时任务(SpringTask)实例宕机了,任务是否丢失?有别的方案吗?3.项目中缓存击穿的业务场景?4.一个关于项目中支付订单这一业务的连环问:订单表怎么设计的?索引结构怎么设计的?现在需要查订单,根据时间排序,如何设计索引?订单的数据如果非常大,到了几千万,会有什么问题?有什么解决办法?订单场景如何分库分表?分库分表是什么(问这个问题是因为上一个问题没答好,脱口而出只把数据量大的表拆分成小表)?慢查询如何解决?explain关注哪些内容?面试官在聊天框写了一个塞扣语句,让我找有哪些问题。(主包看了半天只找出了一个select * 的问题)反问环节八股:1.redis有哪些常用数据结构?zset一般使用场景?zset底层数据结构?(这里主包听错了,以为问的是set的底层数据结构)2.讲讲redis主从复制?3.怎么去保证rabbitmq消费不丢失?生产端如何保证?消费端怎么保证?如何保证消费有序?4.hashmap底层实现原理?发生哈希冲突时,底层如何处理?5.线程池了解吗?线程池好处是什么?手撕:LCR 023 相交链表(最简单的一集)反问环节主包个人感觉二面是整个流程下来最有压力的一面,项目拷打很深,感觉面试官就是想看看你是不是真的做过简历上的项目,所以经常在一些细枝末节的地方层层深挖。-----------------------------------------------------------------------------------------------------------------------------4.3三面 负责人面(40min)面试官上来一看主包的简历,没有实习经历,项目也比较简单,那就换个拷打的方向,今天拷打算法,直接开始手撕,题目本身不难,难在撕出来后面试官又加要求。LCR 095 最长公共子序列(面试时让输出序列,不是长度) 难在撕出来后面试官加要求问主包如果用字符序列CharSequence去做不用String可不可以,后面又加了一个要求具体是啥主包也忘了。然后又问了几个常规问题:1.ConcurrentHashmap底层原理?2.项目中的缓存有设置过期时间吗,你是依据什么设置的?3.为什么要用本地缓存?反问环节4.8hr面(20min)都是一些很常规的问题,最后反问了一下具体业务,转正情况就结束了,然后hr拜托主包介绍介绍身边的人来投这个部门(中国交易与广告),主要是缺前端和客户端,这两岗位hc充足,后端已经没什么hc了-----------------------------------------------------------------------------------------------------------------------------4.8晚发offer整体面下来除了二面压力很大,剩下的几面基本都很轻松愉悦,这里真的要给字节的效率点赞了,除了一面是因为主包自己觉得凉了,就没问hr结果,后面的几面都是前脚面完,两分钟不到就出结果;而且每轮面试前5分钟hr都会发短信祝面试顺利,情绪价值也给主包拉满了。主包之前没有实习经历,结果一上来面的第一家公司就给off了,感觉有点魔幻。
点赞 评论 收藏
分享
* 为什么在 RAG 流程中引入父子索引(Parent-Document Retrieval)?* 为什么引入 BM25?向量检索和 BM25 的融合比例是怎样的?* 检索融合的具体流程是什么?召回后有没有做 Rerank?* Rerank 后返回几个块(Chunk)?有没有针对这个返回数量做过验证?* Rerank 后的 TopK 截断是怎么做的?为什么是这个值?有没有其他截断方案?* 讲一下上下文工程(Context Engineering),Agent 的记忆(Memory)是怎么做的?* 请详细讲解分布式令牌桶限流的实现。* 漏桶算法(Leaky Bucket)的原理讲一下。* 滑动窗口算法限流讲一下。如果用代码实现,滑动窗口的结构体会包含哪些字段?* 滑动窗口和令牌桶相比有什么缺点?* 在 Redis 中,你会用什么数据结构来实现滑动窗口限流?* LRU 缓存的实现原理讲一下。* 布隆过滤器(Bloom Filter)的底层原理和适用场景讲一下。* MySQL 索引会在哪些情况下失效?* 在使用 LIKE 进行模糊查询时,索引什么情况下会失效?* MySQL 的事务隔离级别有哪些?如何保证一致性?* 详细说说 MVCC 的实现,ReadView 的生成时机是怎样的?* 在不同的隔离级别下,一个事务分别会创造几个 ReadView?* MySQL 都有哪些锁?它们的作用分别是什么?* 为什么选择 Python 和 Go 作为技术栈?在处理并发时有什么区别?* 手撕代码:实现反转链表。问的好杂,后面有的答不上来了是正常的吗
Agent面试会问什么?
点赞 评论 收藏
分享
分享我的面试经验
模拟面试
真实面试体验,快速补齐短板
应聘感受
暂无应聘感受
牛客网
牛客网在线编程
牛客网题解
牛客企业服务