字节跳动

收藏
互联网
10000人以上
D轮及以上
北京市
福利丰厚榜高校必争榜offer比较常胜榜HC充足榜校招高薪榜牛客指数榜
查看官网
上传简历
职位类型
全部
后端开发
前端开发
客户端开发
测试
数据
更多
最新
热门
一、面试问题A. 项目经历与业务理解1. 实习1. 先介绍一下你的这段实习经历。2. 听起来你的工作主要集中在数据/样本构建上,是吗?3. 你这里写了 VQG 和 VQA 一致性评估,这里的“一致性评估”是什么意思?4. 所以你的意思是,让大模型先生成问题,再生成答案,然后看问题和答案是否对得上,是吗?5. 所以最后是不是回答不一致的样本,就说明它比较难?6. 这个项目过程中,你有做过哪些模型方面的工作?2. LLM-as-a-Judge 项目7. 研究生阶段你还有一个 LLM-as-a-Judge 的项目,能大概介绍一下吗?8. 你最后这个总分好不好,是通过一个下游任务来验证的吗?9. 如果我理解得对,就是你打分之后选 Top 20% 的数据去微调,再和随机选 20% 做对比,是这个意思吗?10. 这个事情听起来很像样本选择,甚至有点像强化学习,你有从这个方向考虑过吗?B. 强化学习基础11. 你对强化学习了解吗?系统地学习过一些强化学习的方法吗?12. on-policy 和 off-policy 分别是什么意思?13. importance sampling 是什么?14. DPO 和 PPO 是什么关系?它们有什么区别?C. LoRA / 参数高效微调(这里因为我简历写了一个LoRA所以面试官追着来杀)15. 你在项目里用 BLIP-2 做了 LoRA 微调。LoRA 为什么可以省显存?16. 你虽然加的是一个低秩小矩阵,但不管多小,参数总归是增加了。那为什么在参数增加的情况下,LoRA 反而还能省显存?17. 推理的时候呢?推理阶段用 LoRA 和不用 LoRA,有什么区别?效率上有什么影响?D. 多模态模型 / VLM1. BLIP-2 相关(因为LLM-as-a-Judge里面提到了这个细节)18. 你为什么选择 BLIP-2 做微调?选择 BLIP-2 的考虑是什么?19. BLIP-2 相对于 BLIP 有什么改进?2. VLM 路线理解20. 你对 VLM 这条线还有哪些了解?之前有关注过哪些相关工作?21. Qwen VL 了解吗?22. 相比于 LLaVA,Qwen-VL 有哪些不一样的地方?你有没有了解过?E. Transformer / 大模型基础23. Position Encoding 是什么?有哪些分类?24. 旋转位置编码、绝对位置编码,是直接加到 token embedding 上的吗?25. 相对位置编码呢?比如 RPE 这种,它一般是加到哪里?26. decoder 里面 causal attention 是怎么实现的?F. 手撕:最长不重复子串二、反问1. 部门目前主要负责的业务内容是什么?团队主要在做哪些事情?部门整体是做风控的,负责平台上的各类风险问题。大的方向包括内容风险,比如违规图片、违规文本;也包括用户层面的欺诈、作弊等风险。具体到他们团队,主要做几类事情:一类是机器作弊流量和攻击检测,比如爬虫、自动化攻击、人工获取数据等;一类是人机验证相关能力,比如真人检测、验证码等还有一类是识别图片、文本里隐藏得很深的网址,并判断这些网址的风险,这些网址往往会把用户引到站外赌博、色情等高风险网站。2. 这个岗位平时更 focus 哪些算法领域?更希望候选人掌握哪些知识、算法方向和工程经验?首先还是需要有大模型基础,对大模型的一些基础概念和原理要比较了解。其次,像他们做隐藏网址识别这类任务,如果输入是图片、图文、视频,本质上就是一个 VLM 问题,所以也会希望候选人具备多模态/VLM 方面的理解。还有一块是 Agent,因为他们现在也在探索用 Agent 节省人力、提高效果,所以这方面也有需求。至于为什么会追问 RL,是因为 Agent 往底层看,算法基础还是会和 RL 有关系,所以他们对这方面也是有期待的。3. 这个部门属于哪个业务?是抖音还是 TikTok 相关?会和哪些部门合作?这个部门属于 Data,可以理解成字节的中台部门。风控相关的很多需求会收在他们这里,所以也可以把他们理解成风控中台。抖音和 TikTok 两边的风控中台需求都会提到他们这里,也就是说他们同时支持抖音和 TikTok 这两边的业务。4. 这份实习是日常还是暑期?HC 情况大概怎么样?转正 HC 的情况面试官自己也不太确定,目前应该还没有完全定下来,这块后续可以再和 HR 沟通。实习本身要求至少三个月,团队会更希望实习时间长一点,因为前期熟悉业务和环境本身就要花不少时间,太短的话不利于真正做出产出。5. 团队里做的内容主要是业务算法 / pipeline 搭建,还是也会有研究课题、论文产出的可能?整体还是更偏业务,不太支持以论文为导向的事情。但也不是说让实习生直接上来扛复杂业务指标。通常的做法是从复杂业务问题里,抽取出一个相对独立、偏技术、带一些探索性的点,让同学在这个方向上做出产出。所以更偏“从业务中抽技术问题来做”,而不是纯学术研究。6. 为什么字节有些组会支持论文或者研究产出,但你们组看起来不太支持?是岗位性质不一样吗?这个团队是要为业务结果负责的,所以判断标准首先是对业务有没有帮助。面试官比较直接地表达了他的看法:很多论文并不能真正解决业务问题,甚至会被视为“水论文”。他们并不是完全排斥研究,而是强调如果某个具体业务问题确实值得研究、也确实需要前沿技术去解决,那么可以研究;但最终目标仍然应该是服务业务、能落到线上,而不是为了论文本身去做。7. 这轮面试之后,我大概多久能知道结果?正常情况下大概三天之内会有结果,但最终还是要看后续 HR 推流程的节奏陪一张昨天下午在教室拍的一角夕阳
查看27道真题和解析
点赞 评论 收藏
分享
今天 14:42
浙江大学 C++
暑期实习 timelinebg c9本,大二在华子实习过,所以对整个招聘的准备流程还是比较清楚的。从3月9号开始准备,一边刷leetcode、一边补八股、一边海投;最后被鹅厂收留,成为鹅孝子网易互娱 服务端年前就投过一次提前批,但当时太菜了笔试根本过不了;3月份又给我发起一次笔试邀请,但依旧是没有准备好,所以又挂了;后知后觉地了解到原来没准备好可以不开始笔试,等下一批后面抓住机会去了线下的直通面试,结果是草台班子,根本没给我预留位置(公司还提前一两天打电话邀请我),结果就是不了了之,很愤怒网易雷火 服务端雷火的笔试太难了,根本做不起,所以网申也寄了不过还是靠线下直通翻盘了,但是流程走太慢了,最后被鹅截胡3.18 线下一面面试官是校友,问题现在来看很温和,一些八股+简单问了问实习和项目+手撕1. 虚函数的实现2. 1+2+...+n 不用循环和乘法怎么算3. 多重继承时的虚函数指针4. 模板的原理,特化、偏特化5. TCP发送数据包整个网络过程,数据包怎么到路由器的6. 路由器间的最优路径选择手撕:二叉搜索树原地转成双向链表4.10 线上二面这个面试官很有趣,整体是诙谐轻松的风格,说一面问过的就不问了,题目直接就在牛客面试的ide里粘贴问我,不刁难人可跳题1. demo1和demo2表结构相同,把demo1里id=1的数据拷到demo2;但是我忘记怎么写sql语句了,讲了思路直接跳2. linux里 `ls /file 2> /dev/null` 什么意思3. localhost和127.0.0.1是什么4. 有一个函数可以拿到时间戳的年、月、日、星期、时、分、秒,怎么判断两个时间戳在同一个自然周5. IEEE754能精确表示的最大整数是多少?6. 为什么要序列化和反序列化,不能直接发送内存里的数据吗7. 100万亿数据怎么去重,用最少的空间,大致是多少空间无手撕4.16 三面(拒了,因为拿到offer了)米哈游 服务端线下直通面:不问八股,全是各种设计题,拷打地哑口无言,挂1. 一个装备合成的接口怎么设计,怎么保证不会吞我的材料2. 玩家A、B分别在两台服务器上,怎么保证一个交易系统的可靠性?3. 有一个业务需求:想在手机上通过聊天软件/通讯软件,去遥控PC上agent完成代码coding,每一步应该怎么设计。4. 欲设计一个组队匹配系统,比如1~4人组队,进入一个100人的场景服务器,给你一个agent如何完成这个需求?oppo投的系统工程师,流程太慢,还有后来发现一开始那个岗位的工作地点不太满意,改投底软了,但是流程已经被之前的岗位卡住了,所以后面也不是很感冒了4.7 一面项目+实习 40min结束4.13 二面项目+实习 40min结束整体很温和,无八股和手撕,但是流程太慢,被截胡腾讯 后台开始投的后台,但是过了一段时间被捞到了企微的客户端开发,懵懵懂懂地去试了手3.26 客户端一面总时长2h,折磨到底(强度太大+面试官说广普听不太清)开局3道手撕:1. 合并链表2. 循环数组找最小值,题面是严格递增,做完后又问非严格递增怎么办3. 手撕shared_ptr(引用计数+裸指针),我用的原子变量,然后面试官问了一些可能并发的问题,补了下互斥锁然后就拷打项目和实习,无八股,最后过了后来刷牛客发现客户端的坑,就赶紧润了,拒了二面4.1 被小程序/公众号的后台开发捞起,开启终极考验4.1 一面开局三道题:1. 括号匹配2. 寻找重复数3. 手写LRU,顺着问了LRU并发的问题然后是设计题+拷打项目和实习4.2 二面开局四道题:具体记不住了,不过应该都是leetcode原题问了几个设计题:1. chrome里是采用一个标签页一个进程还是一个标签页一个线程,为什么?2. io多路复用3. 工作线程里遇到耗时操作怎么办,如果不改异步呢?可能还有但是忘了面完后好几天没有消息,挺慌的,现在想来应该是过清明去了4.8 三面面试官比较温和,说前面手撕和拷打的够多了,这次轻松点,无手撕,问了些八股1. TCP头每个字段介绍一下2. TCP可靠传输怎么保证3. TCP的流量控制4. 服务器A向B发送文件,怎么保证B收到的是A发出的两个文件(我讲的是设计应用层协议,然后具体给出了会用到的字段)5. 如果网卡缓冲区满了会发生什么剩下就简单聊了聊项目和实习,差不多40min结束了4.14 HR面4.15 云证4.16 oc其他公司京东投了没动静,美团投了没去笔试,vivo投了没动静,滴滴投了没动静,快手投了秒挂,pdd笔试后挂,蚂蚁笔试后挂重点提一下阿里和字节:阿里hr自动给我投了ai应用开发,编程题全ak,笔试完挂,不过也是意料之中,毕竟根本和agent开发不沾边;然后我投了阿里云c++和客户端,简历挂;投了灵犀互娱笔试编程全AK,挂;字节:投了好几个后端,几个星期没动静纯装死;过了一段时间,我发现tiktop shop的流程终于有推进了,不过是挂了,最草台班子的是部门hr还加我微信说看中了我的简历问我要不要面试,我说你不是给我挂了吗,不过重新开始了面试;然后一面的时候,面试官说我的技术栈出入有点大,问我怎么处理和调整,全程就问了项目和实习,无手撕,最终不了了之感慨这次暑期实习也是挺颠沛流离的,时间紧任务重,特别是前期疯狂地投递、疯狂地笔面,但是得到的全是挂挂挂;还有有些公司真的流程太慢,很耗人心神,纯消磨意志(这点必须表扬腾讯,效率太高了)然后几乎所有的面试都问了ai的使用情况,也是间接督促我该多看点agent内容了下面将成为严肃鹅孝子,开启一段广漂
点赞 评论 收藏
分享
今天 04:30
门头沟学院 Java
感觉面完人都通透了,还是太菜了,下去沉淀一下1.实习项目相关问题2.介绍智能客服系统中你的负责部分、面临的问题及解决方案。3.如何解决大模型在客服场景中的幻觉问题?4.是每个场景对应多个 Agent?5.新架构是否存在泛化性损失问题?如何处理新活动规则等未见过的知识注入?6.Expert Agent 是以什么维度划分的?7.新架构的 AB 测试指标提升具体来自哪些模块?8.如何从线上真实对话构造Expert Agent 的 SFT 训练数据?9.Expert Agent 的 prompt 主要输入有哪些?模型输出是什么?10.Expert Agent 是否有预设工作流(workflow)和任务描述?11.Expert Agent 的评价指标(出商品率、商品正确率)具体如何定义和获取评测数据?12.智能客服 Chatbot 是否面临多轮对话中信息遗忘、流程偏离、回复机械感的问题?如何应对?13.如何优化多智能体系统(MAS)中各 Agent 的协作,避免局部优化但整体效果不佳?14.多智能体系统中如何设计奖励函数促进 Agent 协作而非竞争?八股1.什么是优势函数?2.PPO 中需要训练哪几个模型?3.PPO 中参考模型的作用是什么?4.什么是 Reward Hacking?有哪些缓解 / 优化方案?5.智能对话多轮场景中,attention 机制的局限性是什么?有哪些优化思路?手撕:排序K个升序链表
查看19道真题和解析
点赞 评论 收藏
分享
昨天 17:04
武汉大学 Java
1. 无手撕,全程拷打项目,一直拷打,一直拷打,事无巨细,直到讲解清楚或者答不出来换方向继续问。。鼠鼠前半段在掌握中,问到RAG就纯纯半吊子了。。并且这个部门是做智能客服,管理知识库的,属于是踢到铁板了,多半是凉了2. 自我介绍3. 怎么使用ai coding的(RAG项目的前端是纯ai出来的,面试官就问我具体咋做的)4. 有没有对比过不同的ai,你评价一下这些ai产品呢?问我通义Lingma具体哪个?我没招了。。我用的插件哪知道5. 你这个”一人一单“,怎么又用了Lua脚本又用了Redisson分布式锁?(因为项目迭代)6. 那你讲一下Redisson看门狗的原理?7. Redisson分布式锁里面数据是啥,你锁的具体是什么8. 那么你对这个高并发场景的前置有什么拦截吗?9. 讲一下逻辑过期是怎么做的?具体流程?10. 你这个项目QPS能达到多少?具体怎么测试的呢?抢锁的过程测试过吗?11. 你这个缓存雪崩是随机过期时间对吧?这个TTL具体怎么设计?为什么设计成这个时间?(不是,我咋知道啊,从这里开始就答的不是很顺了,我就说TTL太小容易雪崩,TTL太大持续占用内存,应该对吧)12. 你这个排行榜ZSet,这个排行榜怎么做的?member,score存的都是什么?那你这个点赞排行榜什么时候更新呢?每次有点赞都要更新吗?(忘了,太久远了,鼠鼠没想到他会问这么细)13. 取消点赞怎么设计的?(一人不能多次点赞)14. 讲一下你这个项目的RAG具体流程。15. 你这个动态选择的策略模式是怎么做的?判断依据是什么?具体判断条件?16. 切片策略,这个chunk块具体为什么设置成这么大?chunk设置的依据在哪?17. 继续讲流程,prompt怎么设计?你这个prompt具体怎么写的??问prompt特别具体的写法。。(这三个问题答的很差,感觉如果挂了极大概率就是因为这三个了)18. Stream流式输出,为什么用SSE(WebSocket和SSE区别嘛,提前准备过)19. 如果在流式输出途中前端突然关闭界面,你的项目会发生什么?(我说我没测试过,我觉得后端会继续跑,我觉得面试官想让我说的是有没有什么中断策略,可惜我没有设计)20. 你这个项目是自己一步步构建的是吧,你能说说你在学习RAG相关知识时候是怎么学习的呢?你平时的学习方式?21. 项目中遇到过最大的苦难,哪一个issue让你排查问题的时间最长?22. 反问环节:建议我可以参与开源项目,写几个开源项目的功能模块比自己闭门造车好得多,受教了,可惜鼠鼠现在没时间做。。。23. 总结:再接再厉,至少直到自己哪一块薄弱了,不至于像无头苍蝇一样。吐槽::不是,连个手撕都没有,八股也一个没问,是不是要寄了啊,纯纯拷打呗
查看20道真题和解析
点赞 评论 收藏
分享
去年秋招我投了几十家,基本都是一面游,连二面都很少见到。今年春招开始我差点不想投了,一个双非本科,没大厂实习,感觉自己是不是真的不适合这行。但3月19日我还是咬牙投了字节的AI Agent岗位,没想到当天就收到了电话,约我3月25日一面。从一面开始,几乎每轮都是当天或隔天就出结果并约好下一轮,4月2日OC,4月14日正式拿到offer。整个流程效率超高,体验也很好。值得一提的是,OC之后我对部门具体做什么还不太清楚,HR特意帮我约了未来的Leader和Mentor(也就是一二面的面试官)开了个非正式会议,给我详细介绍了部门情况并解答了我所有的疑问。面经干货(具体题目记不太清了):1. 最好有自己亲手做的AI Agent项目。面试官直接让我投屏演示,有一个能跑起来的网页前端是加分项。同时建议写一份非常详细的README,把系统结构和设计思路讲清楚,面试官会抠很多细节。就算用AI辅助写代码,也一定要搞懂每个设计决策背后的原因。2. 对目标部门的业务要有一定了解。会有比较开放的问题,比如“如果要做某个功能,你会怎么设计Agent流程?”提前做足功课很重要。3. 简历上的项目要真正吃透。我之前做过一个AI小游戏,被反复拷问各种细节,幸好之前找科研实习时做过一个项目PPT,临时派上了用场。4. Agent和机器学习相关基础知识要熟悉。终于上岸,本该开心,却又有点心情复杂——怕以后加班太多,自己技术跟不上被淘汰,还得继续卷啊。说实话,我最大的变化是开始泡【春招专题】,那里每天都能看到同届的人投了啥、面了啥、面经更新了啥,节奏感一下就出来了。推荐大家也去逛逛 https://www.nowcoder.com/link/chunzhaoji2610
查看4道真题和解析
点赞 评论 收藏
分享
分享我的面试经验
模拟面试
真实面试体验,快速补齐短板
应聘感受
暂无应聘感受
牛客网
牛客网在线编程
牛客网题解
牛客企业服务