哔哩哔哩

收藏
文娱内容
1000-9999人
上市
上海/北京/广州/重庆
学历友好榜高校必争榜牛客指数榜
查看官网
一键网申
职位类型
全部
后端开发
前端开发
客户端开发
测试
数据
更多
最新
热门
岗位是sre一面主要是八股、手撕 + 项目追问。题目中规中矩,但会结合项目一直往工程细节上问。二面和三面无手撕八股,主要是项目深挖和开放问题,尤其关注稳定性、线上风险、工程取舍和AI 应用。八股Go:- GMP 模型- map 多协程读写- 往已关闭的 chan 写/读- Goroutine 泄露场景 + 排查方法(pprof)缓存 & Redis:- 缓存穿透 / 击穿 / 雪崩- 热 key 失效处理- Redis 持久化:RDB / AOF 区别- Redlock 存在的问题- 手撕 LFUMySQL & 数据结构:- B 树 vs B+ 树- 索引类型、索引失效场景- 回表 & 如何减少回表AI / RAG / Langchain:- RAG 脱敏策略 + 召回率验证- Streaming 输出如何处理跨窗口敏感词- LangChain vs LangGraph- LangGraph State & Checkpoint- HITL 实现方式- 上下文过长的 AI 对话处理项目深挖 & 开放问题可观测平台:- 数据如何产生 → 传输 → 存储 → 计算 → 展示效果- Linux 环境能力不足的影响 & 性能优化方法Agent / RAG 项目:- 业务数据流程- 已有平台能力时,为什么还要做定制开发?- 知识库文件格式、非结构化文件抽取- 内容安全 / 脱敏策略开放问题:- 最近在学什么技术?平时怎么学新技术?- AI 越来越强,新手怎么体现自己的价值?总结:项目深挖:不只是做了什么,强调 设计思路、风险控制、落地效果,问流程、原理、选型理由、取舍权衡、落地价值底层技术:Linux 、profiling&可观测技术、MQ/CK/流计算、go并发编程、cgroup、内核版本适配工程架构:数据采集 - 传输 - 存储 - 计算 - 可视化全链路设计、阈值设计、性能开销控制AI 应用:RAG 脱敏、风控、Agent 架构、Langchain 工具使用与二次开发 、如何驾驭AI(AI提效)软实力:职业规划、岗位认知、学习方法、行业思考、业务架构思维
查看26道真题和解析
点赞 评论 收藏
分享
【BILIBILI 多模态视频 AI 产品面经拆解】三面全流程:从 Prompt 优化到产品大局观───📋 原文实录(三面实录)岗位: 多模态视频 AI 产品面试官背景: B站 AI 视频方向,团队负责产品 + 算法,无专职开发───Q1:Prompt 怎么优化,怎么写的?原题,B站一面。考察 Prompt Engineering 实战经验。Q2:音画不同步怎么办?原题,B站一面。视频 AI 处理中的经典工程问题。Q3:我们主要做各种 prompt 优化,旅游 vlog、赛车 vlog(感兴趣 TTS 吗?)原题,B站一面。面试官说明团队构成:主要是产品和算法,没有开发。Q4:为什么要做产品?原题,B站二面。经典动机题。Q5:音画不同步、偏移怎么办?有没有音频和视频拆开来的方法?原题,B站二面。Q2 的升级版,追问技术方案。Q6:有没有调研过其他的视频识别模型?有没有自己部署过模型,自测过?原题,B站二面。考察动手能力和技术深度。Q7:你在 AI 视频剪辑选择模型的时候,是怎么调研的?调研过哪些模型?有没有想过拆开来——视频和音频拆开来分析?原回答(极详细):调研思路: 需求分析先行 + 市场(商业 API 服务)与学术调研结合(GitHub、HuggingFace)+ 性能与成本评估 + 小范围 POC(概念验证)+ 技术与指标评估。调研过的具体模型:• 视频理解:Video-LLaMA、VideoMAE V2、Google Cloud Video Intelligence API、Google Gemini API• 音频理解:Dia-1.6B、F5-TTS、Fish Speech (Fish-TTS)、Zonos• 对话语音模型:Dia-1.6B — 专门为对话设计的开放式 TTS,为每个说话者生成逼真语音,包括情感和非语言声音• 语音克隆:F5-TTS(零样本,10 秒样本即可)、Fish Speech(多语言)、Zonos(20 万小时训练,擅长语音克隆)• 音乐生成器:ACE-Step — 新型开源音乐模型,极快速度和连贯性• ASR:OpenAI Whisper(68 万小时多语言音频)、NVIDIA Parakeet-v2(极快准确)• 音频-语言模型:Qwen2-Audio-7B、AudioFlamingo 2(长篇音频理解与推理)、Gemini-2.0-Flash• 说话人分离:pyannote、DiarizationLMQ8:视频题材方面,除了从内容的角度来考虑对视频进行解析和精进,还有哪些方面?原回答: 考察对视频的深入理解,包括四个维度:a. 视频结构化与元数据增强: 场景识别与分类(室内/室外/白天/夜晚)、事件检测(对话/打斗/演讲/产品展示)、主体识别与跟踪(人物/物体)、时间戳与标签自动化。b. 视听语言分析与美学评估: 镜头语言分析(推拉摇移/景别/构图)、色彩与光线分析(饱和度/亮度/对比度)、音频特征分析(BGM/人声/环境音/情绪识别/噪音检测)、情绪识别(面部表情+肢体语言+语音语调)。c. 用户偏好与个性化推荐: 用户行为数据分析、多维度推荐。d. 版权与合规性审核: 版权内容识别、敏感内容过滤。Q9:用 AI 做过什么产品?对 B站 AI 功能有哪些理解和建议?原回答:作为 C 端用户观察到:1. AI 视频总结小助手 — 时间戳对应内容2. 鬼畜区 AI 剪辑和弹幕氛围3. 评论区 @AI 根据描述或图片找到对应历史番剧但 C 端功能很难商业化变现。AI 现在更多是面向 B 端 UP 主提效的工具。关于 NotebookLM:好用的地方——视频拆得很细致,能像参考文献一样使用,能跟 chatbot 聊天了解长视频内容。播客生成功能亮眼。因为是 Google 自己的 YouTube,速度很快。───🔍 拆解拆解一:Prompt 优化考的不是技术,是「业务嗅觉」B站一面上来就问 Prompt 优化,第二问问音画不同步,第三面直接交底——团队做的是旅游 vlog、赛车 vlog 的 prompt 优化。这三问串起来看,面试官在做一个判断:你写 prompt 的时候,脑子里想的是 token 还是用户的 vlog?很多人答 Prompt 优化会陷入「怎么写 chain-of-thought」「few-shot 给几个例子」的技术路径。但 B 站的场景不一样——他们要的不是通用的 prompt 技巧,而是对特定视频类型(旅游、赛车)的理解如何转化为 prompt 设计。比如赛车 vlog:你需要让 AI 识别出发车瞬间、弯道超车、冲线、引擎声的变化——这些跟普通视频完全不同的语义单元。prompt 优化本质上是领域知识的编码。面试技巧: 如果只是说「我会写详细 prompt + 迭代」,你就掉了。应该先追问「你们现在最头疼的视频类型是什么?prompt 在哪个环节出的问题最多?」——把问题域先定清楚,再谈方案。拆解二:音画不同步问了两次——第一次问「知不知道」,第二次问「怎么解」Q2 第一次问是 check 你有没有这个意识。Q5 第二次问才是真正的技术考察。面试官的升维路线:「有这个问题」→「有没有音频和视频拆开来的方法?」→ 他在引导你去想架构层面的解耦。把音视频拆开处理,本质上是在问你对多模态 pipeline 的理解:• 音频流走 ASR + 说话人分离 → 产出带时间戳的文本• 视频流走场景检测 + 目标追踪 → 产出事件锚点• 两端在时间轴上对齐 → 解决偏移这个拆解的思路,比你直接说「我会调节偏移参数」高了不止一个 level。教训: 重复出现的问题不是面试官忘了,是他在换角度测你的深度。答浅了第一遍,第二遍必须升维。拆解三:候选人的模型调研回答,堪称教科书Q7 的回答是整个面经里最有价值的一段。候选人的模型调研框架:需求分析 → 市场调研+学术调研 → 性能成本评估 → POC → 技术指标评估而且他不是在背名字——他说出了模型之间的分工:• 视频理解用多模态大模型(Video-LLaMA, Gemini)• 音频用专门的 TTS/语音克隆(F5-TTS, Fish Speech)• ASR 用 Whisper/Parakeet• 说话人分离用 pyannote这展示了一个核心能力:知道什么任务用什么工具。 AI 产品经理不需要会写模型代码,但必须知道技术方案的边界——什么时候用大模型,什么时候用小模型的组合,什么时候调 API 就够。面试中可以用的话术模板: 「我的选型逻辑是——先定场景,再看 API 成熟度,然后开源自部署做差异化。比如 XX 场景,商业 API 的准确率已经够了,但 YY 场景需要微调开源模型,因为……」拆解四:Q8 的回答暴露了一个高阶产品思维面试官问:「除了内容角度,还有哪些方面?」候选人答了四个维度:结构化元数据、视听语言、用户偏好、版权合规。这个回答好在哪里?他跳出了「我帮你剪视频」的工具思维,进入了「我理解你的视频为什么火」的平台思维。
查看8道真题和解析
点赞 评论 收藏
分享
1. 你可以先简单介绍一下你这个 IoT 这个平台的这个整体架构嘛,就是你从设备端到这个用户端大概完整的这个数数据流是怎么样的?2. 比如说你这个有一些设备注册啊,因为你是一个 IoT 的嘛。那个命令下发,那这个你觉得放在哪个层呢?那你们项目中有单独给这个划层吗?3. 你使用了这个若依框架是吧?它是一个什么框架?4. 权限管理它是怎么设计的5.你可以先简单介绍一下你这个对接API的过程嘛,然后中间比如说遇到了哪些问题,这个可以简单介绍一下。 然后是有没某一些 API,比如说你这种大 QPS 下,它可能会对你限流,有没有? 那你有没有遇到过这种数据格式不统一的方式呢?6. 这个平台,如果这个平台你上面写的是依托这个平台支持了多设备,多协议设备的接入吗?假如这个平台它宕机了,会有对你的平台有影响吗?者说你这个,你的这个项目里面,对他这个外部的依赖,如果宕机了,会不会有一些容错或者兜底的一些方案呢?7. 看它在高负载情况下到底能到多少 QPS 有做过这个吗?8. 你这个 TP99 的这个抖动问题是怎么发现的呢? 如何定位、排查慢SQL问题?如何分析并设计覆盖索引进行SQL优化?9.用WHERE ID大于XX解决深分页,ID是雪花自增吗?为什么不用连续自增?10. 项目的数据规模大概是多少?11. 概率推断智能体项目属于AI相关吗?12. 介绍项目整体架构,说明从传感器数据到最终决策的完整流程。13. 项目用贝叶斯网络进行建模了吗?14. 隐马尔可夫模型和粒子滤波为什么都要用?只用一个会有什么问题?15. 粒子滤波是为了解决什么问题?16. 两个模型每一步的计算复杂度是多少?17. 除覆盖索引外,还有哪些数据库优化方式?拿到大查询该从哪些方面优化?18. 项目用的MySQL引擎是什么?InnoDB基于什么实现?19. B树和B+树有什么区别?InnoDB为什么选用B+树?20. 项目中用到过Redis吗?Redis常用数据类型有哪些?21. 物联网设备为什么选MQTT,而不用Kafka等消息队列?MQTT有什么特征?22. MQTT需要客户端主动上报心跳吗?23.算法:leetcode86: 给定一个链表和目标值 x,严格保持节点原有相对顺序,将小于 x 的节点放在链表前面,大于等于 x 的节点放在后面。其实这期间还面了一场b站和汇川,但是b站面试出了一点小插曲,就没有录上,简单来说也是一面挂。
查看23道真题和解析
点赞 评论 收藏
分享
头像
04-20 22:26
南京大学 Java
攒人品ing~(一天三面我燃尽了)个人背景介绍一、 项目深挖:高并发博客系统架构面试官提问:你的并发控制和API限流是怎么做的?面试官追问:点赞的接口限流具体怎么实现的?面试官追问:数据最终怎么落库?MQ消息丢了怎么办?二、 场景题:使用Redis实现QPS/QPM/QPD限流面试官提问:如果要用Redis限制一个接口在滚动窗口下的QPS、QPM、QPD,怎么做?第一版思路:将时间单位拼接到Redis Key中。面试官指出:这会导致Key数量爆炸式增长。第二版思路:使用Hash结构,记录用户在特定时间窗口内的访问次数。面试官指出:这种方式只能记录自然时间(如自然天、自然秒),无法满足滑动窗口的需求。第三版思路:使用ZSet实现滑动窗口,Score设为时间戳,Value设为唯一标识。每次请求进来先移除时间窗口之前的数据,再使用 `ZCARD` 统计当前元素个数来判断是否限流。面试官指出:在QPD(每天调用量)极大且高频的场景下,ZSet会导致元素过多,产生大Key问题。第四版思路(最终被认可):针对精度要求没那么高的QPM/QPD,采用“分桶计数”思想。将一天24小时分为1440个分钟桶,使用String存计数值。每次判断时只需将最近时间段内的桶数据相加即可,旧桶设置自动过期销毁。表示该方案可行。三、 项目深挖:缓存三大问题解决方案面试官提问:你在项目中提到的“布隆过滤器 + 互斥锁 + 逻辑过期”是怎么协同工作的?四、 手撕算法题目:LeetCode 124. 二叉树中的最大路径和。五、 反问环节问:入职后实习生的主要工作内容是什么?问:团队内部对于AI写代码的认可度如何?问:对我今天面试表现的评价和建议?
查看9道真题和解析
点赞 评论 收藏
分享
04-15 19:50
已编辑
吉林大学 golang
查看15道真题和解析
点赞 评论 收藏
分享
分享我的面试经验
模拟面试
真实面试体验,快速补齐短板
应聘感受
暂无应聘感受
牛客网
牛客网在线编程
牛客网题解
牛客企业服务