感觉这家一直在招实习生
点赞 1

相关推荐

05-17 17:56
已编辑
吉利控股_产品经理
写给学历普通的你:把校招的力气,花在对的地方每年校招季,都会有大批学历背景普通的同学,怀揣着憧憬和不安,一头扎进互联网大厂、头部名企的简历池里。网申/海投、行测、性格测试、多轮面试……你在这场漫长的流程中投入了所有精力,却迟迟收不到一个确切的录用通知。等到寒风乍起,你猛然清醒,才发现中小企业和创业公司的招聘窗口早已关闭,而自己手中依然空空如也。这背后,有一个无形的陷阱,叫做沉没成本。对大厂的执念,常常让我们误以为“只要多投几家,总有一家会看到我”,于是不断刷题、赶笔试、复盘面试,恨不得把所有时间都押进去。然而学历这道硬门槛,在很多大厂的简历机筛环节就已将你挡在门外。你不是不够努力,而是游戏的入门规则本就对你不太公平。继续投入,只会让沉没成本越滚越大,却很难换来等值的回报。相比大厂的万里挑一,中小企业和创业公司才是更值得你倾注注意力的地方。这些公司往往更务实,更看重你实际能做什么,而不是盯着学校那一行名字不放。你的一段项目经历、一项可展示的技能、一次对业务的独到理解,都可能成为打动面试官的关键。更可贵的是,在中小团队里,你更容易获得独当一面的机会,成长速度有时会远超在大厂做“螺丝钉”的同龄人。所以,不妨主动调整策略。精心选三五家真正契合自身方向的中小企业或创业公司,认真研究产品与业务,定制化修改简历,准备有针对性的作品和面试方案。当别人还在大厂的笔试循环中消耗心力时,你已经和一家成长型公司的创始人聊完了业务痛点,彼此看见光芒。你花费的时间更少,获得的确定感却更高。学历普通从来不代表能力的上限,但校招是一场信息与策略的博弈。与其在拥挤的独木桥上被挤得遍体鳞伤,不如提早转向那条被你忽略的、同样通往未来的路。把注意力从大厂的泡沫里收回来,稳稳握住所剩无几的校招时间,你完全有机会在中小企业里找到真正赏识你、并且让你快速成长的舞台。别等到一切尘埃落定才后悔,那时候的“0 offer”和“招满了”,会成为这个校招季最冰冷的注脚。引流:字节跳动,海康威视,深信服,腾讯,阿里巴巴,拼多多,滴滴,京东,小米,大疆,美团,好未来,小红书,华为,简历,offer,面试,面经,三方,国企,央企,秋招,应届生,求职,比亚迪,建设银行,工商银行,百度,中兴,邮储、中行、建行、工行、建行、光大、招商银行、科大讯飞、蔚来、新华三、京东方、容知日新、长鑫存储、阳光电源、中国移动、中国电信、中国联通,中兴,虾皮,网易,腾讯音乐,京东,虎牙,b站,bigo,思科,亚马逊,荣耀,小米,联想,tplink,第四范式,米哈游,携程,旷视,美的,索尼,OPPO,满帮,momenta,欢聚,shein,用友,哈啰,vivo,完美世界,地平线,爱奇艺,汇顶,得物,深睿医疗,全志科技,禾赛,唯品会,度小满,蔚来
我的求职进度条
点赞 评论 收藏
分享
【BILIBILI 多模态视频 AI 产品面经拆解】三面全流程:从 Prompt 优化到产品大局观───📋 原文实录(三面实录)岗位: 多模态视频 AI 产品面试官背景: B站 AI 视频方向,团队负责产品 + 算法,无专职开发───Q1:Prompt 怎么优化,怎么写的?原题,B站一面。考察 Prompt Engineering 实战经验。Q2:音画不同步怎么办?原题,B站一面。视频 AI 处理中的经典工程问题。Q3:我们主要做各种 prompt 优化,旅游 vlog、赛车 vlog(感兴趣 TTS 吗?)原题,B站一面。面试官说明团队构成:主要是产品和算法,没有开发。Q4:为什么要做产品?原题,B站二面。经典动机题。Q5:音画不同步、偏移怎么办?有没有音频和视频拆开来的方法?原题,B站二面。Q2 的升级版,追问技术方案。Q6:有没有调研过其他的视频识别模型?有没有自己部署过模型,自测过?原题,B站二面。考察动手能力和技术深度。Q7:你在 AI 视频剪辑选择模型的时候,是怎么调研的?调研过哪些模型?有没有想过拆开来——视频和音频拆开来分析?原回答(极详细):调研思路: 需求分析先行 + 市场(商业 API 服务)与学术调研结合(GitHub、HuggingFace)+ 性能与成本评估 + 小范围 POC(概念验证)+ 技术与指标评估。调研过的具体模型:• 视频理解:Video-LLaMA、VideoMAE V2、Google Cloud Video Intelligence API、Google Gemini API• 音频理解:Dia-1.6B、F5-TTS、Fish Speech (Fish-TTS)、Zonos• 对话语音模型:Dia-1.6B — 专门为对话设计的开放式 TTS,为每个说话者生成逼真语音,包括情感和非语言声音• 语音克隆:F5-TTS(零样本,10 秒样本即可)、Fish Speech(多语言)、Zonos(20 万小时训练,擅长语音克隆)• 音乐生成器:ACE-Step — 新型开源音乐模型,极快速度和连贯性• ASR:OpenAI Whisper(68 万小时多语言音频)、NVIDIA Parakeet-v2(极快准确)• 音频-语言模型:Qwen2-Audio-7B、AudioFlamingo 2(长篇音频理解与推理)、Gemini-2.0-Flash• 说话人分离:pyannote、DiarizationLMQ8:视频题材方面,除了从内容的角度来考虑对视频进行解析和精进,还有哪些方面?原回答: 考察对视频的深入理解,包括四个维度:a. 视频结构化与元数据增强: 场景识别与分类(室内/室外/白天/夜晚)、事件检测(对话/打斗/演讲/产品展示)、主体识别与跟踪(人物/物体)、时间戳与标签自动化。b. 视听语言分析与美学评估: 镜头语言分析(推拉摇移/景别/构图)、色彩与光线分析(饱和度/亮度/对比度)、音频特征分析(BGM/人声/环境音/情绪识别/噪音检测)、情绪识别(面部表情+肢体语言+语音语调)。c. 用户偏好与个性化推荐: 用户行为数据分析、多维度推荐。d. 版权与合规性审核: 版权内容识别、敏感内容过滤。Q9:用 AI 做过什么产品?对 B站 AI 功能有哪些理解和建议?原回答:作为 C 端用户观察到:1. AI 视频总结小助手 — 时间戳对应内容2. 鬼畜区 AI 剪辑和弹幕氛围3. 评论区 @AI 根据描述或图片找到对应历史番剧但 C 端功能很难商业化变现。AI 现在更多是面向 B 端 UP 主提效的工具。关于 NotebookLM:好用的地方——视频拆得很细致,能像参考文献一样使用,能跟 chatbot 聊天了解长视频内容。播客生成功能亮眼。因为是 Google 自己的 YouTube,速度很快。───🔍 拆解拆解一:Prompt 优化考的不是技术,是「业务嗅觉」B站一面上来就问 Prompt 优化,第二问问音画不同步,第三面直接交底——团队做的是旅游 vlog、赛车 vlog 的 prompt 优化。这三问串起来看,面试官在做一个判断:你写 prompt 的时候,脑子里想的是 token 还是用户的 vlog?很多人答 Prompt 优化会陷入「怎么写 chain-of-thought」「few-shot 给几个例子」的技术路径。但 B 站的场景不一样——他们要的不是通用的 prompt 技巧,而是对特定视频类型(旅游、赛车)的理解如何转化为 prompt 设计。比如赛车 vlog:你需要让 AI 识别出发车瞬间、弯道超车、冲线、引擎声的变化——这些跟普通视频完全不同的语义单元。prompt 优化本质上是领域知识的编码。面试技巧: 如果只是说「我会写详细 prompt + 迭代」,你就掉了。应该先追问「你们现在最头疼的视频类型是什么?prompt 在哪个环节出的问题最多?」——把问题域先定清楚,再谈方案。拆解二:音画不同步问了两次——第一次问「知不知道」,第二次问「怎么解」Q2 第一次问是 check 你有没有这个意识。Q5 第二次问才是真正的技术考察。面试官的升维路线:「有这个问题」→「有没有音频和视频拆开来的方法?」→ 他在引导你去想架构层面的解耦。把音视频拆开处理,本质上是在问你对多模态 pipeline 的理解:• 音频流走 ASR + 说话人分离 → 产出带时间戳的文本• 视频流走场景检测 + 目标追踪 → 产出事件锚点• 两端在时间轴上对齐 → 解决偏移这个拆解的思路,比你直接说「我会调节偏移参数」高了不止一个 level。教训: 重复出现的问题不是面试官忘了,是他在换角度测你的深度。答浅了第一遍,第二遍必须升维。拆解三:候选人的模型调研回答,堪称教科书Q7 的回答是整个面经里最有价值的一段。候选人的模型调研框架:需求分析 → 市场调研+学术调研 → 性能成本评估 → POC → 技术指标评估而且他不是在背名字——他说出了模型之间的分工:• 视频理解用多模态大模型(Video-LLaMA, Gemini)• 音频用专门的 TTS/语音克隆(F5-TTS, Fish Speech)• ASR 用 Whisper/Parakeet• 说话人分离用 pyannote这展示了一个核心能力:知道什么任务用什么工具。 AI 产品经理不需要会写模型代码,但必须知道技术方案的边界——什么时候用大模型,什么时候用小模型的组合,什么时候调 API 就够。面试中可以用的话术模板: 「我的选型逻辑是——先定场景,再看 API 成熟度,然后开源自部署做差异化。比如 XX 场景,商业 API 的准确率已经够了,但 YY 场景需要微调开源模型,因为……」拆解四:Q8 的回答暴露了一个高阶产品思维面试官问:「除了内容角度,还有哪些方面?」候选人答了四个维度:结构化元数据、视听语言、用户偏好、版权合规。这个回答好在哪里?他跳出了「我帮你剪视频」的工具思维,进入了「我理解你的视频为什么火」的平台思维。
查看8道真题和解析
点赞 评论 收藏
分享
牛客网
牛客网在线编程
牛客网题解
牛客企业服务