JIWOO担 level
获赞
30
粉丝
13
关注
8
看过 TA
450
香港科技大学(广州)
2027
算法工程师
IP属地:广东
Anything but you
私信
关注
算法: 一、算法题 & 代码思路滑动窗口最大值的解题思路是什么?为什么选择使用双端队列?双端队列维护了哪些内容、具备什么性质?口述讲解这道题的整体思路(被judge怀疑写力扣不够多了)八股:二、大大模型模型预训练流程一个开源大模型在预训练过程中会经历哪些步骤?你是从哪些方面、哪些渠道学习并理解这些预训练知识的?(可能这里开始质疑我有点背答案的逻辑了)BERT 和 GPT 架构最核心、最本质的区别是什么?四、简历拷打开始从项目去拷问:你所理解的视频理解是粗粒度总结,还是细粒度描述?能否捕捉动作的开始、过程、结束?固定摄像头场景单一有限,用大模型做事件判断性价比是否不高?简单任务(如闯入检测)是否用小模型、路由、MoE 架构更合适?这种情况下,使用视觉大模型(VLM)的意义在哪里?用大模型做数据预标注,为后续小模型服务,这套思路是否合理?大模型在工业落地中,真正的性价比体现在什么地方?五、反问1,公司业务是否会涉及视频细粒度动作理解?不只是判断 “动作是否发生”,还要精确识别动作发生次数,避免重复扣费、误扣费这类问题。回答:确实有这类细粒度视频理解与识别需求,核心是精准、不重复、不误判。目前业界 / 团队常用方案:用多个专用小模型组合,针对特定任务做定制化小模型。采用 MoE(混合专家模型) 架构,但不是简单路由,路由逻辑需要专门设计,用来解决特定任务。现在也在探索:利用大模型 / 大语言模型的能力,提升复用性,希望换任务也能快速适配,减少重复开发,因此在尝试搭建新架构。2. 关于细粒度视频数据 & 数据集构建训练这些细粒度识别小模型时,数据和标注是怎么获取 / 构建的?回答:采集行业真实数据主要流程:采集行业真实数据 → 交给外包公司标注(YOLO、分割等常规标注)。模型上线部署后,把线上回传的困难样本 / 错误样本再人工补充标注。整体思路:先众包 / 外包大规模标注再人工筛选、修正难例,是业界比较经典的做法。3,面试官一般怎么判断面试者有没有背稿、有没有用辅助工具?回答:看表达一致性真实做过的人,叙述风格、逻辑是统一的;背稿 / 套话,容易在切换问题时风格断裂、内容漂浮。看是否聚焦问题本身真懂的人会顺着问题深入聊;套答案的人容易答非所问、逻辑不连贯。紧张很正常面试少、科研多的同学容易紧张,多面几次就会像日常学术聊天一样自然。建议把面试当成和老师 / 教授学术讨论,懂就说懂,不懂就坦诚,重点看人岗匹配。大概率寄了,就当聊聊天
查看16道真题和解析
0 点赞 评论 收藏
分享
自我介绍以后开始拷问:项目:1,如何做到筛选视频困难样本的(只有这个答得有点曲折,也记不清项目里面是怎么做的了,其他答得还好的都记不清了,后面也知道了这个经历和公司业务内容强相关)八股:A。面试官说先从Python基础问起(问之前还确认了我用C还是用Python):1,Python里面可变对象跟不可变对象的一个区别,及其含义,以及模型训练当中怎么用2,Python里面可变对象包括什么,元组算不算可变对象3,对上一个的follow up:可变对象和不可变对象的本质区别?也即list能不能作为哈希表的key?(可能因为上一个问题答得隔靴搔痒没有切中面试官的心意)4,什么是全局解释器锁GIL,在这种情况下怎么进行多线程编程5,什么情况下会用多进程什么时候会用多线程6,多进程之间做并发的话怎么去做数据共享以及同步互斥(一开始自己回答了Lock,后来面试官提示是多线程之间做的并发,于是端上了Event和Semaphore Quene等)7,了解过Python装饰器的作用吗,在代码里面有没有用过,它的原理是什么8,Python在数据处理当中常见的性能优化手段9,10个T的视频数据浏(浏览数据或者点赞数据),想去统计这些数(每个视频的观看人数和点击人数)。这个东西用Python来写的话,会怎么去写(后续补充:在本地的机上面处理,而不是说用分布式那种那个来处理。10个T还不至于一定要上分布式)B,计网:1,HTTP跟HTTPS区别和联系C,数据库1,了解数据库事务吗,简单讲讲2,LEFT JOIN 和INNER JOIN的区别(但是本人对数据库实在不熟不知道有没有听错问啥……)D,大模型Transformer里面会用那个Flas Attention跟那个Paged Attention去优化,它们的那个区别跟那个原理是什么代码手撕:最长回文子串,不过是直接返回子串面试官看我补全代码以后捉了点bug就没说别的了,问了问时间复杂度以及有没有比动归更好的解法(此外我听过一个说法,说如果面试官直接问你hot100原题就是很想招你进来了,我不清楚)反问环节:1,这个实习岗位具体做什么?业务场景是什么?——主要围绕 TikTok 直播的音视频内容理解与标签体系建设。在连麦、试音等场景下,对内容进行识别后自动打玩法/分类/风格等标签。目标是提升标签质量(准确率/覆盖率等)并推动自动化。工作会包含线上推理服务与工程链路设计,配合策略/算法团队做模型与策略调优2,使用什么模型对数据打标签?开源还是闭源?——同时会做开源与闭源大模型的对比实验,效果好的方案会通过实验与切流获得更多流量。根据内容来看感觉这个应该是加了AI调用和提示词工程的python后端开发,整体更偏工程,也无怪乎大模型这块也就问了这么点btw喜茶的提拉米苏浓巧好喝
查看17道真题和解析
0 点赞 评论 收藏
分享

创作者周榜

更多
关注他的用户也关注了:
牛客网
牛客网在线编程
牛客网题解
牛客企业服务