大厂面经|腾讯 AI Lab NLP 算法岗

✅一面
1️⃣时间:1h+自我介绍
2️⃣项目介绍:问的很细,过程中不停打断提问算法竞赛项目,整体数据处理流程、模型效果评估方法、心得体会
3️⃣八股:简单介绍一下 BERT 和 TransformerAttention 和 self-attention 有什么区别?
4️⃣Transformer 的复杂度Bert 用的什么位置编码,为什么要用正弦余弦来做位置编码?还知道其他哪些位置编码?
5️⃣除了 bert 还做过哪些模型的微调?为什么现在的大模型大多是 decoder-only 的架构?
6️⃣讲一下生成式语言模型的工作机理用过 LoRA 吗?讲一下原理?
7️⃣算法题最大子段和跳台阶其他问后续安排和实习时长,以及反问
✅二面
1️⃣自我介绍
2️⃣项目:深挖八股Transformer 结构和 LSTM 的区别和优势,Transformer 怎么体现时序信息?
3️⃣Transformer Encoder 和 Decoder 的输入输出和结构BatchNorm 更多用在视觉上,LayerNorm 更多用在语言上,为什么有没 chatGLM,LLaMA 等部署、微调经历?
4️⃣有没有了解过大模型加速推理?
5️⃣讲一下 Flash Attention?
6️⃣算法题先说思路再写代码
1、数组中的第K个最大元素
2、数组 nums 表示若干个区间的集合,请你合并所有重叠的区间,并返回一个不重叠的区间数组,该数组需恰好覆盖输入中的所有区间。输入: nums =[[1,3],[2,6],[8,10],[15,18]]输出:[[1,6],[8,10],[15,18]]
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
全部评论
八股文真多啊
点赞 回复 分享
发布于 04-18 14:19 四川

相关推荐

昨天 12:54
已编辑
丰乡小学 全栈开发
积功德职位描述:1. 负责机器学习、深度学习等算法在得物业务场景的产品化工作2. 包括但不限于如下方向:目标检测,图像分割,图像分类,NLP,多模态,大模型等职位要求:1. 熟悉Linux环境开发,熟练掌握 Python 语言,有较强的编码能力2. 熟练使用一种深度学习框架如Pytorch、TensorFlow等,熟悉OpenCV、NumPy、Pandas等常用库3. 对云原生有一定了解,有容器化使用经验者优先4. 有GPU编程经验、熟悉算法模型部署、 TensorRT 优化工具者优先5. 图像处理、模式识别、计算机视觉、计算机图形学、机器学习等计算机相关专业在读研究生优先一面(2025.7.10)30minHR发给我的邮件是上午 11 点,我 11 点进会议等了半个多小时没人退出去了,12 点多的时候,HR微信联系我说怎么没进飞书会议,然后我赶紧爬起来进会议。。。搞忘了,日本和国内有一个小时时差,麻了。。。1. 面试官进来直接说你的简历我已经看过了,自我介绍一下吧2. 几乎是纯聊天。。。面试官说我的经历非常匹配(暗示)3. 大模型有没有推理优化经验?无,我说以前主要做CV算法,接触和使用过扩散模型,这也算CV大模型🤗4. 我们来做个算法题吧。我:OK🫡。最大子数组和(秒了🥵)5. 硕士研究内容?6. 偏向算法还是调度?有没有调度相关经验?无。。。7. 你们推理部署是怎么做的?我介绍了自己之前负责和参与过的GPU侧和端侧的推理部署8. 写过CUDA吗?熟不熟?学校里深入学过,之后因为业务关系,没啥使用场景,可以再捡起来9. 你还做过AIGC?有没有NLP相关经验?基本的概念和算法比如 tf-idf, n-gram,word2vec 这些都是知道的,做过文本分类任务,了解 Transformer、CLIP10. 有没有多卡推理优化经验?有多卡训练经验,多卡推理没做过。。。11. 问什么时候能来实习?答最快这月底就能到岗,3个月时间可以保证,每周5天12. 你知道岗位base地吗,能接受吗?我说就是期望在国内实习,上海完全能接受,表现出很想去的意愿🤣13. 反问:组内主要业务场景?商品内容理解、文本理解、AI鉴定商品真伪、推理优化等。学聪明了,面试官框框介绍完,我添一句“那还是挺期待的”🤣,疯狂暗示一面面试官貌似就是老大,结束后HR直接说过了,进offer流程。。。今年暑期准备就去这个了,主要是面试官和善,面试体验好、务实,其余都是次要的(没认真找,随便投投,攒攒面试经验,我觉得现在找工作看眼缘、看运气。本来想着回家吃饭睡觉的 日本饭好难吃啊。。。
查看11道真题和解析
点赞 评论 收藏
分享
1️⃣抖音一面1、聊项目。2、AUC的两种公式是?你能证明这两种等价的吗?3、BERT-CRF中,为什么要加CRF?好处是?4、self-attention为什么要用QKV三个矩阵,不用有什么问题?有没有哪个模型的Q和K矩阵是一样的?5、reinforce属于on-policy还是off-policy?为什么?6、reinforce带上baseline好处是?reinforce的loss写一下?7、策略梯度会推导吗?简单写一下?8、代码题(代码题一般别着急写,先跟面试官说下思路,确定了再写):lc 46,全排列(lc表示leetcode,下同)。lc 73,矩阵置0。2️⃣抖音二面1、介绍项目。2、知识蒸馏有哪几种?你觉得哪种效果最好?3、nlp的数据增强方法,主要有哪几种?每一种举个例子?4、分类的损失函数为什么是交叉熵而不是mse?5、BERT对输入文本的长度有什么限制,为什么要限制长度呢?6、BigBird里面有哪几种注意力机制?相比原始transformer的self-attention的优势?7、场景题:如何根据拼多多的商品数量,估计淘宝的商品数量?8、给出emb_size, max_len, vocab_size, ff_inner_size,num_heads, 12层,求BERT参数量。9、代码题:n皇后问题。3️⃣抖音三面‍1、简单聊项目。2、CRF和HMM区别?CRF为什么比HMM效果好?3、如果BERT词表很大,比如vocab_size达到几百万,怎么办?4、快速手写一些transformer的mha(多头注意力),伪代码意思一下就行。5、为什么对比学习中,temperature很小,而知识蒸馏的temperature比较大?6、你觉得在抖音买东西,和淘宝、拼多多他们的区别是?(我没在抖音买过,就只能现场编。)7、你最近看到过哪些paper?简单介绍下?8、你觉得自己有那些优缺点?平时喜欢怎么缓解压力?📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
查看26道真题和解析
点赞 评论 收藏
分享
评论
4
28
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务