实习面经分享(腾讯/字节/阿里/美团)

从1月初开始准备实习(刷题+面经),经历了最初的忐忑到如今几近尘埃落定,期间得到了不少身边朋友的帮助,也从牛友的面经中学到了不少,因此也想分享一下个人的面试经历,希望对大家有所帮助。

基本情况

  • 硕转博(协同过滤/图方向),有项目(协同过滤推荐及强化学习相关),无论文(全部在投)
  • leetcode 400+。(1月开始。top100+腾讯50+剑指offer+面试金典+每日打卡)
  • 面试的全是推荐/广告相关算法岗
  • 3月初开始投递简历,截至目前:
    • 腾讯(PCG):oc
    • 阿里妈妈(搜索广告):oc
    • 字节AI-lab:oc
    • 美团平台:oc
--------------------------------------
至4.15全部更新完毕,感谢小伙伴们的支持

腾讯(PCG)

腾讯投的最晚但是最早开始面试,一面时准备不够充分,好多答的都不好,不过也查漏补缺了很多东西。二面面试官很nice,很会引导,体验很棒。

一面 3.10 (50min)

  • 自我介绍
  • 论文及项目
  • 强化学习排序怎么实现的,除了这种还有没有其他方案
  • 项目中Graph Embedding怎么学的
    • 线上更新周期怎么样
    • 用来做什么(预训练,CF召回)
    • 其他召回算法有什么。
    • 召回算法的选择。
    • 召回方式(多路,Embedding)
  • 算法题:两种宝石,可替换指定次数,求最大子串长度(双指针+记录变化点)
  • 反问

二面 3.12 (50min)

  • 自我介绍
  • 论文及项目(聊了图网络的发展,论文的motivation和实现细节)
  • CF的特点:
    • 优点:快,不需要上下文特征
    • 缺点:冷启动(所以要结合图)
  • 长尾问题怎么处理
  • CF和DSSM的区别 ?(不是很了解DSSM,答不清楚)
  • LR推导(代码复现(train, loss, predict)【搞不定,基于推导写了伪代码,勉强过】
  • MF的实现,有哪些优化方式(特征值【必须是方阵】,SVD【不适合稀疏场景,复杂度高】,SGD;)梯度怎么求;怎么让MF训练的更快(没搞懂,答的是控制lr,顺便说了一下lr的调参要点)?
  • 算法题:给一个graph,求其中三角的个数(clique的最小单位)(做社交网络的部门所以问图相关的)【类似lc1761】

HR面 3.16 (20min)

  • 自我介绍及项目
  • 个人三个性格优点
  • 缺点
  • 对未来的规划
  • 实习及转正base地点
  • 实习时长(一周五天,有点恐怖)

云证 3.18

OC 3.19

阿里妈妈(广告算法团队)

  • 群里加的师兄帮忙内推,人很nice,帮忙看简历还鼓励了不少。
  • 整个面试流程下来感觉阿里很注重基础,而且基本围绕简历考察已掌握的知识。

一面 3.12(90min)

  • 算法2道:(括号匹配 + 找出无序数组中topK最大有序子序列)
  • 概率2(没准备,全跪)
  • 聊简历,项目细节
  • 反问了部门的主要业务有哪些

二面 3.16 (45min)

  • 自我介绍
  • 聊项目及论文细节
  • 算法题*3
    • 题1:二叉树最下层最左节点
    • 题2:大数乘法
    • 题3:丑数
  • 反问
    • 来实习能接触到哪些项目
    • 学习资源

三面 3.24 (37min)

刚起床就突击电话面。。感觉答得一般般😭
  • 开放问题:关于广告投放的问题。建模实现。大概记得问了这几个问题:
    • 如何构建sample
    • 如何建模
    • 输出是怎样的
    • loss用什么
    • 为什么用交叉熵做分类问题
  • 问了下项目和论文。
  • 反问

HR面 4.13 (30min)

  • 自我介绍
  • 简单询问了项目中的一些问题
  • 过去对你影响最大的一件事
  • 保研/考研
  • 实习时间
  • 是否考虑转正
  • 其他offer情况

OC 4.15

字节AI lab

面试节奏紧凑,效率很高。很注重项目中的具体细节。

一面 3.14 (40min)

  • 自我介绍(面试官确认了下个人研究方向)
  • 项目,Graph Embedding怎么做的(讲了论文的内容)
  • 召回和排序的区别(特征使用数量、效率、模型复杂度等角度阐述)
  • DeepFM与FM
  • 知识图谱学习得到的Graph Embedding是用于召回还是排序(召回)(1.有噪声;2.因为对于传统观点的召回来说,精准并不是最重要的目标,找出和用户兴趣有一定程度相关性但是又具备泛化性能的物品是召回侧的重点,所以可能知识图谱的模式更适合将知识图谱放在召回侧。)
  • 讲一下项目中用到的强化学习。(A2C,讲了原理,实现细节)
  • 算法题:
    • 快排代码(讲了下如何使得最坏情况也能O(nlogn)
    • n * m 矩阵给定左上角和右下角求面积(O(1))【CV中经常用到】。
  • 概率:A、B是两个服从0-1均匀分布的随机变量。求E[max(A,B)]。
  • 反问:部门业务方向做哪些,有没有结合图谱(个人想做这方向)

二面 3.14 (50min)

  • 自我介绍
  • 协同过滤的演化(共现矩阵(itemCF, userCF) →MF(泛化)→NCF(高阶交互;非线性)→Graph Embedding (图结构)
  • MF如何泛化(特征提取,从SVD为例讲了一下,感觉一般满意;同时类比了深度学习中过拟合和泛化的情况,感觉还行)
  • 两篇论文
  • 算法题:
    • 题1:lc 1420\. 生成数组;想到dp没写出递推公式,卒
    • 题2:最长上升子序列;写了贪心+二分(O(nlogn))。
  • 无反问:估计是第一题想太久没时间了

三面 3.17 (37min)

  • 自我介绍
  • 论文细节及项目
  • 项目中的特征工程用到了哪些
  • deepFM相关:
    • 的模型结构是怎么样的(Wide & Deep -> DeepFM角度讲)
    • 权重参数共享吗、如何预训练?
    • 输入的embedding包括哪些?分别怎么处理?
  • FM和FFM(参数量,特征交互)
  • word2vec具体怎么做的(skip-gram,CBOW,学习目标是权重参数矩阵;loss是交叉熵,负采样、层级softmax)
  • 你印象最深的近几年的一些推荐方面的成果。聊了CF方面的新成果。
  • 其他的推荐模型了解吗。(双塔,CTR方面讲了DIN)
  • 过拟合怎么处理。(5种)
  • 比较一下GCN和GAT。(从复杂度、效果上等作了比较,感觉答的一般)
  • 比较一下传统的Embedding方法和Graph Embedding。(真实数据也是图结构,冷启动,交互更丰富)
  • 交叉熵损失函数
  • 算法题:给定一个arr,和最小间隔k,找出满足最小间隔k的a,b两个数使得a+b值最大。(我的解法,存储每个点的leftmax和rightmax,然后一轮循环求最大;感觉空间复杂度还可以优化)
  • 无反问*2
  • 面试结束后不久通知HR面

HR面 3.18 (15min)

  • 自我介绍
  • 兴趣爱好
  • 介绍一下学习过程中对你影响最大的一件事
  • 对未来的规划
  • 考虑转正吗
  • 有什么长期坚持的事情
  • 有无其它offer

OC 3.18

美团平台

一面 3.17 (35min)

  • 自我介绍
  • 算法:
    • 快排
    • 链表每k个翻转一次
  • Graph Embedding 方法:randomwalk, node2vec, GCN, GAT,过平滑等问题
  • 论文:实现细节,参数怎么调整,应用情况
  • 反问:业务

二面 3.19 (1h10min)

  • 自我介绍
  • 选一个项目做介绍:
    • 用了哪些特征
    • 数据预处理怎么做的
    • 特征怎么学的
    • RL怎么应用?reward如何定义?
  • 冷启动怎么解决
  • 聊论文
  • 算法:
    • 加油站良好出发点问题(时间O(n), 空间O(1))
    • 做项目最大收益问题
  • 反问:如果来不了实习怎么办?(不会拉黑。。);貌似只有两轮技术面

OC 3.25


#实习##面经##阿里巴巴##腾讯##美团##字节跳动##算法工程师#
全部评论
我懂了。。其实面试除了算法题猜不到,基本上问的理论知识都是从简历里衍生出来的,所以复习是有针对性的
2 回复 分享
发布于 2021-03-20 00:08
想问一下,快排怎么做可以使最坏情况下的时间复杂度仍然是O(nlogn)呢。
1 回复 分享
发布于 2021-03-18 17:36
字节三面那个原题没找到,可以用大小为k-1的滑动窗口+单调队列
点赞 回复 分享
发布于 2022-03-25 16:19
这。。。面试好快啊
点赞 回复 分享
发布于 2021-03-22 14:06
美团上来就是一个leetcode hard,看起来是没hc了😂
点赞 回复 分享
发布于 2021-03-19 09:22
大佬你是博士要毕业了吗?
点赞 回复 分享
发布于 2021-03-18 20:00
百度大佬你投的那个部门
点赞 回复 分享
发布于 2021-03-18 18:46
大佬现在拿到了哪些offer啊?
点赞 回复 分享
发布于 2021-03-18 17:45

相关推荐

03-19 16:46
已编辑
门头沟学院 产品经理
1.主包base上海,但城市偏好北京/上海/杭州皆可,同等情况下prefer北京,但目前研一有课+期末有考试和开题答辩,应该画饼什么时候到岗?以及后续期末左右怎么安排通勤…(还是只考虑base上海?)求建议2.实习垂直度对秋招的影响?主包上一段搜广推策略产品,目前日常入职不到一个月但和上段完全不相关,暑期是尽量找策略向垂直经历还是随便多尝试尝试不同的方向/做自己喜欢的3.各家进度不一致如何平衡?or画饼的入职时间是否能cover掉这块的选择风险?(叠buff-虽然可能根本找不到暑期,但仍然抱着能选的心态来问)什么时候可以安心前往拿到的暑期ofr,目前感受是各家进度差异比较大,担心如果接了某个没那么满意的ofr后续又面到心选,很想allin一家做一段深度的实习,但个人又是心态比较焦虑所以担心因为时间安排的不合适错过其他机会。。toomany questions…….——————-mark主包的个人情况2本9硕商科 1中厂策略产品1大厂产运投递进度:大概投了20+岗位了 allin产品 基本不考虑ai产品面试情况:字节两个月内挂了六场腾讯目前挂了两场京东挂了一场百度将面未面中个人体感是自己面试比较弱 经常一面挂,对过往的项目不管是参与还是复盘的都不够深(挂了很多次之后依旧…因为很摆)另外只有一段产品实习在卷天卷地的产品里完全不占优势,今年常规产品招的又少所以对后续暑期&秋招产生了深深的焦虑主包经常在自己还行和不行之间反复横跳,不清楚自己的核心竞争力在哪,但不论如何找工作都是不断认识自己、不断成长的过程,或许没有好与不好,人生很长很长职业道路也很长,只有适合自己的最重要(心态好的时候就这样安慰自己…希望所有找暑期焦虑的宝宝也能这样想 and最后肯定会有非常好的结果的and主包金融转互联网,并未完全放弃金融,但没有投现在开的平安&汇丰银行等等的暑期(投完互联网已经累了..)如果后续秋招金融形势好可能考虑回投行/行研/银行等等等工作,也希望跟差不多情况的宝宝交流关于金融&互联网的职业选择和后续的退出路径!
产品人求职现状
点赞 评论 收藏
分享
日期:2026.3.26时长:约40mins面试官:算法工程师(也许是)面试岗位:算法工程师 实习岗工作地:上海内容1 面试官自我介绍2 (我)自我介绍(追问)实习时长?视实习jd而定,对于……,实习期大概在4-5个月3 简历询问a 学生期间的学习经历有什么?i  本科还是硕士?——》都介绍一下ii 本科期间学校对我们专业的培养目标是……,所以我们会学数学、化学、英语、机械、力学、……。在研究生期间,主要学习的课程可以自行选择,我的主修课程主要包括环境感知、智能导航、传感器、ai及深度学习、数学等课程,研究生的主要研究方向就是……。b 我看你的实习经历有一段……,当时就已经在做agent开发了吧?i  我认为严格意义上那不算agent,当时agent也没有现在这么火,更多的还是一个对内的ai助手demo开发,在功能上基本可用。b(追问)那你对ai了解多少,与llm和agent相关的这些。ii 对于llm还有agent的一些基本原理的概念性东西还是有一定程度了解,比如loRA微调、RLHF(是这个吗?其实我不太记得住这个词,可能当时说错了)、数据集、无监督学习、rag、a2a、skills、tool,Transformer等等。但是如果您问我我具体了解程度,那我只能说基本不了解。因为在我的预估和前期规划中,我的实习期从五月开始,这些东西的学习计划是放在四月的(确实是这样规划的)。那么在这之前,我主要做的是我的毕设和一些基础的学习,比如说强化学习的数学原理、经典强化学习算法、Attention、深度学习底层原理等等。之所以这样规划是因为这些东西是介于我毕设和预估中的实习涉及到的技术落地间的重要知识,需要有层次的递进学习,其次是我需要毕设做到一定程度导师才放实习,因此我的毕设进度大概是……。c 介绍一下你最了解的项目。i  我最了解的是我的毕设……。其中我这也是结合prompt engine做的,其中用于项目开发的skill也开源了。c(追问)你为什么选择PPO而不是其他的模型?你有做过对比吗?ii 我选PPO的原因很简单,首先是PPO相对来说非常成熟,其次是它对超参数不是那么敏感,这样我可以不太用耗费很多时间去调参,此外,ppo的代码实现相对来说也比较简洁,能有效减轻我的工作量,最重要的一点是ppo的鲁棒性相对较强,这个是我比较看中的,因为……。对于其他模型而言,比如TRPO,没记错的话TRPO的一大优点在于其理论上能保证策略性能的严格递增,这点也是很重要的,但是没记错的话,TRPO中有个温度系数还是什么超参数,这个超参数对最终的策略提升有重大影响,如果这个参数没调好,容易让策略走向在最优解附近大幅震荡或无法学习的两个极端,这其实是我不希望出现的。毕竟计算机计算精度始终有限,因此我选用一个算法的目的之一在于在有限的计算时间和计算资源的限制之内能最逼近和无线逼近最优解,因此尽管PPO在理论上的收敛性不如TRPO严谨,但是从实际表现来看ppo反而好不少,他就是我需要的算法。c(追问)你的项目不使用数据集来训练对吧?比如那种生成的数据是无法应用到你的项目中的?iii我的项目可以用数据集,强化学习有通过数据集预训练或者需要采样数据的算法,但是,但是,如果使用数据集,我怎么保证我采集到的数据比强化学习自己的策略更好呢?换句话说,这些数据集需要我再环境中自己去采集,人具有主观性,我不能保证我采集到的数据是没有偏差和人的主观偏好在其中,如果基于有偏差的数据进行训练,那么如何保证最终训练出来的策略是最优策略呢?当然我不是在否定这种方法,现在有很多基于数据集驱动的强化学习,若我采用了这种方法,我就需要考虑……系列问题,这会让我毕设的体量爆炸……。因此,在实际中应该结合现有条件进行选择,最适合的才是最好的。4 手撕一个字符串中包含空格和数字,要求不产生额外存储空间的情况,把所有的数字换到左边,同时字符串长度不变(空格放到末尾保留)。忘了这是力扣哪个题,用了双指针的思路,思路对的但是跑不过用例不知道为什么。5 反问a 算力资源?i (面试官所在的团队)有几张gpub ai coding额度资源?i 这些问问llm就行,实习生估计是没有的(我其实无所谓,常年开的有自己的coding账户)c 组织架构?或者团队的主要工作内容是?i (估计是组织架构不便透露)工作内容:i)基于cv的……检测ii)基于ai的……检测iii)基于ai llm的知识图谱构建(听到这眼前一亮)---------分界线---------大约面试结束30-40分钟左右接到hr电话电话内容总结:1 面试官那边总体满意2 jd是……(听到这觉得jd可以去)3 入职时间及实习期(算了一下,可以去)4 薪资5 手头offer确认(表明0 offer,给了就去,期间也会面其他公司,毕竟我知道这个实习岗没有hc,但打包票的是期间我不会跳走)
梦媛媛:强烈推荐!这个笔记写得很清晰 http://github.com/AccumulateMore/CV
查看9道真题和解析
点赞 评论 收藏
分享
评论
22
153
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务