实习面经分享（腾讯/字节/阿里/美团)

从1月初开始准备实习（刷题+面经），经历了最初的忐忑到如今几近尘埃落定，期间得到了不少身边朋友的帮助，也从牛友的面经中学到了不少，因此也想分享一下个人的面试经历，希望对大家有所帮助。

基本情况

--------------------------------------

至4.15全部更新完毕，感谢小伙伴们的支持

腾讯投的最晚但是最早开始面试，一面时准备不够充分，好多答的都不好，不过也查漏补缺了很多东西。二面面试官很nice，很会引导，体验很棒。

自我介绍
论文及项目（聊了图网络的发展，论文的motivation和实现细节）
CF的特点：
- 优点：快，不需要上下文特征
- 缺点：冷启动（所以要结合图）
长尾问题怎么处理
CF和DSSM的区别？（不是很了解DSSM，答不清楚）
LR推导（代码复现（train, loss, predict)【搞不定，基于推导写了伪代码，勉强过】
MF的实现，有哪些优化方式（特征值【必须是方阵】，SVD【不适合稀疏场景，复杂度高】，SGD；）梯度怎么求；怎么让MF训练的更快（没搞懂，答的是控制lr，顺便说了一下lr的调参要点）？
算法题：给一个graph，求其中三角的个数（clique的最小单位）（做社交网络的部门所以问图相关的）【类似lc1761】

刚起床就突击电话面。。感觉答得一般般😭

面试节奏紧凑，效率很高。很注重项目中的具体细节。

自我介绍（面试官确认了下个人研究方向）
项目，Graph Embedding怎么做的（讲了论文的内容）
召回和排序的区别（特征使用数量、效率、模型复杂度等角度阐述）
DeepFM与FM
知识图谱学习得到的Graph Embedding是用于召回还是排序（召回）（1.有噪声；2.因为对于传统观点的召回来说，精准并不是最重要的目标，找出和用户兴趣有一定程度相关性但是又具备泛化性能的物品是召回侧的重点，所以可能知识图谱的模式更适合将知识图谱放在召回侧。）
讲一下项目中用到的强化学习。（A2C，讲了原理，实现细节）
算法题：
- 快排代码（讲了下如何使得最坏情况也能O(nlogn)
- n * m 矩阵给定左上角和右下角求面积（O(1))【CV中经常用到】。
概率：A、B是两个服从0-1均匀分布的随机变量。求E[max(A,B)]。
反问：部门业务方向做哪些，有没有结合图谱（个人想做这方向）

自我介绍
论文细节及项目
项目中的特征工程用到了哪些
deepFM相关：
- 的模型结构是怎么样的（Wide & Deep -> DeepFM角度讲）
- 权重参数共享吗、如何预训练？
- 输入的embedding包括哪些？分别怎么处理？
FM和FFM（参数量，特征交互）
word2vec具体怎么做的（skip-gram，CBOW，学习目标是权重参数矩阵；loss是交叉熵，负采样、层级softmax）
你印象最深的近几年的一些推荐方面的成果。聊了CF方面的新成果。
其他的推荐模型了解吗。（双塔，CTR方面讲了DIN）
过拟合怎么处理。（5种）
比较一下GCN和GAT。（从复杂度、效果上等作了比较，感觉答的一般）
比较一下传统的Embedding方法和Graph Embedding。（真实数据也是图结构，冷启动，交互更丰富）
交叉熵损失函数
算法题：给定一个arr，和最小间隔k，找出满足最小间隔k的a,b两个数使得a+b值最大。（我的解法，存储每个点的leftmax和rightmax，然后一轮循环求最大；感觉空间复杂度还可以优化）
无反问*2
面试结束后不久通知HR面