首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
牛客145335972号
北京邮电大学 算法工程师
发布于北京
关注
已关注
取消关注
@苏学算法:
2023届校招算法岗知识超全总结
又是一年「金三银四」,在此为今年校招的同学准备了一份笔面试经验大礼包。 去年我发过一篇 论机械狗如何硬卷算法岗,主要是机械转互联网的经验分享。 本文主要面向搜推广nlp岗位的同学。 总体而言,个人认为算法岗要找的好,除了本身的长期积累沉淀的硬实力之外(Paper,比赛,实习,项目),主要考核的就是两个方面的能力:基础扎实程度和前沿知识广度。 文章内容包括四个部分:基础能力(基础扎实程度)、搜推知识(前沿知识广度)、nlp知识(前沿知识广度)、总结。其中,基础部分变化不大,前沿知识部分相较于我当年校招时变化较大,在此做了更新,希望能够帮助到大家。 1. 基础能力 1.1 Coding基础 Leetcode刷200题+剑指offer(可在牛客网刷),尤其是链表、树、动规。做信息竞赛的可忽略。这部分其实在笔试阶段和一面阶段都会涉及,是考核基础能力的关键一环。尤其是一面的时候,如果没有做出来代码题,其实挺影响面试官给分的。题目难度视具体情况而变,大部分情况下"中等题"即可,当然实习和校招、不同公司都会有所差别。如果是博士,这个环节可能不会做硬性要求。 1.2 机器学习基础 机器学习基础变化不大。当年我主要看的李航老师的统计学习方法(LR,SVM,EM,最大熵,集成学习等)),值得反复看好几遍,每一遍都会加深理解;尤其是学习理论:贝叶斯决策理论/假设空间概念/经验风险, 结构风险/各类损失函数之间的区别与联系/极大似然估计, 最大后验估计, 贝叶斯估计的区别与联系。此外,还涉及一些通用的基础能力,例如: 树模型系列论文深入理解,gbdt,xgboost,lightgbm,catboost; 深度学习基础:过拟合问题、收敛性问题,dropout,bn,ln等;学习器,各种optimizer原理及对比;BP原理;各种激活函数等,最好用numpy手写一遍MLP,包括train+infer。 评估体系:Precision, RecallF1, AUC, ndcg,涉及如何选择、指标的内涵、指标和样本分布关系、离线验证等。 这个部分重点关注原理+推导。 关于面试重点: 树模型知识:很爱问的知识。推荐wepon大神的总结:GBDT算法原理与系统设计简介:http://wepon.me/files/gbdt.pdf,这份资料似乎链接打不开了。 贝叶斯决策理论个人觉得非常重要,是机器学习/深度学习等各类学科的基础。这里头最重要的MLE, MAP, 贝叶斯估计的区别与联系,参考李文哲老师的总结:机器学习中的MLE、MAP、贝叶斯估计 1.3 数学基础 数学题,比如贝叶斯公式算后验概率(求概率),优惠券收集问题(求期望),蓄水池问题(采样)等。还包括一些偏智力的题。这类问题主要难在理解题意,对数学中的概率/期望/微积分/极限等知识点会有些要求。之前看到的部分概率题总结,排版有点问题,凑合着看一些题型。有时间可以复习下概统、线代等课程,没时间可以看看别人的总结,比如:互联网面试概率题总结:https://blog.csdn.net/BertDai/article/details/78070092 1.4 工程/大数据基础 如大数据处理或分布式系统原理等。对于大数据题,如:海量数据求中位数等,主要涉及到哈希,堆,bit等数据结构,外加map-reduce编程范式的灵活应用。这类题型的总结百度一下非常多。 2. 搜推广知识 找搜索推荐广告岗位的同学,这部分的学习要同时关注工业界和学术界,尽量从工业界的应用入手,来看看都用了哪些学术界的成果。这部分在面试过程也是必考核的点。 2.1 按照模型演进 传统的方法:LR+GBDT(facebook文章),FM,FFM,LambdaMART。 深度学习的方法:Youtube DNN,Wide & Deep,DeepFM,DIN等。 图模型在推荐上的应用:GE、GNN。 可参考我的万字推荐系统/排序学习和图模型调研(推荐阅读⭐) 推荐系统调研:http://xtf615.com/2018/05/03/recommender-system-survey/ 排序学习调研:http://xtf615.com/2018/12/25/learning-to-rank/ 万字长文 | 图表示学习中的Encoder-Decoder框架 2.2 按照系统漏斗 笔者近年来阅读过的经典文章,值得读一读,对面试很有帮助。 查询理解:搜索上重要模块 业界盘点|Query理解在搜索中的落地技巧 全面理解搜索query:https://zhuanlan.zhihu.com/p/112719984 召回:主要涉及向量化召回、样本选取的艺术、双塔模型、多兴趣召回,还涉及模型索引联合建模等 样本构造:负样本为王:评Facebook的向量化召回算法,召回模型中的负样本构造 向量召回:KDD'21 | 揭秘Facebook升级版语义搜索技术,KDD'21 | 淘宝搜索中语义向量检索技术 多兴趣召回:推荐系统多兴趣召回最新进展 双塔召回:双塔召回模型的前世今生(上),双塔召回模型的前世今生(下) 模型索引联合建模:阿里深度树匹配召回体系演进,字节跳动Deep Retrieval召回模型笔记,TDM到二向箔:阿里妈妈展示广告Match底层技术架构演进 粗排:涉及全链路一致性、双塔粗排、对比学习、蒸馏等 阿里广告技术新突破:面向最终目标的全链路一致性建模 久别重逢话双塔 张俊林:从对比学习视角,重新审视推荐系统的召回粗排模型 知识蒸馏在推荐系统中的应用 精排 阿里妈妈搜索广告预估模型2021思考与实践 万字长文梳理CTR点击预估模型发展过程与关系图谱 你真的懂CTR建模吗? 阿里妈妈搜索广告瘦身之路? 重排 重排序调研 KDD'20 | Airbnb搜索多样化重排序 可以关注一些公众号:推荐道、阿里妈妈技术、美团技术团队、RUC BOX、DataFunTalk、机器学习与推荐算法、图与推荐等,了解业界最新动向。 2.3 按照技术方向 特征工程 谈推荐系统特征工程中的几个高级技巧 特征交互 一文梳理基于Graph的特征交互在CTR预估中的应用 特征交互新路线|阿里 Co-action Network论文解读 多目标建模:ESMM、MMoE、ESSM,PLE等。 多目标学习在推荐系统的应用: https://zhuanlan.zhihu.com/p/291406172 【推荐系统多任务学习MTL】ESMM 论文精读笔记(含代码实现) 【推荐系统多任务学习MTL】MMoE论文精读笔记(含代码实现) 长短期序列建模:DIN、DIEN、SIM、MIMN等。 浅谈行为序列建模 用户行为序列建模方法调研 Recsys'21 | 基于Transformers的行为序列建模 多兴趣建模:MIND、ComiRec等。 推荐系统多兴趣召回最新进展 图模型 2W字长文:漫谈图神经网络推荐系统 对比学习 谈推荐场景下的对比学习 张俊林:从对比学习视角,重新审视推荐系统的召回粗排模型 冷启动 新用户冷启推荐技巧总结 冷启动系统优化与内容潜力预估实践 多模态 十篇文章速览多模态推荐系统的最新进展 因果推断 快手因果推断与实验设计 清华崔鹏 | 因果推断发展、思考和推荐系统应用 其它的方向:模型蒸馏,纠偏、跨域推荐、元学习、多模态等。 关于技术方向,推荐公众号 ReadPapers。据我了解,能够非常及时的推送最新的搜推广新文,虽然只是信息的采集,没有深入的解读,但是对于想快速跟进前沿的同学来说很棒。 2.4 实战 深度CTR模型开源项目: DeepCTR: https://github.com/shenweichen/DeepCTR,可以深入了解各类state of the art的模型以及实现代码细节。 图模型开源项目: DGL:Aws开源更新的更频繁,支持多种深度学习框架,可能更值得关注; PyG:斯坦福开源的pytorch的框架; PGL:百度开源,PaddlePaddle写的; Euler:阿里开源的,可以细致观看各类Encoder实现 (如ShallowEncoder, SageEncoder等);node2vec实现;底层C++图引擎可以关注random walk和alias sampling的实现。仅作为学习。这个框架维护的不够及时,灵活性以及分布式实现上仍然存在很多不足。 各大Top赛事开源方案: KDD 2020 Debias推荐赛题冠军方案 KDD 2021 图模型OGB-LSC开源方案:https://ogb.stanford.edu/kddcup2021/results/ 可以关注一些竞赛大佬的公众号:比如”包包的算法笔记“、”kaggle竞赛宝典“。 3. nlp知识 这部分新工作也是层出不穷,个人可能也没有follow的很快,可能遗漏了一些,可以参考下。 nlp常见的概念:词法、句法、语义等;困惑度等。 了解重要的四大类nlp任务:分类任务、序列标注任务、句子关系判断任务、生成式任务。 传统的模型:语言模型、HMM、CRF、LDA等;当年会问,现在可能不一定会问。 深度学习模型:RNN, Seq2Seq,Transformer。 预训练模型,涉及传统非上下文感知的word2vec系列 (如Glove和PPMI等)、上下文感知的BERT系列、Prompt Tuning、大模型、多模态等。 邱锡鹏老师的survey:PTMs| 2020最新NLP预训练模型综述 从Word Embedding到Bert模型—自然语言处理中的预训练技术发展史: https://zhuanlan.zhihu.com/p/49271699 放弃幻想,全面拥抱Transformer:自然语言处理三大特征抽取器比较: https://zhuanlan.zhihu.com/p/54743941 Prompt Tuning:刘知远老师的分享,Model Knowledge Stimulation with Prompts for Pre-trained Language Models:http://114.215.64.60/~lzy/talks/2021_prompt_tuning_en.pdf 大模型:清华刘知远:大模型「十问」,寻找新范式下的研究方向 多模态预训练:从顶会论文看多模态预训练研究进展 预训练在工业界的应用:相关性模型、交互式BERT/双塔BERT、模型蒸馏、命名实体识别、查询理解等。 对比学习:丹琦女神新作:SimCSE 近年来的其它热点方向,知识图谱,问答QA统一建模,预训练在图像上的应用MAE;MLP/CNN/Transformers之争; 最后推荐一个从各个应用方向出发,follow最新SOTA的网站:http://nlpprogress.com/ 可以关注一些nlp大佬的公众号或博客:苏剑林的博客、夕小遥的卖萌屋、李rumor、高能AI、NewBeeNLP等。 总结 最后总结下,个人认为算法岗要找的好,除了本身的长期积累沉淀的硬实力之外(Paper,比赛,实习,项目),4者至少取其二。 主要考核的就是两个方面的能力: 基础扎实程度 (编程coding基础;ML/DL算法的数学基础):基础扎实意味着围绕某个知识点,面试官不管怎么问,都难不倒。目标是应对笔面试过程中coding以及对知识深度的考察。 前沿知识广度 (follow时下科研趋势,如GNN,BERT,知识图谱,对比学习,因果推断等;以及了解工业界中推荐/搜索/nlp的整体应用和流程等)。以应对面试中的对知识广度、开放性问题的考察。 硬实力有的前提下,这三个方面扎实的话,我觉得拿offer是完全可以的。当然,包括谈吐交流、找对内推人、运气都是技术本身之外非常重要的东西。最近行业变化较大,希望大家都能顺利找到心仪的工作。 最后,需要帮看/改简历和帮内推的同学,欢迎公众号后台私聊我。 更多校招相关文章 超详细|算法岗学习路线大总结 收藏版|最全机器学习优化器Optimizer汇总 阿里一年级算法工程师的工作总结 微软校招面试经历 本硕机械,校招进入腾讯做算法是什么体验 非科班,进入美团做推荐算法是怎样的体验
点赞 25
评论 3
全部评论
推荐
最新
楼层
暂无评论,快来抢首评~
相关推荐
06-02 17:02
蚌埠坦克学院 嵌入式软件开发
嵌入式笔试刷题(第65天)
1. static 有什么用途?至少说明两种答案:限制变量作用域:用于局部变量时,使变量具有静态存储周期,即只初始化一次,但作用域仍限于函数内部。限制函数可见性:用于函数或全局变量时,使其只在当前文件内可见,防止外部文件访问。2. 全局变量和局部变量在内存中是否有区别?如果有,是什么区别?答案:有区别:全局变量:存放在数据段(.data 或 .bss),在程序整个生命周期内存在。局部变量:存放在**栈(stack)**中,随着函数的调用创建,退出后销毁。3. 头文件中的 #ifndef/#define/#endif 是干什么用的?答案:用于防止头文件被重复包含(多次包含同一头文件会导致重复定义...
投递太古地产等公司6个岗位 >
嵌入式笔试专栏
点赞
评论
收藏
分享
05-29 00:08
叠纸游戏_后端开发工程师(准入职员工)
叠纸游戏内推-叠纸游戏内推码
面经分享|叠纸游戏运营自我介绍介绍游戏经历举例说一说,你认为在游戏运营中,玩家的反馈有多重要?你最喜欢哪款游戏?说一说吸引你的原因在游戏设计中,你认为哪些元素是吸引玩家的关键?如果让你设计一款新游戏,你会考虑哪些方面?氛围超好 同事们也很好 很快被接受和融入 每天中午就是跟着实习生朋友和正职姐姐们到处吃饭 吃遍了附近的餐厅🥹下午茶奶茶不断 走的时候Mentor还送了离职礼物 阿叠真的很好很好 搭子是好搭子 带教是好带教 Boss也是好Boss叠纸游戏2025校招春季补录启动,新增26届暑期实习岗位!!!!秋招已投递春招仍可重新投递两个志愿叠纸游戏成立于2013年8月,是一家专注于内容创作的游...
点赞
评论
收藏
分享
05-14 11:04
北京邮电大学 Java
现在才开始找暑期来得及吗
😭准备得太晚了,学校期末考完都5月7号了,之前就只准备了一些,现在hot100都没刷完,也忘了很多了,算法比较薄弱,八股还好一点,背的七七八八了。但是感觉现在找日常没hc,找暑期也没hc了,估计投暑期也只能等被大佬鸽掉的,然后被横向一下。而且现在算法还没怎么刷,对笔试特别恐惧,我看笔试的算法题都好难,感觉参加了就是a0结束
叶扰云倾:
进度更新,现在阿里云面完3面了,感觉3面答得还行,基本都答上了,自己熟悉的地方也说的比较细致,但感觉面试官有点心不在焉
不知道是不是不想要我了,求阿里收留
,我直接秒到岗当阿里孝子,学校那边的房子都退租了,下学期都不回学校,全职猛猛实习半年。
这种条件还不诱人吗难道
然后现在约到了字节的一面和淘天的复活赛,外加猿辅导。华为笔试完没动静。 美团那边之前投了个base广州的,把我流程卡麻了,应该是不怎么招人,我直接简历挂了,现在进了一个正常的后端流程,还在筛选,不知道还有没有hc。
点赞
评论
收藏
分享
04-25 18:13
五邑大学 Java
大二下,急招实习,各位大佬请给点建议。
后来123321:
大二两段实习太厉害了,我现在大二连面试都没有
点赞
评论
收藏
分享
05-28 23:44
Université d’Auvergne-Clermont-Ferrand 1 C++
面试官问项目是自己写的吗该怎么回答?(怎么让面试官感兴趣我的项目)
我们要能明白这个问题,就要首先能明白,什么样的项目,面试官感兴趣呢?我认为哈,面试官感兴趣的程度可以分为如下几个等级: (1)最高级:你做的项目和面试官所在部门工作内容完全重合 (2)次高级:你做的项目用到的技术栈和面试官所在的部门重合或者部分重合 (3)高级:你做的项目,跟面试官表明因为有实际需求才开发的这个,并且让面试官感觉到,确实只有开发个你这项目才能解决你的需求,并且还不得不这样开发。 (4)低级:你说是为了学习,而才做的这个项目,那确实有点垃圾了。不知道这样排序大家认不认可。我来分析下: 如果你做的项目和人家部门一样,那表明你直接有直接上拉就解bug开发的能力,肯定对你这感兴趣。或者...
简历中的项目经历要怎么写
点赞
评论
收藏
分享
评论
点赞成功,聊一聊 >
点赞
收藏
分享
评论
提到的真题
返回内容
全站热榜
更多
1
...
你的经历比较单薄, 但简历又弥补了这一点--双非仔个人简历分享
2114
2
...
字节last day,知无不言!
1824
3
...
六月还有机会的,对吗?
1573
4
...
发现27282届的同学怎么越来越卷了,投个票看看相互的进度吧
1165
5
...
只有收到offer那一刻是开心的
946
6
...
25 暑期实习&秋招面经
868
7
...
答辩时被导师当着所有人的面阴阳
786
8
...
记录一下选择
767
9
...
怎么包装实习经历呢
684
10
...
为什么我的mos管驱动电路总是不听话?(上-基本原理总结)
621
创作者周榜
更多
正在热议
更多
#
写给毕业5年后的自己
#
6945次浏览
123人参与
#
今年形式下双非本找得到工作吗
#
133723次浏览
1007人参与
#
华泰证券Fintech星战营
#
190782次浏览
279人参与
#
职场捅娄子大赛
#
334135次浏览
3370人参与
#
你的秋招第一场笔试是哪家
#
128480次浏览
1399人参与
#
一人一个landing小技巧
#
64928次浏览
1004人参与
#
材料专业就业可以去哪些企业岗位
#
32819次浏览
314人参与
#
汇川技术求职进展汇总
#
120838次浏览
809人参与
#
产品2023笔面经
#
51136次浏览
441人参与
#
哪些公司笔/面试难度大?
#
2535次浏览
19人参与
#
硬件应届生薪资是否普遍偏低?
#
70161次浏览
506人参与
#
我想象的工作vs实际工作
#
470769次浏览
4781人参与
#
今年的你投递了多少份简历才上岸
#
33515次浏览
117人参与
#
通信硬件人社招/春招/实习投递现状
#
24939次浏览
922人参与
#
实习中的菜狗时刻
#
349446次浏览
3218人参与
#
考公VS就业,你怎么选?
#
58635次浏览
393人参与
#
总结:哪家公司面试体验感最差
#
55754次浏览
262人参与
#
工作后会跟朋友渐行渐远吗
#
25758次浏览
191人参与
#
机械人的薪资开到多少,才适合去?
#
107762次浏览
445人参与
#
你的论文盲审过了没?
#
103095次浏览
1468人参与
#
考公还是考研,你怎么选?
#
26004次浏览
131人参与
牛客网
牛客企业服务