京东寻猎提前批算法岗面经_牛客网

不要葱花的黑眼圈很想喝咖啡

黑龙江护理高等专科学校数据分析师发布于上海

关注

@云晞：京东寻猎提前批算法岗面经

应小伙伴的需求分享一下京东提前批算法岗的面经，目前已offer~  我当时提前批投的是数分，面试官觉得我更加适合算法，询问了我的意见后把title改成了算法。非常幸运能遇到我的两位技术面面试官和hr小姐姐，面试官人都非常nice，碰到回答不上来的问题会耐心引导，还让我不要紧张哈哈哈。  楼主自身的base是机器学习、自然语言处理和优化，所以面试时这方面涉及的多一些。   当时二面完记录了一下所以比较全，一面和hr面没有及时记录已经找不到通话记录了，可以做一点点参考。   京东一面 30min (问项目)  【面试的通话记录遗失了，做一下简单的回顾】 自我介绍，对实习的两个项目及细节进行了细致的询问。 最后问了一个概率题：如果我们部门有16个人抢一个大红包，用一枚均匀的六面骰子，如何保证每个人的获奖的概率是一样的？ 简单回答了一下，将16个人编号并分成4组，投到1则第1组通过第一轮，投到2则第2组通过第一轮，投到3则第3组通过第一轮，投到4则第4组通过第一轮，投到5或6则重新投。接着，对过了第一轮的4名同事重新编号并再投掷一次骰子，投到1则同事1获得大奖，投到2则同事2获得大奖，投到3则同事3获得大奖，投到4则同事4获得大奖，投到5或者6则重投。  京东二面 30min (问机器学习基础知识)  先做一下自我介绍。 1 机器学习 1.1 岭回归和Lasso 1.1.1 岭回归和Lasso的区别？ Lasso是加 L1 penalty，也就是绝对值；岭回归是加 L2 penalty，也就是二范数。从贝叶斯角度看，L1 正则项等价于参数 w 的先验概率分布满足拉普拉斯分布，而 L2 正则项等价于参数 w 的先验概率分布满足高斯分布。从优化求解来看，岭回归可以使用梯度为零求出闭式解，而 Lasso 由于存在绝对值，在 0 处不可导，只能使用 Proximal Mapping 迭代求最优解。从结果上看，L1 正则项会使得权重比较稀疏，即存在许多 0 值；L2 正则项会使权重比较小，即存在很多接近 0 的值。  1.1.2 什么时候用哪个更好？ L1 正则项可以用来做特征选择，如果只是防止过拟合的话两者都可以。  1.1.3 从几何上来看有什么区别？ 岭回归在坐标轴上是个圆，Lasso 是个菱形。  1.1.4 penalty在不同形状下为什么会产生这个效果呢？（稀疏/权重小） 不知道。  2 运筹优化 2.1 简单讲一下分支定界 没接触过，简单讲了一下我们学的优化内容，一阶算法、二阶算法、KKT、对偶、鞅。面试官说我们学的可能偏最优化，不是运筹。 3 自然语言处理 3.1 简单介绍一下自然语言处理方面最主流的算法 自然语言处理的话 Seq2Seq 系列的模型会使用的比较多一些，最开始提出了序列模型 RNN，后来人们发现比较慢，效果不太好，并且存在梯度消失的问题，使用 LSTM、GRU 之类的模型一定程度上改善了这一问题，但还是没有根本解决。之后又有人提出了 Attention，借鉴 Information Query 领域的知识提出了一套新的模型，根治了梯度消失的问题，也就是Transformer。最近比较火的 BERT 是借鉴 Transformer 和 ELMo 提出来的，在此基础上又有人做了优化，提出了ALBERT。还有一个比较火的模型是 XLNet，结合了 ELMo 和 BERT 的优点，将 Auto-Regressive 模型改成了双向结构。  3.2 解释一下梯度消失的原因 RNN 其实还是基于反向传播的模型，这种模型本质上是一层一层的 f(wx+b) 套起来，根据链式法则反向传播求梯度的时候会存在累乘之前层的权重的现象。当层数越多，也即 RNN 的链越长，如果 w 的值比较小，乘很多次就接近 0 了，也就是梯度消失；如果 w 的值比较大，也即大于 1，乘很多次就接近正无穷了，也就是梯度爆炸。  3.3 如果把激活函数全都换成线性函数，会出现什么问题 如果把激活函数全都换成线性函数会失去非线性性，退化为一个线性回归。如果是分类问题最后有一个 sigmoid 层，则退化为逻辑回归。深度学习能起作用的本质原因就是使用了非线性的激活函数，从而通过很多神经元可以拟合任意一个函数。  3.4 如何评估一个模型的好坏？ 有一些指标能够帮助我们评估模型的好坏，例如对于分类问题可以使用 Accuracy、Precision、Recall、F1、Confusion Matrix、AUC 等；对于回归问题可以使用 RMSE、R2 等；对于文本聚类问题可以使用 Perplexity 等。对于文本生成模型，也可以采用人工评价的方式，例如对于机器翻译，可以将两个模型的翻译结果随机指派给一些志愿者，让他们评价哪个模型翻译得更好，得出一个统计的结论。  3.5 简单介绍一下ROC和AUC 我们得到混淆矩阵后，可以计算出 TPR 和 FPR ，然后用 FPR 做横轴，TPR 做纵轴，画出一条 FPR-TPR 曲线，就是 ROC 曲线，ROC 曲线下方的面积就是 AUC。我们计算 AUC 的时候可以根据定义取多个 threshold，用矩形的面积来拟合曲线下面积。但是在实际使用中，这种算法效率很低，因为对于每一个 threshold 都需要计算 TP、TN、FP、FN，实际过程中人们是使用 rank 来做，我稍微看过一下源码，但是没有深入研究这一部分。  3.6 AUC 的含义是什么 这个问题没有回答上来……答案应该是：假设从所有正样本中随机选取一个样本，把该样本预测为正样本的概率为 p1，从所有负样本中随机选取一个样本，把该样本预测为正样本的概率为p0，p1 > p0 的概率就是 AUC。  4 供应链管理 4.1 说明一下 EOQ 模型的假设，计算过程和结果 EOQ 模型假设每个时间的需求为常数，也即需求随时间是线性累加的。假设存在两种类型的成本，一个是订货成本，也即定一次货需要的成本，比如不管定多少货，都需要一次卡车运输的人力和交通成本；一个是持货成本，比如保存库存的过程中需要支付的租金等。我们的目标是最小化这两部分成本之和，也就是 (k+cQ)*d/Q+1/2hQ，关于Q是一条双曲线，根据梯度为零可以求出最优解是 \sqrt(2kd/hc)。=====更新=====EOQ模型的假设1. 只考虑一个商品     > 多产品联合补货2. 及时补货    > leadtime3. 常数需求速率    > 随机需求，增加安全库存4. 一个订单一次运送5. 供应商只提供单一平稳价格    > 折扣(全量/边际)6. 不能缺货    > 增加变量x：backorder比率============= 4.2 对库存管理的概念 我对库存管理可能没有一个比较 high level 的概念，我们工程实现主要做的是决策每天要定什么货，每个sku定多少，定完之后应该放在哪个货架上，出库的时候从哪个货架出库。  5 数据库 & SQL & hive 5.1 使用 groupby 的时候最容易出问题的点？ 没出过问题……面试官说我sql使用的比较少  6  python 6.1 python 常用的 string format 形式 print(str(a)) print("%d" % a) print("{}".format(a)) 面试官说还有一种，没接触过……==== 更新 ====百度到的string format形式a. %号    print("%d" % a)b. str.format # python2.6+    print("{}".format(a))c. f-string  # python3.6+    print(f"{a}")d. 标准库模板 # python2.4+    from string import Template    name='EGON'    t = Template('Hello $name!')    res=t.substitute(name=name)    print(res)  # Hello EGON!注：总结四种方式的应用场景a. 如果格式化的字符串是由用户输入的，那么基于安全性考虑，推荐使用Templateb. 如果使用的python3.6+版本的解释器，推荐使用f-Stingsc. 如果要兼容python2.x版本的python解释器，推荐使用str.formatd. 如果不是测试的代码，不推荐使用%=============  6.2 pandas 如果要做比较复杂的列操作时，怎么操作？ 我平时使用 apply 函数，如果操作比较简单，直接使用 lambda 函数，如果比较复杂，就在外面写一个函数 fuc，然后在 apply 里面调用那个函数，例如 df.apply(fuc)。  最后反问了一下问题，然后面试官问了一下base是不是期望在北京。  京东hr面 30min (传统行为面，问了一点项目)  【忘记录音了，做一下简单的回顾】 首先介绍一下自己。  简单讲一下自己印象最深刻的实习。  介绍一下自己做过的最有挑战的事情。  实习的项目和美团、饿了么配送任务中间的差别，有没有看过他们的解决方案。  你对我们部门有什么了解？  hr介绍了一下部门的数据分析师和算法工程师的定义，问我更倾向于哪个方面。我说更倾向算法方向，她说那之后发offer把title改成算法工程师。  问了一下现在有在实习吗？我说马上要开学了，如果需要实习的话到时候和导师商量一下，她让我联系Joy老师就可以。  反问了一下流程，说大概8月初会出结果，正式offer发放要等一下集团的流程。

点赞 16

评论 7

全部评论

推荐最新楼层

昨天 00:07

华南理工大学演员/配音/模特

被猿辅导挂了简历，但我想说...

我真麻了鸭，真的被拒麻了，猿辅导直接简历挂，🐀🐀属实是不知何去何从了。投递简历到现在，每一次都铩羽而归，互联网真的不能给🐀🐀一个机会吗？对猿辅导祛魅了。

投递猿辅导等公司10个岗位

点赞评论收藏

分享

07-27 23:23

门头沟学院数据仓库

二本26应届生想九月份找java实习

目前靠关系在一家保险公司的运营中心实习【数据分析】，感觉不太喜欢现在这个行业，目前java还差一小部分没学完，现在恶补三个月能找到实习吗

点赞评论收藏

分享

07-03 16:13

嘉应学院 Python

请问这个是骗子吗😂

xiaolihuam...：很明显骗子，如果是hr直接约你面试了，哪用得着内推，如果是员工的话，你得多优秀，一线员工直接加你微信，

点赞评论收藏

分享

07-26 20:32

门头沟学院 Java

26届简历重大突破（其实并不）

好消息，学院本终于把点评换掉了；坏消息，也就仅此而已了这简历真的能投了吗，好像怎么看都不像是能投的吧喂emm也许有重大突破的其实是我的精神状态下限。。。？

简历中的项目经历要怎么写

点赞评论收藏

分享

07-28 11:22

快手_快STAR广告引擎(准入职员工)

🙋🏻‍♀️面试： 一共四面，其实只用三面，中间自己争取从偏前线的岗位往中台策略转，所以额外再增加了一面；可能本地生活这块业务确认，挺紧凑的，听HR说很长没看到面试结果全A的候选人了。 🙋🏻‍♀️入职： 接offer👉🏻背调👉🏻结果确认👉🏻到岗前填信息👉🏻入职当天参与培训领电脑👉🏻到用人部门**。嗯😐非常长，长到不想再来一遍那种🥹那种接了offer好像又没接的感觉，家人们谁懂！ 🙋🏻‍♀️工作体验： 啊就是非常的卷…晚上十点可能才有机会下班，入职前第一周了解到，我们部门实习生两三个月来都是十一二点下班🥹怎么说呢工作日是不配拥有生活的，那种洗头都觉得懒，玩手机...

快手公司福利 971人发布

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 简历上的经历如何包装 #

28914次浏览 812人参与

# 秋招被确诊为…… #

163815次浏览 751人参与

# 中兴秋招 #

205407次浏览 2292人参与

# 工作中哪个瞬间让你想离职 #

63341次浏览 569人参与

# 你最希望上岸的公司是？ #

135075次浏览 705人参与

# 和同事相处最忌讳的是__ #

24125次浏览 244人参与

# 25届网易互娱暑实进度 #

78381次浏览 702人参与

# 虾皮求职进展汇总 #

249184次浏览 1851人参与

# 投格力的你，拿到offer了吗？ #

86650次浏览 583人参与

# 2022毕业即失业取暖地 #

102687次浏览 662人参与

# 2022毕业生求职现身说法 #

89258次浏览 700人参与

# 秋招OC许愿 #

327769次浏览 2450人参与

# 你最近一次加班是什么时候？ #

70986次浏览 350人参与

# 26届的你，投了哪些公司？ #

43983次浏览 490人参与

# 你的秋招第一面感觉怎么样 #

76795次浏览 591人参与

# 柠檬微趣工作体验 #

6702次浏览 40人参与

# 你遇到最难的面试题目是_ #

16465次浏览 199人参与

# 我对___祛魅了 #

47743次浏览 435人参与

# 地平线求职进展汇总 #

52640次浏览 369人参与

# 研究所VS国企，该如何选 #

194794次浏览 1819人参与

# 如果校招重来我最想改变的是 #

271845次浏览 2850人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务