美团 配送 算法岗 面经

一面(70min)
1 介绍一下你的研究方向
2 这两个项目讲一下
3 实习说一下
4 我觉得很适合,那我们做两道题吧,最长递增序列
5 五个外卖,先取后送,一共十个点,有多少种排列组合情况
6 java里static意味着什么
7 final意味着什么,final标记的类实体中属性值是否可以修改?
8 你还有什么问题吗

二面(75min)
1 介绍一下你的研究方向
2 如何看待simulation与实际情况的gap
3 你觉得外卖配送难点在哪
4 压单合包问题你有什么想法
5 记不清了,主要围绕他们组的合包问题在讨论

三面(80min)
1 介绍下研究方向
2 讲一下你这篇论文
3 你的这种方法怎么和高级方法结合,你这个1秒内求得解,但我现在只要求五秒,剩下4秒你做什么
4 做一个优化项目你的套路是什么,经验是什么
5 你觉得项目中最大的问题是什么
6 围绕运筹学和配送里面的订单骑手匹配问题聊了很久
7 你还有什么问题?
8 加一下你微信吧?

HR面(30min)
1 自我介绍
2 实习经历说一下
3 说一下你最拿得出手的事
4 说下你在项目中遇到的最大困难,你怎么解决的,学到了什么
5 导师怎么评价你
6 还跟哪几个公司再谈
7 意向工作地点
8 能来实习吗?何时毕业

技术加面(60min)
1 自我介绍
2 方法详细讲一下
3 你大件仿真模型的经验和心得
4 做学术遇到的最大困难,怎么解决的
5 项目和学术结合怎么做
6 问题中的随机性怎么处理,gps不准,天气多变?
7 你未来两年内的规划
8 怎么实现你的规划,你都准备做哪些事
9 现在还在跟哪些公司谈
10 你还有什么问题吗

目前还没发放意向书

九月初,二面面试官让去公司交流下,一直有事,拖到明天,希望一切顺利。

9月23 意向书get

#美团##算法工程师##面经##校招#
全部评论
我跟你投的应该一样。‘五个外卖,先取后送’那个问题我也被问过,不过我答得不好。三面总体表现更不好,半个小时结束了。大佬面试时间都那么长了,还要加面,看来我凉了。
点赞 回复 分享
发布于 2019-09-24 12:02
我们应该是一个部门,面试官讲了很多他们的业务场景。。
点赞 回复 分享
发布于 2019-09-23 23:44
大佬交流回来结果咋样呀~
点赞 回复 分享
发布于 2019-09-18 19:58
大佬tql
点赞 回复 分享
发布于 2019-09-17 23:58
北大大佬
点赞 回复 分享
发布于 2019-09-17 23:53
xl大佬
点赞 回复 分享
发布于 2019-09-17 23:51

相关推荐

搜推+大模型算法一面面试题SFT & RL 方向先 answer 后 cot vs 先 cot 后 answer:两种 SFT 范式在训练效果上有什么差异?你是否做过对比实验?标注质量管控:如何保证人工标注数据的准确率达到预期标准?有哪些校验或质控手段?Checkpoint 选择:如何挑选合适的 SFT checkpoint,用于后续的 RLHF 阶段?多模态输入:图片是如何输入到 VLM 模型中的?一张图片通常会被编码为多少个 token?RL vs SFT:你认为强化学习(RL)和监督微调(SFT)的核心区别是什么?训练范式选择:为什么不直接从零开始做 RL,而是要采用「SFT → RL」的两阶段流程?RL 关键机制:什么是重要性采样?为什么在 RL 训练中要引入 CLIP 机制?策略类型差异:On-policy 和 Off-policy 算法的核心区别是什么?各自的适用场景有哪些?八股文(Transformer 基础)因果掩码作用:Transformer Decoder 中为什么必须使用自回归因果掩码?缩放点积注意力:为什么注意力分数要除以d​k​?(补充:Layernorm 前置后,除以d​可将方差归一到 1,避免 softmax 梯度饱和)推荐系统方向生成式推荐 vs 传统推荐:两者的核心区别是什么?生成式推荐的目标是什么?你如何看待它的未来发展前景?指标计算:AUC、HR、NDCG 的计算公式分别是什么?GAUC 和 AUC 的区别在哪里?编码方式:如何在模型中加入时间编码和位置编码?常用的位置编码方法有哪些?Coding:手撕 Multi-Head Attention(MHA) 实现二面面试题SFT & CoT 细节概率分布特性:在「先 cot 后 answer」的 SFT 范式下,为什么越靠后的 token 概率(prob)会越高?蒸馏噪声处理:用大模型蒸馏得到的 CoT 数据存在大量噪声,该如何缓解?VLM 幻觉问题:对 VLM 做 SFT 时,发现模型更信任文本信息,看图时反而容易产生幻觉,有哪些解决思路?RL 进阶PPO 核心:写出 PPO 中 GAE 的公式,并说明如何递归计算每个 token 的优势函数(advantage)?DPO 损失:写出 DPO 算法的损失函数公式?算法对比:GRPO 和 PPO 的核心区别是什么?GSPO 和 GRPO 又有哪些不同?训练稳定性:你遇到过 RL 中的熵塌缩(entropy collapse)和 reward hacking 问题吗?分别有哪些改进方法?最近有哪些新论文提出了新方案?采样困境:在采样类 RL 算法中,on-policy rollout 无法得到正确答案时该怎么办?自蒸馏:了解 Self-Distillation 吗?为什么要做自蒸馏?最近这方向有哪些代表性论文?震荡优化:RL 训练中 reward 或 loss 震荡严重,该如何调整?(提示:可从学习率 lr、KL 散度约束等方向入手)推荐系统进阶结构对比:HSTU 和 Transformer 结构的差异是什么?它和 OneRec 的整体流程有什么不同?SID 优化:如何降低 SID 碰撞率,同时提高特征利用率?量化算法:RQ-VAE 和 RQ-Kmeans 的算法原理分别是什么?OneRec 工程:OneRec 中是如何将 SID 加入模型词表和 tokenizer 的?多模态融合:如何更好地结合文本特征和多模态特征?模型演进:Rankmixer 是如何发展到 Tokenmixer 的?Coding:给定一个行内严格递增的 m×n 矩阵,找到矩阵中第 k 大的数
面试官最爱问的 AI 问...
点赞 评论 收藏
分享
评论
5
50
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务