美团 机器学习/数据挖掘算法工程师 一二面面经 已回人才库版
本来都觉得没希望了,最后是暑期实习批次中第三个志愿被捞起来的
一面
时间:2025.5.22
时长:1h,视频面
部门业务:核心本地商业-基础研发平台,业务风控算法
围绕简历项目进行提问:
- 项目及数据集简介,数据预处理过程是否发现脏数据或缺失值,如何从原始数据进行加工得到想要的特征的,举例用户年纪这种特征如何使用的,是否有研究用户画像,对用户年纪如何分桶
- 文本和图片怎么建模转化为embedding的,模型选择,是否了解多模态特征提取其他架构
- 原始数据的维度,最终加工了多少特征,之前提到的对用户年纪进行分桶,分桶有几种处理方法,每一桶都当做一个单独的特征去处理,最终对每一个数据维度进行处理的话,得到的结果是有多少页?
- 介绍一下ESMM框架,CTR和CVR任务是如何通过这个框架进行联合建模的
- CTR提升的评估,base model的选取,最终效果的比对
- 简单介绍一下Transformer里attention底层原理,给定一个向量,如何经过QKV三个矩阵的变换,得到下一层的向量输出。缩放的概念,为什么是除以根号dk而不是其他
- 传统机器学习中的有监督模型,介绍一下SVM、LightGBM
- 是否有用过大模型相关的
代码题:
- 买卖股票的最佳时机
- 合并两个有序数组
反问:
- 部门具体业务:解决的是核心本地商业相关的一些业务在运行当中出现的一些风险问题,对异常行为进行处置
- 风控算法了解的知识体系:传统机器学习、深度学习、大模型都有涉及
二面
时间:2025.5.28
时长:20min,视频面
问了一些个人相关的基础
- 研究生期间研究方向及介绍(和面试官讲了相当久的计算机视觉)包括定义、数据集等
- 简历项目简单介绍,eCPM英文全称
- 是否有过大模型经验
问得相当水,也不知道想干嘛,到6.4自动回人才库了