首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
Jasonfintech
门头沟学院 Java
发布于浙江
关注
已关注
取消关注
@子虚乌有先生:
招商银行2022精英训练营数据赛道面经
TimeLine:笔试202204??,面试20220517,线下比赛20220701-20220703当时的BG:北邮本硕,管理类专业,两段实习经历:字节数据分析师、美团商业分析师写在前面的话:以下问题的答案可能存在错误,敬请读者批评指正笔试笔试为期两周,数据赛道的笔试内容是训练模型进行线上打榜(形式很像kaggle上的比赛),分为A榜和B榜,A榜数据集的正负样本分布相对均匀,B榜数据集的分布相对失衡,最终得分为A榜得分和B榜得分的加权和,Github上应该有笔试题目和代码,读者可自行搜索笔试前200名有奖金,打不到前200名也没事,训练营的录取结果会综合各方面因素进行判定面试面试时时间紧凑,问题接踵而来,没有特别长的思考时间1.请简述一下数据赛道线上打榜的建模思路1)先查看各特征的缺失比例,缺失比例过高(>=50%)的特征直接舍弃,剩余特征的缺失值用均值/众数填充2)判定各特征的线性相关性,对于存在较强相关性的一对特征,保留其中相关系数绝对值均值较低的那一个3)对于正负样本不均衡的情况,采取重采样的方法4)连续性特征分箱,离散性特征作one-hot/get_dummy5)拆分训练集和测试集,开交叉验证,训练LightGBM分类器,根据ROC曲线下AUC评估模型表现6)预测test_A和test_B的结果注:当时的回答非常简陋,仅供读者参考,读者可至其他平台搜索更详细的建模思路2. 缺失值的处理方法1)舍弃2)均值/中位数填充,众数填充3)插值法填充4)机器学习模型填充(要填充的特征作label,剩余特征作features,训练模型来预测)3. 正负样本不均衡的处理方法1)采用ROC曲线下AUC作为分类判定标准,该指标不会受到样本集分布不均衡的影响此处有追问:为什么AUC不会受到样本集分布不均衡的影响?假设负样本扩大10倍,且扩大后的负样本与原负样本分布一致TPR不受影响FPR的分母扩大10倍(FP和TN本质上都是负样本),分子也扩大10倍(扩大负样本分布同原来一致,因此扩大负样本中被判定为FP的样本也近似扩大10倍),因此FPR的结果近似不受影响2)过采样和欠采样(基于数据的方法)过采样,即增加少数类样本集的样本量,如SMOTE算法、Tomek Links算法等欠采样,即减少多数类样本集的样本量,如Easy Ensemble算法、NearMiss算法等3)调整正负样本的权重惩罚(基于算法的方法)改变模型训练时的目标函数,对少数类样本分类赋高权重,多数类样本分类赋低权重4)转化为单类学习、异常检测(基于算法的方法)4.请简述一下支持向量机SVM实现二分类,基本思想是在特征空间中寻找间隔最大的分离超平面使数据得到高效的二分类,主要有三种形式:1)训练样本线性可分,使用硬间隔最大化2)训练样本近似线性可分,引入松弛变量,使用软间隔最大化3)训练数据线性不可分时,使用核技巧(把样本从原始空间映射到更高维的特征空间中,使样本在这个高维的特征空间中线性可分)和软间隔最大化5. 简述朴素贝叶斯朴素贝叶斯通过贝叶斯公式计算样本属于某一类别的概率,朴素体现在:1)特征条件独立性假设,即假设各特征之间相互独立2)假设各特征同等重要6. 简述XGBoost本质上是GBDT,XGB力争将速度和效率发挥极致,因此被称为Extreme Gradient Boosting(极端梯度提升机)。不论是GBDT还是XGB,都属于集成思想中的boosting流派,即不断生成树,每生成一棵新树都是在拟合前一棵树的预测残差,在预测新样本时综合各棵树的预测结果即可注:此回答没有答到点子上,读者自行搜索相关资料以形成自己的观点7. 简述梯度下降函数在梯度方向的方向导数取得最大值,也就是说,函数在梯度方向增加得最快,在逆梯度方向减小得最快。在训练机器学习模型时,我们总是希望模型的损失函数越小越好,因此我们会选择逆梯度方向对参数进行更新,梯度下降具体包括随机梯度下降、小批量梯度下降和批量梯度下降8. 请简要介绍一下聚类算法有哪些?1)Hierarchical methods:层次聚类,有两种路径——自下而上(agglomerative),先将所有样本的每个点都看成一个簇,然后合并两个最相似的簇,不断重复到预定簇数或者其他终止条件;自上而下(divisive),先将所有样本当作一整个簇,然后找出簇中距离最远的两个簇进行分裂,不断重复到预期簇或者其他终止条件2)Partition-based methods,例如:KMeans等3)Density-based methods,例如:DBSCAN等4)Model-based methods,例如:高斯混合模型GMM等9. 对于深度学习的了解如何?10. 与美团实习经历相关的问题,此处略11. 场景题:如何构建对公客户(企业客户)用户画像?搭建指标体系如下:1)行业属性,不同行业有着不同的市场结构、运作模式和规律,调研目标企业在其行业的发展情况,如企业收入、企业目标用户、企业生命周期2)企业属性:企业成立时间、资金规模、人员规模等注:完全没接触过这种问题,回答得乱七八糟12. 腾讯是一个国民级的APP,如何评价这款APP?通过搭建指标体系的方式来评价,指标体系如下:1)社交价值:人均好友数、好友互动率2)消费价值:日活、留存3)生产价值:人均投稿数、投稿渗透率4)广告主价值:ARPU5)社会价值:生活服务的渗透率此处有追问:简述一下搭建这个指标体系的思路?1)社交价值:微信是国民级社交APP的典型代表,可联想到与社交好友相关的指标2)消费价值:微信本质上也是一款产品,每天都在被用户所”消费“,可联想到日活、留存等消费指标3)生产价值:微信提供了诸如公众号、视频号、直播等UGC入口,给予用户生产内容的权利,可联想到与生产相关的指标4)广告主价值:微信同样提供了诸多广告的资源位,在公众号和朋友圈经常看见广告,可联想到ARPU这类广告指标5)社会价值:微信提供了如企业微信、理财、缴费、出行等诸多生活服务的功能,可联想到这些功能的渗透率线下比赛一共分为三期进行,前两期为研发赛道,第三期为产品赛道和数据赛道产品赛道和数据赛道的同学会共同合作完成一个项目,时间非常紧凑,有极大可能性需要通宵数据赛道的同学除了向产品赛道的同学提供数据方面的内容输出以外,还有打榜的要求比赛表现优异的同学可直接获得招商银行总行的金融科技生offer
点赞 19
评论 4
全部评论
推荐
最新
楼层
暂无评论,快来抢首评~
相关推荐
10-11 16:11
门头沟学院 Java
作业帮 Timeline
一面:9月13日二面:9月26日HR 面:10月10日HR 面第二天官网流程状态转为面试都已完成一面:实习 + 常规八股 + 三道算法题二面:实习 + 场景 + 一道算法HR 面:常规HR面,问了下手里还有哪些
26届秋招投递记录
点赞
评论
收藏
分享
09-28 10:39
已编辑
这我必须挂你了
2025.9.28补:觉得是我不该投递,是我的原因的,请直接拉黑?你没海投过算你牛逼,算你双九学历不缺人要,您别上牛客,这全是loser秋招焦虑仔,你海投过你喷我?什么低能儿,我是你仇人?
秋招投简历提醒助手:
一开始还觉得是正常交流。直到一看薪资4-6😨
点赞
评论
收藏
分享
昨天 10:59
已编辑
门头沟学院 C++
招银网络科技vs开立医疗
招银网络科技 开立医疗base深圳深圳薪酬27w30w公积金比例 16000的12%12000的6%加班制度无加班费 调休无加班费无调休风评不咋地不咋地餐补有餐补 无免费三餐 引流:华为、腾讯、小米、大华、海康威视、禾望电气、汇川、阳光电源、富特科技、台达、金升阳、首航新能源、维谛技术,固德威,锦浪,科士达,英威腾,古瑞瓦特,科华,上能电气,易事特,特变电工,特来电,麦格米特,盛弘电气,长城电源,山特、宁德时代,亿纬锂能,欣旺达,德赛电池,鹏辉能源,国轩高科、海康威视、联电、理想、比亚迪、吉利、长安、蔚来、小鹏、禾赛、速腾、镭神、北醒、万集。瑞晟、艾为电子、柏楚、TI、联想、复旦微电子、圣邦微...
迷茫的大四🐶:
这肯定无脑招银了
offer帮选
点赞
评论
收藏
分享
评论
点赞成功,聊一聊 >
点赞
收藏
分享
评论
提到的真题
返回内容
全站热榜
更多
1
...
从摆烂到OC,嵌入式人的血泪史
4525
2
...
害,找工作哪有不上当的!
4476
3
...
找到靠谱的公司,少走些弯路
3368
4
...
双非秋招大厂time line参考
3186
5
...
最近面试回答不出来的题
2922
6
...
26国考公告出炉,放宽到38岁意味着什么
2910
7
...
末9四段大厂实习|秋招收尾结束
2836
8
...
牛牛求救🆘,不敢梭哈后端第二技能点怎么搭配
2343
9
...
京东官宣发布新车,会有新的HC吗?
2217
10
...
下一站回家
2150
创作者周榜
更多
正在热议
更多
#
找工作中的小确幸
#
10262次浏览
97人参与
#
秋招踩过的“雷”,希望你别再踩
#
19488次浏览
221人参与
#
爱玛科技集团求职进展汇总
#
30099次浏览
209人参与
#
面包vs爱情,怎么选?
#
16983次浏览
187人参与
#
实习在多还是在精
#
3039次浏览
44人参与
#
发面经攒人品
#
2347489次浏览
32649人参与
#
反问环节如何提问
#
106929次浏览
2008人参与
#
实习下班不想学习,正常吗?
#
3421次浏览
48人参与
#
机械求职避坑tips
#
67303次浏览
449人参与
#
校招谈薪一定要知道的事
#
3217次浏览
53人参与
#
你觉得什么岗位会被AI替代
#
4739次浏览
83人参与
#
贝壳求职进展汇总
#
36254次浏览
202人参与
#
机械人值得去的小众企业
#
24349次浏览
54人参与
#
浪潮求职进展汇总
#
17890次浏览
137人参与
#
秋招结束之后的日子
#
88736次浏览
986人参与
#
实习最想跑路的瞬间
#
81963次浏览
524人参与
#
你做过哪些dirty work
#
19926次浏览
143人参与
#
选完offer后,你后悔学机械吗?
#
39421次浏览
243人参与
#
投格力的你,拿到offer了吗?
#
119217次浏览
686人参与
#
诺瓦星云求职进展汇总
#
219939次浏览
1715人参与
#
机械人,签完三方你在忙什么?
#
61725次浏览
235人参与
牛客网
牛客网在线编程
牛客网题解
牛客企业服务