【面经】平安科技 数据分析实习(录)
投递+约面:2天
面试形式:电话
面试时长:1h
说是数据分析,但业务内容偏向数据挖掘和机器学习,对算法理论和python有比较高的要求
无自我介绍
Q1:围绕第一段实习,介绍工作内容,对SQL任务自动编排和quickBI可视化感兴趣
Q2:围绕第二段实习,介绍工作内容,对XGBOOST时序预测模型感兴趣
Q3:XGBOOST的原理,公式,boosting算法优势劣势,决策树分类方式
Q4:XGBOOST和随机森林和逻辑回归各自的优缺点
Q5:怎么做feature筛选,介绍IV\WOE方法,介绍XGBOOST的feature importance原理
Q6:聚类KMEANS怎么确定K的数量(从业务层面和机器学习层面),EM算法,KMEANS和EM之间的联系
Q7:机器学习用过的开源数据库和library,常用的数据分析软件会哪些
Q8:python对列表不想做for循环如何实现循环(filter map),什么是filter,有没有比filter更简单的循环实现(没答出来)
Q9:pandas更改数据类型(astype)
Q10:pandas对整列赋值(apply.lambda)
Q11:python随机shuffle函数的原理以及内层逻辑代码复现(randomint)
Q12:反问 工作内容、偏技术还是偏分析(技术)、工作软件(非取数师偏算法和自然语言处理)、工作时长(9-6)
反思
名义上的数据分析岗实际上是算法岗,和之前面的数据分析都不一样非常喜欢挖算法原理和公式,基本都是考察对机器学习理论的理解
面试官考了很多的python的原理,用他的话来说就是现在人人都会写python,但我们要的是真正懂python为什么能这样写的人,所以单纯的调包侠或者只会用可能就很难答上
我XGBOOST的feature importance都不是很熟,因为有这样的指标就直接拿来用了,还是要去看一下背后的原理是什么
python对pandas可以进行的一系列操作都要去记熟,很爱考这种数据清洗
面完两个小时面试官说走流程下offer,但又说走流程要两周才能拿到,挺奇怪的可能留有咕咕的余地。不过我确实不太想去德勤(和自身未来规划不符),哈啰又太远了租不起房(今天给拒了),就拿着平安每天祈祷B站能捞我吧。
#实习##内推##平安科技#