23秋招—猿辅导——数据分析(oc)

时间:9.4

问题:

一位小哥面试官,基本上来一直问业务题,节奏比较快

  • 快手部门的组织架构和上下游对接情况
  • 两段实习的取数需求、看板工作等的比重
  • 实习工作内容有差异,自己的倾向----分析比重更大
  • sql和python说思路

表中有user_id 和 friend_id,一共包括100人,去计算最小关系网

  • 预测--1000份面试的样本,抽象出特征,去做预测候选人是否通过的模型,怎么搭建?

(这个开放问题秋招竟然被问过两次,可以准备一下)

  • 试听课,家长还是小朋友的意愿更重,怎么去论证?

① 回答家长更重要,整体的想法是控制变量,在控制小孩子的指标下,去看家长的表现对课堂结果的影响

②小孩子指标(课堂回答率+课后作业完成率+课堂情绪捕捉等)

家长的指标(基本:家长年龄、城市等级、学历水平;行为:购课意愿、是否与班主任助教有交流等)

③第二个想法

○ 高志愿家长低志愿学生>低志愿家长高志愿学生

中低表现的小孩子,高意愿家长仍然转化率更高

面试后的反思新思路:

○ 可以通过决策树等模型的特征重要性去衡量:按照划分决策树的过程中选择特征的先后顺序来判断特征的重要性,或者在sklearn中有一个feature_importances_属性可以输出特征的重要性;

○ 借鉴投票机制,选择一种分类模型,分别训练出在两类特征下的分类器,并在测试集中验证正确率

i. 在训练数据集D下分别训练出四个分类器,每个分类器都是关于单特征的分类器,如分类器是关于小朋友的特征;

ii. 在测试集下分别测试四个分类器的分类效果,并统计正确分类个数分别表示四个特征下的正确分类数;

iii. 对第二步求出的做归一化处理,即可得到特征的权重。

○ 考虑利用缺一法来求得特征权重(适合4个以上的特征),过程如下:

i. 在训练数据集D下,分别训练缺少了第个特征的分类器,如分类器的特征为{收入,有房子,婚否};

ii. 在测试集下分别测试四个分类器的分类效果,并统计错误分类个数分别表示四个特征下的错误分类数。

iii. 对第二步求出的做归一化处理,即可得到特征的权重

  • 控制变量的时候,如果上述存在交叉影响如何排除,比如小孩上课的兴趣会影响到家长的意愿等

  • 试听课结束后,会有考试,怎么评估考试对后续报课是正向还是负向的影响?(类ab)

○ 去选定没有考试的实验组和有考试的对照组,做ab实验,看指标是否显著

○ 实验组:某期小朋友的课程,不设置考试

○ 对照组:往期根据家长、孩子特征(城市等级、教育背景、手机价格等)聚类出的相似人群,有考试

○ 指标选取:核心--报课转化率;辅助指标--听课率,上课回答率,作业完成率等

  • 衡量效果--京东做了618活动,618当时会有销售峰值,但此后两个月也会带来一个购买低谷,同时前期也投入了大量的营销等成本,如何衡量618的这个增量效果值得?

○ 指标就是GMV,用ROI评估活动本身是否增值,同时用618活动的6-8月一季度的gmv,与平时不做活动的6-8月销售额做对比,看是否增长

○ 平时gmv确定:用往年没进行618活动的每月gmv曲线,去拟合当年的数据,对不做活动的几月gmv做出预测,时间序列(往年是还是一个增量市场,可能一直涌入新用户,是用户增长带来6月销售额增多,而不是6月本身消费需求拉高了;时间序列)

总结:

1.非常非常注重业务思维,全程都在抛出一个又一个开放题,去对猿辅导斑马少儿课基本的业务流程要有了解,提前做下功课,找找指标量化

2.让我反思特别多的一场面试,上面的答案有的是我自己面试后复盘写的,思路可以参考,也欢迎交流

另外根据反馈,猿辅导的斑马线还是非常稳定的,其中数分分了增长方向/教研方向/产品方向等,可能有差池,记不太清了。政策影响不大,特别是字节叫停了一些教育线后,基本在少儿教育某些领域是绝对佼佼者,现在也在用户增长中,而且比较wlb,听说不加班,团队氛围很友好。

#数据人的面试交流地#
全部评论
所以这是三面的面经吗?感觉好难
1
送花
回复 分享
发布于 2022-12-21 19:15 上海
可以分享一下最小关系网的计算吗
1
送花
回复 分享
发布于 2023-01-15 12:28 河南
国泰君安
校招火热招聘中
官网直投
牛客为什么空行没法显示呢,我很费解
点赞
送花
回复 分享
发布于 2022-11-17 22:40 辽宁

相关推荐

#数据分析#6.3号之后面了四家,分别是哈啰、滴滴、菜鸟、蔚来,很多常规的问题都忘了,放一些还记得的1、哈啰6.4号一面:两道SQL:每个班级均分最高的学科、次日留存率6.5号二面:项目细节(项目难点、强调独立负责的部分、有没有独立完成的项目)为什么不做程序员职业规划、实习规划6.11oc2、滴滴6.5一面:项目(介绍并深挖、异动分析、项目成果、个人贡献、提出了什么建议、如何落地并回收效果)风控场景:如何识别恶意刷低分的用户6.7二面:项目(深挖、特别深,结合具体场景如何分析、给出建议和策略、如何监控和回收效果)风控场景:如何识别羊毛党、众包场景如何应对【滴滴面试官都很好很温柔,问得很细致深入,考察分析思维很多,很可惜二面没过,一面面试官说是稳定性问题,要主动表示可以在杭州长期发展+足够长的实习时间TT不能太老实没问就不说】3、菜鸟6.7一面:项目(介绍分析思路、异动分析、个人贡献、是否有独立项目)SQL口述思路:三个排序窗口函数的区别,四道SQL题职业规划、实习规划二面还没约,流程很慢4、蔚来6.11一面:项目(分析思路、贡献、难点和问题如何解决、异动分析)场景题:电商店铺的指标体系如何构建SQL:关注人和被关注人的表,返回互关的用户;sql改错:要理解业务场景,筛选条件出现的位置、窗口函数的语法6.12二面:上一段实习的工作、项目蔚来用户社区模块的指标分析为什么换实习、有别的offer吗?二面后oc反问(必问)面试表现,有无建议,面试官给出的:口述项目和SQL的逻辑要清晰,场景分析时可以思考后再回答,不用着急回答部门业务,主要接触的数据是什么,日常偏向数据处理还是分析,使用数据工具有哪些、占比多少最后,找实习开始得实在是太晚了,从5月27号开始到现在过了三周,错过了重要的时机,很多大厂已经接近尾声,捞人也是看运气,而我偏偏是那种运气很差的那种人,尤其是得知面试官说实力很ok但是没有表现出自己的稳定性时。没有找到能够转正的暑期实习确实让人很焦虑难过,但是还是要去做事,去做能做的一切。不要让负面情绪占领自己的想法,反而给自己能达到的高度设限了。。。#数据分析# #25届暑期实习# #数据分析求职#
查看16道真题和解析 25届暑期实习
点赞 评论 收藏
分享
9 46 评论
分享
牛客网
牛客企业服务