第4章 第1节 数据分析

推荐给朋友

● 请说一下,你曾经处理过的最大量级数据是多少?处理目的是?你是如何处理的?处理结果如何?

参考回答:

● 下表为某款APP在17年Q2的日均新增用户的渠道数据: 1)根据上表,你能得出哪些结论? 2)17年4月,Android端的渠道A单个新增用户成本为3元,渠道B单个新增用户成本为10元。这批新增用户  的留存率分别为15%(渠道A)和50%(渠道B),付费率分别为5%(渠道A)和20%(渠道B)。那么渠道A    和渠道B的单个留存用户成本和单个付费用户成本分别是多少?假设每个用户付费额一样,哪个渠道的投入产出比更高?(请给出计算过程)"

参考回答:

1)
该款APP在Q2日均新增用户整体呈平稳上升趋势。
Q2安卓总体月均新增用户高于IOS。其中安卓Q2每月新增用户呈下降趋势,IOSQ2每月新增用户呈上升趋势。IOS新增用户来源渠道中,以APPStore为主;安卓新增用户来源渠道中,以A预装渠道和B市场渠道为主。
2)付费率的分母是全部新增用户,还是留存的用户数。我这里就把付费率的分母理解为全部新增用户数。
A:
单个用户留存成本:3/15%=20元
单个付费用户成本:3/5%=60元
B:
单个用户留存成本:10/50%=20元
单个付费用户成本:10/20%=50元
A:
ROI=3/(5%n)=60/n
B:
ROI=10/(20%n)=50/n
A的投入产出比高。

● "如果一款游戏在苹果上线,每个用户每月会花50元,这些人第二个月会留下40%,第三个月会留下20%,他们带来的所有的收入,苹果会拿走30%。 我们最多花多少钱得到一个用户,才能赚钱?假设我们可以用30元获得一个用户,如果我们希望在这个游戏上赚100万利润,我们需要多少用户?需要付出多少广告费?"

参考回答:

● 试估算中国K12课外英语辅导的市场(K12:kindergarten through twelfth grade的简写,是指从幼儿园(Kindergarten,通常5-6岁)到十二年级(grade12,通常17-18岁),在中国等同于小学到高中毕业阶段)。 要求如下: ·请至少使用2种不同的方案来估算,以便能够交叉验证。 ·请详细说明需要获取哪些数据,以及如何获取,并且给出相应数据的估算值。 ·请详细描述如何通过获取到的数据来估算题目的答案,并给出最终的估算值。

参考回答:

方法一:需求端分析
分析问题:
中国K12课外英语辅导的市场,现在中国的学校、家长和学生对于英语学习都很重视,英语辅导是一个强需求,目前学生数量、参培率和收费价格都在提高,从需求端,需要知道中国处于K12的总人数、参与英语培训的人数、英语培训年均花费等。

假定2018年中国K12课外英语辅导的数据如下:
在校中小学生总计2.24亿人(中国14亿人口,中国人均寿命75岁,假设人口按照岁数均匀分布,高中入学率为90%,于K12阶段人群数量=14亿*(9+3*90%)/75=2.184亿);
参与课外培训率为60%(依据常识,参与培训学生);
参与课外培训学生中参与英语辅导率为60%;
英语辅导年均培训费用2000元/人;
据此估算:市场规模:2.184亿*60%*60%*2000=1572.48亿元。

方法二:供给端分析
假定数据如下:
K12教育培训机构中转职英语老师与公立学校英语老师比例为6:4.
全国中小学老师数量:K12前6年师生比为1:20,K12后6年师生比为1:10,那么老师数量=14亿*(6个年级/75岁)*(1/20)+14亿*(3个年级/75岁)*(1/10)+14亿*(3个年级/75岁*90%)*(1/10)=1633.33万(人)

英语老师占比15%,数量=1633.33万*15%=245万(人)
公立学校参与英语辅导的老师的占比15%,数量=245万*15%=36.75万(人)
那么K12教育英语老师总数量为36.75万/40%=91.875万
假定每个老师每年辅导100人次,参与英语培训的学生为91.875万*100=9187.5万人次
每位学生每年英语辅导费用2000元
据此估算:市场规模:9871.5万人*2000元/人=1837.5亿元。

● 以下是某校园公众号8.14-9.12的推送消息打开数,请分析: (1)图中一个月内的数据趋势及其可能的原因 (2)作为产品经理,如何帮助该公众号提高打开率

参考回答:

答案(1):
以7天为一个周期,8.14-9.12历时4周
① 周期内数据趋势及分析:
·每个周期的第四天打开数相对偏低。
可能原因:每周的这一天,用户对该校园公众号不敏感,或者同学的学习生活较忙。
·每个周期的第五天打开数相对前一天,增长较大。
可能原因:每周的这一天,用户对该校园公众号较敏感,或某些周期性事情诱导他们打开。
·每个周期会有两个消息打开数的峰值。
可能原因:学生生活学习具有周期性规律,会影响到公众号的打开。另外,也可能跟公众号定期发布的内容有一定关系。

② 周期间数据趋势及分析:
·第一个周期后,打开数逐步提升
可能原因:由图可得8月21号后,打开率明显提升,推测主要原因为:开学了;
·后面三个周期,打开数稳定在50000左右
可能原因:50000可视为该公众号这一段时间内打开数的稳定值,在没有额外推广运营的情况下,可认为该值趋于一个稳定状态。


答案(2):
帮助该公众号提高打开率的方法
① 影响该公众号打开率的主要因素有:
•文章选题,选题是否是学生关心的,当下的热点(学校/社会)。
•文章标题,标题质量很大程度上决定了文章的打开与否。
•文章内容,内容质量和排版会影响到文章的分享情况。
•内容调性,塑造具有识别性的内容调性有助于培养忠实粉丝。
•运营手段,运用活动等手段可以更好的促进传播。

② 提高提高打开率的方法
•文章选题,生产与校园热点话题相关的内容,例如毕业季,新生开学,四六级等等。
•文章标题,提高标题撰写能力,使用具有吸引力的标题,但尽量不要标题党。
•文章内容,保证高质量的内容输出,可以组织专业写手撰写内容,还可以增加互动内容,刺激用户分享。排版上,要注意排版风格是受众喜欢的。
•内容调性,塑造公众号的价值观和调性,拉近与受众之间的距离,培养忠实粉丝。
•运营手段,适当组织一些线上线下活动,例如联合校园周边商家赠送优惠券等等,促进文章打开和用户活跃。

● 一个女鞋品牌在某电商平台销售,你认为通过哪些数据和方法可以看出销售现状和业务提升。

参考回答:

可以从数据来进行横向对比和纵向对比,并与其它竞争品牌对比:

1. 横向对比:
对比该品牌在不同平台上的月销售量、销售的型号款式、销售额等指标。了解品牌在不同平台的销售状况,以确定针对该平台应采取的营销策略。

2. 纵向对比:
对比该品牌在该平台上的月销售量、销售的型号款式、销售额等指标随时间的变化,同比和环比增长情况,确定属于增长、下降、平稳还是停滞状态。确定品牌在该平台的销售现状。

3. 与竞争品牌对比
对比在该平台上竞争品牌的销售情况,包括月销售量、销售的型号款式、销售额等指标,以确定整体市场的变化趋势。

● 电影放映时,电影院里很黑,你有什么办法知道这个放映厅里用Android手机的人多,还是用iOS手机的人多?

参考回答:

1.  根据电影院的价位与档次判断:
假设:使用iOS手机的用户消费水平较高
电影院中高档价位时,使用iOS手机用户多。

2. 根据电影院所在地理位置及周边配套设施判断:
假设:使用iOS手机的用户收入及消费水平较高
电影院处在中高档商场周边时,使用iOS手机用户多;
电影院处在CBD附近时,使用iOS手机用户多。

3. 根据电影面向的观影群体判断
假设:观影群体的年龄与消费水平挂钩,消费水平高使用iOS手机用户多;男性用户使用安卓手机多
观影群体低龄化,使用安卓手机的用户多;
电影男性向重,使用安卓手机用户多。

● 如何推算在一个城市的共享单车投放量和每日交易数量?

参考回答:

如何推算在一个城市的共享单车投放量和每日交易数量?

共享单车投放量:
该城市总人数X能够骑自行车的人数X无自行车人数比例/每辆车每天可服务的用户数
假设:
城市总人数为2400万
能够骑自行车的人数:18-60岁年龄人群 2400万X42/80=1260万人
无自行车人数比例:5/6
每辆车每天可服务用户数:假设使用车的人每天使用两次,每辆车每天可使用时长X使用率/用户单次使用时长=12hX1/3 /0.2h=20, 则服务的人为10人
故:总投放量=1260X5/6/10=100万

交易数量:
共享单车投放量X每辆车每天被使用次数
=共享单车投放量X每辆车每天可使用时长X使用率/用户单次使用时长
故:
交易总量=100万X12hX1/3 /0.2h=2000万

● 有一项数据分析任务交给你分析,分析完成后发现你得出的结论与上级得出的结论不一致。上级让你按照其要求总结报告,请问你会怎样做?

参考回答:

1. 重新检查数据结论,确认正误
如果确认自己的结论正确,则

2. 思考上级得出结论的出发点和漏洞
思考上级得出结论是基于什么假设,有什么漏洞

3. 从上级的角度出发,简明扼要地向对方解释结论的正确性,说服对方
拿出充分的数据证明,并向上级解释清楚,以理服人。

● 以下是某App的日活数据,该App主要用户群是三四线城市男性用户,如果你是这家公司的产品人员 a、从数据中,你看到了什么问题?你觉得背后的原因是什么? B、如果你的老板要求你提出一个改进计划,你会怎么做? 数据如下: 8月10日(周一):47361 8月11日(周二):53424 8月12日(周三):56876 8月13日(周四):52012 8月14日(周五):49833 8月15日(周六):30125 8月16日(周日):29938

参考回答:

● 请你估算一下,在春节前倒数第三天,首都国际机场一天的人流量。

参考回答:

此类估算问题一般都可从供需两个角度来思考,一般情况下供需会匹配。
但“春节倒数前三天”这个时刻一定是需求大于供应,因此从供应的角度来思考比较合理。

总人流量包括:飞机乘客,送机人员,其它工作人员。此处只考虑大头:乘机人员。
从供应思考当天机场能够提供多少乘客的运输:
乘客吞吐量
=机场当天起降的飞机数量X每架飞机实际乘客数
=机场跑道数量X机场跑道开放时长/每架飞机起降需要花费的平均时长X每架飞机可承载人数X上座率
假设:
跑道:5个
每架飞机起降需要花费的平均时长:3min
机场跑道开放时长:6:00-2:00(隔天)共计20h
每架飞机可承载人数:飞机一般有三种大小,但中型大型居多,假设分别占比8:2,可承载人数200:400
上座率:由于是春节,假设飞机平均上座率为90%
则:5X20h/3minX(0.8X200+0.2X400)X0.9
=36
大约36万人。

● 请你提供一个可行的解决思路,估算一下上海有多少辆自行车。

参考回答:

  • 上海市的自行车数量=私人自行车数量+共享单车数量
  • 私人自行车数量=该城市总人数X能够骑自行车的人数X有自行车人数比例
  • 共享单车数量=该城市总人数X能够骑自行车的人数X无自行车人数比例/每辆车每天可服务的用户数
其中:
  • 共享单车投放量:
该城市总人数X能够骑自行车的人数X无自行车人数比例/每辆车每天可服务的用户数
假设:
  • 城市总人数为2400万
  • 能够骑自行车的人数:18-60岁年龄人群 2400万X42/80=1260万人
  • 无自行车人数比例:5/6
  • 每辆车每天可服务用户数:假设使用车的人每天使用两次,每辆车每天可使用时长X使用率/用户单次使用时长=12hX1/3 /0.2h=20, 则服务的人为10人
故:总投放量=1260X5/6/10=100万
  • 私人自行车数量
该城市总人数X能够骑自行车的人数X有自行车人数比例
假设:
  • 城市总人数为2400万
  • 能够骑自行车的人数:18-60岁年龄人群 2400万X42/80=1260万人
  • 有自行车人数比例:1/6
故:私人自行车数量=1260X1/6=200万

  • 总自行车数量
故总自行车数量=200万+100万=300万

● 分析数据的时候发现,其他交易额都增长了,只有男装行业较去年同期下降了20%,你认为可能是什么原因?说明一下你的分析思路过程。

参考回答:

核心:交易额=销量X单价

1. 对比销量与去年同期变化
  • 若销量不变或提升,说明有降价操作;
  • 若销量减少,则:

2. 对比单价与去年同期变化
  • 若单价提升,说明价格提升对用户而言接受度低;
  • 若单价不变或降低,则考虑是否有外部因素导致销量减少,
比如:
  • 是否有重大活动?比如世界杯奥运会等大型赛事?
  • 是否有相关国家政策?

● 你认为如何通过大数据优化电梯广告内容?

参考回答:

通过大数据获取:

1. 使用电梯的用户画像
包括:年龄、职业、性别、大致收入及消费水平等

2. 电梯的应用场景
是公寓?商场?写字楼?不同的场景下采取不同的广告投放策略

根据不同的用户画像和电梯所处的应用场景,有针对性的投放广告。 

● 酒店入住是一个季节性比较强的生活需求,人们旅游、商务都需要入住酒店。房间的需求量在时序上存在规律,但又有很多突发型的小高峰和低谷。现实中,大约有60%的人入住酒店会提前n天(假设1<=n<=30)预定。请设计一套预测某个城市未来某一天酒店入住房间数的系统: 1)如何收集数据,并给出采集的日志(或数据)结构 2)预测(求解)入住需求量 3)阐述预测系统带来的现实意义

参考回答:

● 请你估算一下,广州市的出租车数量。

参考回答:

可以从供需两个角度来考虑:
1.  供给:
广州市小轿车总数X出租车比例
=广州市人口数X人均小轿车保有量X出租车比例
  
2.  需求:
广州市人口数X可打车的适龄人数X打车比率X平均每天打车的次数/每辆车每天服务的人数
假设:
  • 广州人口:2000万人
  • 可打车适龄人数:12-60岁,2000万X48/80约1000万
  • 打车比例:有1/5的人有打车需求
  • 平均每天打车次数:平均每五天打车一次,则每天1/5次
  • 每辆车每天服务人数:每天工作时长X非空车时长占比/单次载客时长=12hX1/3/0.25h=16
故:
1000万X1/5X1/5/16=2.5万

● 请你估算一下,你所在的城市三星级及以上的酒店大概有多少。

参考回答:

此类估算问题一般都可从供需两个角度来思考,一般情况下供需会匹配。 
但酒店数通常供应>需求,因此可以从供应的角度来考虑比较简单。

该城市三星级及以上酒店数目
=该城市所有酒店数目X三星及以上酒店数目占比
=该城市居住面积/每个酒店的辐射范围X三星及以上酒店数目占比
假设:
上海居住面积为6000平方公里
每个酒店辐射范围为1X0.5=0.5平方公里
三星及以上酒店占比为20%
则:
6000/0.5X0.2=2400
故上海有三星及以上酒店2400家。

● 如果让你估算成都市理发店的总量,你有多少种方法可以估算?

参考回答:

方法:
  1. 直接在大众点评上搜索
  2. 在百度地图上搜索
  3. 查询工商局注册的理发店数目
  4. 自己估算
  • 从供给角度估算
理发店数量
=城市居住面积/单位面积理发店数量
  • 从需求角度估算
理发店数量
=每天需要理发的人数/平均每家店单日可接待人数
=城市人口数X需要理发的用户比例X理发频率/平均每家店单日可接待人数  

● 请你简述一下数据运营的定义,并阐述一下常用的数据分析方法及适合的应用场景。

参考回答:

1)数据运营:通过数据挖掘、分析来判断分析运营效果、指导运营活动。

2)常见的数据分析方法如下:
1. 杜邦分析法
使用金字塔来层次拆分问题,比如销售额=客单*访客*转化,然后访客又可以细分到浏览量、停留、流失等,浏览量又可以拆分成不同渠道的浏览量。
适用场景
  • 电商销售额
  • 会员收入
2. 漏斗分析法
通过漏斗来逐层分析流失及转化情况,如潜在用户——接触用户——停留用户——行为用户——有效用户——成交用户——二次成交用户——核心用户——自传播用户。
使用场景
  • 用户增长
  • 用户转化
3. 矩阵/四象限分析法
比如按照SWOT 来分析,或者按照其它可拆解的维度和象限来分析,比如市场占有率、产品成交量等。
使用场景:
  • 竞品分析
  • 业务对比

● 请你估算一下武汉市共有多少个加油站。

参考回答:

可以从供应和需求两个角度来分析

1. 供应角度
加油站数目=武汉市面积/单位面积加油站的数目
=武汉市面积/每个加油站覆盖的服务面积
假设
  • 面积为8000平方公里
  • 每个加油站服务的面积为:2X2=4平方公里
则:
加油站数=8000/4=2000个

2. 需求角度
加油站数目=武汉市每天需要加油的车的数量/每个加油站每天可服务的人数
=武汉市机动车辆总数/每辆车每天加油的概率/每个加油站每天可服务的人数
=武汉市(私家车数目+非私家车数目)/每辆车每天加油的概率/每个加油站每天可服务的人数

其中:
武汉市私家车数目=武汉市家庭数X有车家庭的比例
=武汉市人口数/3X有车家庭的比例

假设:
  • 武汉市私家车:非私家车数目=2:8
  • 武汉市人口数:1000万
  • 有车一族比例为1/5
则私家车数目=1000/3/5=60万
车辆总数为300万
  • 每辆车每周加油1次,则每天加油概率为1/7
  • 每个加油站工作时长24h,有3个工作人员,其中白天12个小时内,每10分钟服务一个用户,晚上每小时服务一个用户。
  • 则每个加油站每天可服务的人数=12X3X(6+1)=250
则加油站数目
=武汉市机动车辆总数/每辆车每天加油的概率/每个加油站每天可服务的人数
=300万/7/250
=2000

● 请你预测一下,在星期五下午两点半有多少用户在刷朋友圈。

参考回答:

分析思路:
星期五:工作日
下午两点半:工作时间

此时刷朋友圈人数
=微信日活X有刷朋友圈习惯的用户比例X该时刻刷朋友圈的用户比例
假设:
微信日活:10亿
刷朋友圈习惯的用户比例:90%
刷朋友圈的时长在一天内的变化会有几个高峰,其它时刻均匀分布,工作时间非高峰,假设非高峰期刷朋友圈的概率为1%
则:
此时刷朋友圈人数=10亿X90%X1%=900万

● 请你估算一下,中国所有航班一天承运的客流量。

参考回答:

中国所有航班一天承运的客流量
=中国所有机场一天的客流量

从供应思考当天机场能够提供多少乘客的运输:
乘客客流量
=机场数目X机场当天起降的飞机数量X每架飞机实际乘客数
=机场数目X机场跑道数量X机场跑道开放时长/每架飞机起降需要花费的平均时长X每架飞机可承载人数X上座率

假设:
  • 机场数目:150个
  • 跑道:3个
  • 每架飞机起降需要花费的平均时长:5min
  • 机场跑道开放时长:6:00-2:00(隔天)共计20h
  • 每架飞机可承载人数:飞机一般有三种大小,但中型大型居多,假设分别占比8:2,可承载人数200:400
  • 上座率:假设飞机平均上座率为60%
则:150X3X20h/5minX(0.8X200+0.2X400)X0.6
=1200万

● 如何测算分享路径所带来的新用户数?

参考回答:

在设置分享路径时,采用以下标记策略:

1. 在分享链接上加上特殊标记
如果是通过链接、H5等分享,可以在链接上加入特殊标记

2. 通过用户直接分享的,可以加上推荐优惠码等特殊口令
新用户可以在进入时使用好友的推荐码

3. 设置多重分享路径
包括H5、二维码、推荐码等,区分不同渠道带来的新用户

● 北京中关村公司楼下有一面馆,70平米,收银员2位,每天提供早餐、中餐、晚餐。如果你来做估算,计算每天的营业额是多少?如何评估盈利情况?

参考回答:

● 请你估算一下,今年全国通过网络参加4-12岁少儿英语在线培训的人数?

参考回答:

从需求的角度来分析:

全国通过网络参加4-12岁少儿英语在线培训的人数
=全国4-12岁少儿数X参加英语培训人数比例X线上培训比例
=全国人数X4-12岁人口比例X参加英语培训人数比例X线上培训比例
假设:
  • 全国人口14亿人
  • 4-12岁人口占比8/80=10%
  • 参加英语培训人数比例:5%
  • 线上培训比例:10%
则:
14亿X10%X5%X10%
=70万

● 请解读以下数据表格,输出你对该款产品的观察与分析。(见下图)

参考回答:

● 请说出以你住的地方为中心,半径3公里内最大的超市是哪一家? 然后,请用有效方法计算出这个超市在,9月15日,星期六,晚23:59,货架上还有多少瓶330毫升的红色听装可口可乐

参考回答:

● 上海有多少辆自行车?请提供一个可行的解决该问题的思路

参考回答:

  • 上海市的自行车数量=私人自行车数量+共享单车数量
  • 私人自行车数量=该城市总人数X能够骑自行车的人数X有自行车人数比例
  • 共享单车数量=该城市总人数X能够骑自行车的人数X无自行车人数比例/每辆车每天可服务的用户数
其中:
  • 共享单车投放量:
该城市总人数X能够骑自行车的人数X无自行车人数比例/每辆车每天可服务的用户数
假设:
  • 城市总人数为2400万
  • 能够骑自行车的人数:18-60岁年龄人群 2400万X42/80=1260万人
  • 无自行车人数比例:5/6
  • 每辆车每天可服务用户数:假设使用车的人每天使用两次,每辆车每天可使用时长X使用率/用户单次使用时长=12hX1/3 /0.2h=20, 则服务的人为10人
故:总投放量=1260X5/6/10=100万
  • 私人自行车数量
该城市总人数X能够骑自行车的人数X有自行车人数比例
假设:
  • 城市总人数为2400万
  • 能够骑自行车的人数:18-60岁年龄人群 2400万X42/80=1260万人
  • 有自行车人数比例:1/6
故:私人自行车数量=1260X1/6=200万

  • 总自行车数量
故总自行车数量=200万+100万=300万