回馈贴|面对数据异动怎么办?用逻辑树教你见招拆招定位异动因素

文章来源gzh-数据万花筒,链接如下-https://mp.weixin.qq.com/s/RIpU0JnCnyh_RUs4VJE73Q,数据分析相关文章持续更新,关注我们不迷路!

在这里可以找到我,和我一起交流数据分析相关知识

加我我们,每日刷题,拿下优质offer


对于某一块业务来说,建立完数据指标体系,整体的业务就得到了监控。当数据发生异动时,通过数据指标体系拆解能够快速定位问题。这篇文章的重点有三,其一,理解数据异动背后的业务意义才是最重要的;其二,数据异动应该如何快速定位问题;其三,数据埋点到数据指标体系再到数据异动分析的闭环思维体系!

1.数据波动多少才叫数据异动

数据波动多大才叫数据异动?这是一个令数据分析是很头疼的问题!有时候DAU下降2%运营就急得哇哇直叫,非要让数据分析师排查下到底是不是数据错了;但有的时候某些指标下降30%,运营还像个没事人一样。

回答“数据波动多少才叫数据异动”这个问题其实是要分指标类型以及业务含义来看的。

举个简单的例子来说,体温作为判断是否是新冠疑似病例的核心指标,只要从正常范围越界到37.4以上就会被请去作核酸检测甚至隔离,即便只是从36.9度波动到37.4度,仅1.4%的波动就会产生如此大的影响。而身高、体重这个指标则不然,假设今年往年长胖了20%,回老家过年机场安检人员不会因为体重的波动而不让你乘机!

1.4%的波动会被要求作核酸检测甚至隔离,而20%的波动却毫无影响?其实大家在意的的并不是波动,而是新冠,也就是指标背后代表的含义。对于新冠来说,体温是核心监控指标,只要超出37.4就可能是疑似病历;而身高体重就是无关紧要的指标,高矮胖瘦和是否是新冠疑似病历没有任何关系。所以,分析指标异动第一步,搞清楚异动指标背后的业务含义,脱离业务含义的分析没有任何意义!

2.数据异动分析的方法论

首先,我们用MECE模型对数据异动进行一个分类,尽可能地列举数据异动的所有类别,并且使得各个类别之间彼此独立。最终,我们将数据异动划分为五个类别,分别是数据的周期性波动、业务内部因素影响、外部因素影响、数据传输问题以及意外因素引起的数据波动。下面我们会具体介绍每一种类型的数据波动,而对于意外因素引起的数据波动则会通过逻辑树的拆解方法定位到该影响因素。



2.1 数据异动分析的四排除

对于前四类种波动类型来说,并不需要用到逻辑树的拆解方法定位异动因素。所以在进行逻辑树拆解之前,我们先要排除前四种数据波动类型。否则的话,可能通过逻辑树拆解到一无所获,到头来发现这是由于数据传输缺失造成的,这可就不划算了!

1.排除数据周期性波动

数据的周期性波动是一种自然形态的波动,例如,对于一款游戏来说,周末、节假日的日活用户肯定是比工作日要高的;如果看小时数据的话,每天12:00-14:00之间以及20:00以后的数据会比其他时间段的要高。

再比如,公众号文章的阅读量周内普遍高于周末阅读量。

当拿到一个数据异动排查的问题,需要先确定这个问题是否是周期性波动的问题,如果是的话,用周期性的变化的说辞就可以把业务怼回去了,你的排查工作就结束了!

下面举个小小的例子来进行说明,一个运营小白拿着这样的数据找到你说,“这两天DAU下降的有点多啊!是不是你们数据有问题啊,帮忙排查下呗!”



单看两天的DAU直线下降了35.98%,确实下降的可怕。这时候,先不着急去排查问题,我们得先去看下这个波动是否是由于周期性变化引起的。于是,我们查看了运营给到的日期一天是周末,一天是工作日,周末和工作日的DAU肯定会有很大差异,我们估计这肯定是由于周期性变化引起的。所以我们拉取了两周的DAU数据给到运营,他瞬间似乎明白了自己的认识偏差!

总结一下,排查数据异动第一步,先确定数据的波动是否是周期性波动引起的,因为周期性波动属于正常的波动范围。周期性波动对于不同的业务,可能会受到季节、节假日、周末等因素的影响,需视具体的业务情况而定。

2.排除内部影响

通常情况下内部影响都是来源于业务的活动,例如,运营经常组织的拉新、促活、促销等活动通常会造成某一段时间内的活跃用户数、销售额等指标高于平时。

举个简单的例子来说,在某段时间内业务推出了登陆奖励活动,该段时间的的DAU增长了35%左右,但是活动结束之后DAU又回到了正常水平。这类犹豫业务内部主动行为造成的数据波动也是属于正常波动。



但是面对这种情况,作为数据分析师可以更进一步地帮助业务分析活动效果,从数据的角度找出有哪些点是可以提升的,如果能给出一些一定的意见或建议那最好不过了,这样的数据分析才是有价值的,最终是能够帮助到业务的!

3.排除外部影响

除了业务主动行为造成的数据波动,当然还会有一些外部因素造成的数据波动,例如,天气、政策、竞对等各种因素,而对于这些外部因素的影响作为数据分析师也是无能为力的。这里也举个小小的例子进行说明,比如某款竞品在国外被禁了,公司产品作为替代品DAU瞬间暴涨。这就是由于政策因素影响带来的利好情况,虽然现实中大部分情况是负面的。

所以对于这些不可控却又无能为力的外部因素的影响,特别是负面的影响,数据分析师可以估算其影响范围和影响周期,反馈给业务以帮助其辅助决策!

4.排除数据传输异常问题

周期性波动、业务内部主动行为造成的数据波动以及外界环境政策造成的数据波动我们都认为是正常的数据波动。而数据波动还可能受到数据传输的影响,可能某天某个调度脚本挂了而造成数据缺失,因而造成了数据异动。

所以面对数据波动问题,当我们排除数据周期性影响、内部因素影响以及外部因素影响之后,接下来就需要确定是否是数据传输问题而造成的数据波动。

排查数据传输问题而引起的数据异动可以根据数据传输的流程,逐个环节进行排查,定位到有问题的环节找到相应的负责人修复bug。



对于数据传输问题,我们需要先排查报表的数据是否是和底层数据库的数据能对上,如果能够对上的话,就说明监控报表的数据是没有问题的,业务本身出现了波动,这个波动到底的影响因素到底是什么就需要通过逻辑树的方法进一步分析了,这个在下一节会具体讲。

如果报表的数据是否是和底层数据库的数据能对不上,就需要根据数据传输流程回溯每一个关键节点去找到真正出问题的环节,可能是数据调度的问题,也可能是数据入库的问题,也可能是客户端服务器等数据记录的问题。

2.2 逻辑树定位数据异动影响因素

如果数据的波动不是自然波动,也不是由于内部主动行为造成的,也属于外部因素引起的范畴,更不是数据传输造成的错误,而是由于一些意外却不可知的因素造成的,这时候就需要通过逻辑树的方式去定位到底是什么因素造成数据的波动。

还是以DAU波动为例子进行说明,假设某天某个产品的DAU发生异常波动,业务希望你能帮忙定位下异动原因,你就可以这样做!



我们先对DAU进行拆解,根据用户构成我们可以将DAU拆解为新用户和老用户;而老用户又可以拆分为留存用户和回流用户;对于回流用户来说,又可以继续向下拆分为近七日注册的回流玩家和七天前注册的回流玩家。通过这样的拆分,可以看出到底是新用户少了还是老用户少了,明确问题后继续向下进行拆分定位最细颗粒度的影响因素。

我们也可以对新用户进行其他维度的拆分,可以从地区来拆以下,看看到底是哪个地区的新用户减少而造成的,如果是整体的用户减少,那可能产品是产品本身存在一定问题,和新用户的匹配性不是很好;如果是某个地区的用户减少,可以继续拆解维度,可以考虑以服务器为维度进行拆解,因为某个地区的用户骤减可能是该地区服务器挂了,这是一个思考的角度;还有另一种原因可能是产品的本地化做得不够好,对于某个地方的用户群体没有足够的吸引力。

对于指标异动的分析考虑逻辑树的拆解方法能够快速地定位异动原因,帮助业务进行方案调整和辅助决策!

3.数据埋点到指标体系再到指标异动的闭环

逻辑树拆解的这些数据指标大部分已经包含在了我们之前建立的指标体系当中了,我们只需要按照上述的拆解思路拖拖拽拽筛选出自己想要的数据指标和维度的组合,查看数据变化,定位异动因素即可。当然,有时候排查出来的问题可能没有体现在指标体系之中,这时候就可以将相应的指标和监控维度加到对应的指标体系中,方便日常的业务监控以及数据问题的排查!



从数据埋点是数据指标体系建设的基础,只有埋点才能获取到用户行为数据;有了用户行为数据可以凝练出数据指标和监控维度实现对业务变化趋势的实时监控;当业务出现数据异动时,可以通过指标体系中的不同维度的组合排查影响到业务异动的具体因素。

从数据埋点到数据指标体系的建设再到数据异动分析,三位一体监控业务变化,形成一个闭环!

全部评论

相关推荐

1 20 评论
分享
牛客网
牛客企业服务