数据分析业务题:异动分析

数据分析业务题
  • 异动分析:DAU下降如何分析?营业额下降如何分析? (侧重于分析异动原因)
  • 效果评估:如何量化某产品功能效果?如何评估一场活动效果?
  • 效果改进:如何提升用户活跃?如何达到营业额目标?   (侧重于提供解决方案)
  • 指标体系:如何选出3个指标向CEO汇报?
  • 注意人货场

    一. 异动分析(版本一)
    1.  确认是否有数据上报问题: 产品出bug, 数据出bug,数据统计口径不一致
    2. 归因分析:外因分析和内因分析
        外因:市场大环境的变化(通常不会有突然变化的情况)/竞争对手突然的变化(是否有新的竞争对手加入,竞争对手的产品是否有巨大变化)/时间性的周期性变化(春节/周末等特殊时间段)
        内因:产品迭代造成的数据波动,技术bug,运营活动的变化
    3. 问题拆解
        1. 业务类加法:讲不同的业务进行拆分:如药品+跑腿+餐饮...
        2. 纵向寻找



    作者:小7和数分手拉手
    链接:https://www.nowcoder.com/discuss/821018?type=all&order=recall&pos=&page=1&ncTraceId=&channel=-1&source_id=search_all_nctrack&gio_id=BCC1F0A8DBE53F39CAB9A623CFC0AE8B-1649649492216
    来源:牛客网

    指标异动分析:

    1.1 数据的周期性波动

    数据的周期性波动是一种自然形态的波动(不同时间段,工作日,节假日,季节,寒暑假),
    例如,公众号文章的阅读量周内普遍高于周末阅读量。当拿到一个数据异动排查的问题,需要先确定这个问题是否是周期性波动的问题,如果是的话,排查工作就结束了!

    1.2 业务内部因素影响

    通常情况下内部影响都是来源于业务的活动
    1. 运营经常组织的产品内的拉新、促活、促销等活动,通常会造成某一段时间内的活跃用户数、销售额等指标高于平时。
    2. 产品上线新功能,比如原来这款APP主要呈现搞笑视频,但这一天上线了可以上传带有美颜特效的视频作品,会吸引一大波原来不使用它的很多女性用户开始追风使用这款APP
    3. 产品宣传活动的成功:如一些受众较为垂直的app,因为一些宣传如明星代言,或是一些活动如b站的《后浪》从而破圈并吸引大批圈外用户

    1.3 外部因素影响

    天气、政策(如疫情)、竞对(是否有新的竞争对手加入,竞争对手的产品是否有巨大变化等各种因素),市场行情等外部因素造成的数据波动

    比如某款竞品在国外被禁了,公司产品作为替代品DAU瞬间暴涨。这就是由于政策因素影响带来的利好情况,虽然现实中大部分情况是负面的。

    1.4 数据传输问题

    数据波动还可能受到数据传输的影响,可能某天某个调度脚本挂了而造成数据缺失,因而造成了数据异动。所以面对数据波动问题,当我们排除数据周期性影响、内部因素影响以及外部因素影响之后,接下来就需要确定是否是数据传输问题而造成的数据波动。

    排查数据传输问题而引起的数据异动可以根据数据传输的流程,逐个环节进行排查,定位到有问题的环节找到相应的负责人修复bug。


    2.2  指标拆解

    2.2.1 纵向拆解
    基本思路:根据指标所涉及到的全流程,拆解为各个环节,可以通过公式拆解的方法来进行具体的分析。但是对于不同的指标,会有不同的拆解注意点,也有不同的拆解细致程度,这个需要逐渐积累case.
    e.g.  网站销售额 

            a. 销售额=入站流量*下单率*客单价

            b. 入站流量 = Σ各来源流量*转化率

            c. 下单率 = 页面访问量*转化率

            d. 客单价 = 商品数量*商品价格

    将GMV拆解成乘法模型,如GMV=广告投放数量*广告点击率*产品浏览量*放入购物车率*交易成功率*客单价,检查哪一步有显著变化导致了GMV上升

    初次之外,确定怎样判定异常:同比/环比

    这一步之后,我们基本能锁定发生异动的部分:比如发现了广告点击率的直线下降,问题范围就缩小了

    2.2.2 横向拆解
    进一步拆分,可以围绕“人,货,场”角度进行细分

    人:用户角度(用户画像)

    别的用户画像比如使用设备(pc/手机/机器型号)

    计算影响系数:每一项数据都要和以往正常值做对比,算出影响系数。

    影响系数=(今日量-昨日量)/(今日总量-昨日总量)

    影响系数越大,说明此处就是主要的下降点

    以上是几种常见的初步拆分维度,通过初步拆分,定位原因大致范围。




    货:即产品本身
    当我们分析一个大业务下的指标时,往往会有多种产品组成整体,比如美团分跑腿,外卖;淘宝分B2C,C2C或者各类不同种类的商品:日用产品,衣服,零食
    因此,对于不同种类的产品需要拆分来看。这就要求在面试前对

    场:不同的场景
    比如对于广告或用户访问时在app内中的不同频道,流量也会有不同。从首页进入我们这一业务的用户减少?还是从分类中进入的减少?为什么。
    场景可能还有很多种不同的理解方式,后续不断补充。
    不同入口的效果

    2.2.3 重新归因

    内部事件因素(产品侧,技术侧,运营侧)

    • 获取用户:渠道转化率降低、渠道平台问题等

    • 满足用户需求:新功能变更等引起某类用户不满

    • 促活运营手段:签到等提活手段没达成目标、产品自然使用周期低导致上次获得的大量用户短期内不需要再使用等

    • 内部功能和运营策略调整:产品、运营、技术在数据异常时间点附近做了什么策略调整

    外部事件因素

    采用PEST分析(宏观经济环境分析)

    • 政治:政策影响

    • 经济:短期内主要是竞争环境,如竞争对手活动

    • 社会:舆论压力、用户生活方式变化、消费心理变化、价值观变化等偏好变化

    • 技术:创新解决方案的出现、分销渠道变化等



    总结:1. 先对一些常规项进行排除或大体定位
               2. 纵向分析,确认选择什么时间维度,不同的业务不同的流程
               3. 横向拆解:人货场
               4. 重新归因定位




    40. 还有用户流失的分析,新用户流失和老用户流失有什么不同?

        1)用户流失分析:

            a. 两层模型:细分用户、产品、渠道,看到底是哪里用户流失了。注意由于是用户流失问题,所以这里细分用户时可以细分用户处在生命周期的哪个阶段。

            b. 指标拆解:用户流失数量 = 该群体用户数量*流失率。拆解,看是因为到了这个阶段的用户数量多了(比如说大部分用户到了衰退期),还是这个用户群体的流失率比较高

            c. 内外部分析:

                a. 内部:新手上手难度大、收费不合理、产品服务出现重大问题、活动质量低、缺少留存手段、用户参与度低等

                b. 外部:市场、竞争对手、社会环境、节假日等

        2)新用户流失和老用户流失有什么不同:

            a. 新用户流失:原因可能有非目标用户(刚性流失)、产品不满足需求(自然流失)、产品难以上手(受挫流失)和竞争产品影响(市场流失)。

            新用户要考虑如何在较少的数据支撑下做流失用户识别,提前防止用户流失,并如何对有效的新用户进行挽回。

            b. 老用户流失:原因可能有到达用户生命周期衰退期(自然流失)、过度拉升arpu导致低端用户驱逐(刚性流失)、社交蒸发难以满足前期用户需求(受挫流失)和竞争产品影响(市场流失)。

            老用户有较多的数据,更容易进行流失用户识别,做好防止用户流失更重要。当用户流失后,要考虑用户生命周期剩余价值,是否需要进行挽回。
    公司毛利润=LTV-CAC=LT*ARPU-CAC

    二、如何计算生命周期标签


    (1)通过逻辑规则,判断生命周期阶段
    a. 找出不同种类的判定特征
    b. 设定边界:形成边界、活跃边界、沉睡边界、流失边界

    (2)通过算法,判断生命周期阶段

    在算法层面,其实给用户计算生命周期,本质上就是进行用户分类的过程。

    关于如何进行用户分类,算法就比较多了,比如可以使用朴素贝叶斯、SVN等。














    常见留存分析一般的分析框架:

    1. 首先验证数据准确性和有效性;

    2.要确认这个下降是否是真的异常。从留存环比和同比的角度看看具体下降多少。

    3.定位异常



    内因:

    技术:crash率;是否有bug:404;502

    一般的crash率是千分之4到千分之6

    产品:分系统版本,分手机osv,分手机厂商,运营活动,上新有损用户体验的功能

    不同系统版本时间的差异,如果是新版本可能是新版本上新功能

    分手机厂商和osv,一般国内主流安卓手机是huawei,oppo,vivio,不同厂商的留存多少也有差异。

    商业化:广告太多?影响用户体验

    广告频次(总次数太多,相同广告太多?)

    广告内容(分A类广告,B类广告)

    广告加载是否出现问题

    投放侧:5w1h(投放侧大多是新用户,所以会影响新用户留存)

    who:用户画像是否波动(性别,地域,年龄分布)

    when:投放时段(不同激活时间段用户占比分布变化也会影响留存)

    0-5点(留存最差)

    6-11点(留存居中)

    12-17点(留存略高)

    18-23点(留存最高)

    where:媒体+渠道+投放位置(位置:信息流,详情页)

    what:新激活用户当天行为,抽奖次数,停留时长,核心功能使用

    why:投放目的是验证新功能?测试素材?获客?

    how

    吸引用户方式:计划,素材,(是否某个计划素材有问题,或者产量跟不上)

    老计划或者老素材在衰退,新计划或者新素材新增产量跟不上

    投放方式:双出价方式,或者ROI投放方式,深度转化方式等

    头条投放平台在新建计划时,一般会设置次留目标值,这个目标值填的越高,实际次留理论上会越高,但是同时拿量会更难,二者要平衡。

    老用户留存

    用户生命周期

    运营活动





















    全部评论

    相关推荐

    头像
    04-29 10:53
    已编辑
    东北大学 自动化类
    点赞 评论 收藏
    转发
    3 24 评论
    分享
    牛客网
    牛客企业服务