数据分析场景 -- 异常数据分析

对于异常数据的分析,相信每位数据分析师都不陌生,对于业务部门来说同样很希望了解数据分析的思路。去年同期也写过类似的一篇异常数据分析文章,过了一年后有了更进一步的思路和想法,因此再次分享一下,对于数据分析师常见的“异常数据分析”。

分析思路包括以下5个步骤:

1. 确定这是不是问题?

2. 判断问题严重吗?

3. 具体问题具体分析,找出原因

4. 拉齐业务,对症下药

5. 形成SOP或数据产品

下面来细说下每个步骤的分析内容:

1. 确定这不是问题?

一般来说,业务数据下降这类问题会是业务方主动提出的。当然作为数据分析师也可能凭借数据敏感,发现异常数据。

这个步骤主要思考4个小问题:

  • 什么叫异常数据?
  • 异常数据真的是问题吗?对比标准是什么:KPI?去年同期?竞争对手等等
  • 数据出口、指标计算口径是一致的吗?
  • 数据的真实性如何?有没有宕机、传输有没有丢包、数据流转是否有预警等等

2. 判断问题严重吗?

如果确实存在问题后,需要再判断问题是否严重,这决定了下一步工作的优先级和分析程度。实战中,一方面需要判断与对比标准的差距到底有多大,另一方面也需要拉长时间线来看趋势变化,毕竟下降的时间越久,问题也越严重。

下图是之前的一个分析思路,结合问题严重程度和紧急程度做的步骤拆解:

3. 具体问题具体分析,找出原因

分析原因和分析方法一定是结合着具体场景的。

大致来说,可以从这几个角度切入分析:

1)指标拆解,即把结果指标拆解为一个个过程指标,对过程指标逐个分析

以DAU为例,DAU=DNU+昨日的次日留存用户数+前N日的N日回流用户数(N>=2),可以分别计算出每部分变化的影响系数,即哪部分变化是最大的,先从变化最大的入手

2)内外部分析,即从分析对象的内外部影响因素入手

例如文章点击量时,从内部来说可以从产品功能(是否版本迭代、新功能未满足需求等)、渠道来源(是否某个主要渠道推广出现限制等),外部影响因素包括整个行业宏观环境、竞争对手策略以及产品用户

3)主谓宾分析,即从分析对象所处环境整体把握分析(PS:这个方法是我个人所悟,可能还不是很成熟)

具体来说可以从这三个主谓宾进行分析:使用主体是用户(可以再拆解新老用户、用户画像、访问渠道、访问时段等等),使用 载体即产品本身(产品功能分析),使用行为也就是用户在产品上的行为(例如停留时长、启动次数等)

分析方法和视角有很多,如果时间允许还可以做深度分析,找到切入点做假设,以数据验证假设,以找到原因。

4. 拉齐业务,对症下药

针对具体分析出的原因提出相应的改进策略,毕竟数据从业务中来,需要返回业务中执行,需要拉齐业务部门制定出可执行的解决方案,并落地执行,才可能让数据朝健康方向发展。

5. 形成SOP或数据产品,不断迭代优化

前面4步主要还是单次分析,结合自己之前做数据产品的经验,可以更进一步:梳理好分析维度,指标,业务流程等内容,健全相应的一些监控报表,加入一些对比标准进行预警,持续观察一段时间,特别要留意的是数据指标缓缓下降的情况,提前介入分析原因,否则越到后期问题往往也越严重。

当然业务是在不断变化的,行成的SOP或数据产品也需要迭代优化,跟得上业务发展。

小结:异常数据分析属于“事后诸葛亮”式的后验分析,做得好也是可以发现业务中存在问题的,但同时提需要提醒数据一定要形成闭环,即从业务中来,更需要回到业务中去,落实到业务执行,分析才不会白费

附1:异常数据分析流程(去年)

附2:此图为一些分析视角,仅供参考

合智互联客户成功服务热线:400-1565-661

admin
admin管理员

上一篇:Dubbo to Istio / Dubbo Mesh 极简改造指南
下一篇:边缘计算和网络切片,为何成为5G的“技术网红”

留言评论

暂无留言