问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

数据分析方法:波动贡献计算方式详解

创作时间:
作者:
@小白创作中心

数据分析方法:波动贡献计算方式详解

引用
CSDN
1.
https://blog.csdn.net/junerli/article/details/138532884

目录
一、背景
二、目标
三、方案
3.1 非时序数据
3.1.1 占比贡献(仅限于加和拆解)
3.2 时序数据
3.2.1 加和拆解(维值拆解、加和指标拆解)
3.2.1.1 历史对比贡献(同环比)
3.2.1.2 预测对比贡献
3.2.2 四则计算(指标四则计算拆解)
3.2.2.1 连环替代法
3.2.2.2 差额分析法
四、参考

一、背景

在根因分析中,除了灵活的维度和指标层级拆解,我们还需要在拆解过程中找出对分析目标影响最大的因素,以此来达到交互式根因分析的效果。

二、目标

本文主要调研在进行指标和维度拆解过程中,对于维值/指标成员的波动贡献的衡量方式,以此为分解树的根因分析功能。

三、方案

首先,在处理数据前,我们需要区分非时序数据时序数据,其原因在于非时序数据由于不具有时间维度,找不到对比对象,无法很好地衡量波动性。在没有波动衡量指标的前提下也就无法衡量贡献度了,这种场景下可以理解为分析转为了占比贡献(即查看构成中的主要组成部分),或是针对下级维值/指标的独立分析(但此时用分解树组件展示效果不佳)。

3.1 非时序数据

非时序数据由于其不具有可对比的基期或预测值,进行贡献计算时可选方法比较有限。

3.1.1 占比贡献(仅限于加和拆解)

在非时序数据中,我们可以采用占比来对整体构成进行解释。占比贡献仅仅可以用来对维度拆解或是加和类型的指标拆解来进行解释。

如下图所示,最终的产出结论类似于:“2016年11月的日均成交金额为11,670,其中贡献最大的是行业1,一共贡献了3,488,贡献率为30%。”

3.2 时序数据

在时序数据分析中,我们可以随着时间的变化计算出数据的波动情况,进而可对造成波动的因素进行贡献分析

为了能衡量波动,并基于波动计算造成波动的贡献值,一定需要具有一个可对比的基期数据,可以选择历史数据进行同环比的波动分析,也可以在分析前先对时序数据进行预测,以预测值为基期进行计算。

时序数据分析中的波动和贡献计算方式一定是一一对应的,当波动采用偏移7天的同比进行衡量时,贡献也一定需要采用偏移7天的基准值进行贡献衡量。

3.2.1 加和拆解(维值拆解、加和指标拆解)

3.2.1.1 历史对比贡献(同环比)

3.2.1.2 预测对比贡献

预测对比贡献和历史对比贡献公式一致,只是基期从历史值替换为预测值。

3.2.2 四则计算(指标四则计算拆解)

注意,连环替代法和差额分析法中,基期都可以选择历史值(X天同期)或是预测值,选择不同基期获得的分析效果不一样,历史值波动贡献分析主要为了解析基于过去数据的波动原因,而预测值的波动贡献分析主要为解释和目标的差距波动原因。

3.2.2.1 连环替代法

3.2.2.2 差额分析法

四、参考

  • 体验Power BI最新发布的AI图表:分解树
  • 当我们在分析异常数据时,我们在分析什么
  • 问题定位——贡献率计算
  • 巧用指标拆解和连环替代,一招定位指标的最大影响因子
  • 如何理解因素分析法?
© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号