数仓指标体系:原子指标、派生指标与衍生指标详解
创作时间:
作者:
@小白创作中心
数仓指标体系:原子指标、派生指标与衍生指标详解
引用
CSDN
1.
https://m.blog.csdn.net/qq_45972323/article/details/137651509
在数据仓库的设计与开发中,建立一个清晰且标准化的指标体系至关重要。这不仅能确保数据的一致性和准确性,还能提高数据的复用性和分析效率。本文将详细介绍原子指标、派生指标和衍生指标的概念,并探讨它们在数据仓库建模中的具体应用。
数仓指标体系
明确统计指标的具体工作是深入分析需求,构建指标体系。构建指标体系的主要意义在于实现指标定义的标准化。所有指标的定义都必须遵循同一套标准,这样能有效避免指标定义存在歧义或重复等问题。
指标体系相关概念
- 原子指标
原子指标基于某一业务过程的度量值,是业务定义中不可再拆解的指标,原子指标的核心功能就是对指标的聚合逻辑进行了定义。我们可以得出结论,原子指标包含三要素,分别是业务过程、度量值和聚合逻辑。
例如订单总额就是一个典型的原子指标,其中的业务过程为用户下单、度量值为订单金额,聚合逻辑为sum()求和。需要注意的是原子指标只是用来辅助定义指标一个概念,通常不会对应有实际统计需求与之对应。
- 派生指标
派生指标基于原子指标,其与原子指标的关系如下图所示。
与原子指标不同,派生指标通常会对应实际的统计需求。请从图中的例子中,体会指标定义标准化的含义。
- 衍生指标
衍生指标是在一个或多个派生指标的基础上,通过各种逻辑运算复合而成的。例如比率、比例等类型的指标。衍生指标也会对应实际的统计需求。
指标体系对于数仓建模的意义
通过上述两个具体的案例可以看出,绝大多数的统计需求,都可以使用原子指标、派生指标以及衍生指标这套标准去定义。同时能够发现这些统计需求都直接的或间接的对应一个或者是多个派生指标。
当统计需求足够多时,必然会出现部分统计需求对应的派生指标相同的情况。这种情况下,我们就可以考虑将这些公共的派生指标保存下来,这样做的主要目的就是减少重复计算,提高数据的复用性。
这些公共的派生指标统一保存在数据仓库的DWS层。因此DWS层设计,就可以参考我们根据现有的统计需求整理出的派生指标。
热门推荐
叶圣陶:用现实主义笔触描绘教育界的黑暗
家中来客不用愁?分享6道好吃的家常菜做法,鲜香美味,简单易学
跟孩子一起做彩色花卷的乐趣
花卷DIY大赛:谁家花卷最貌美?
全麦花卷:健康饮食新宠!
用优质面粉做出网红大大花卷,蓬松柔软又香甜!
靠财政倾斜,还是教育分配……哪些政策更能减少社会不平等丨数据说话
Qt Creator新手必看:链接器错误大揭秘!
安全必备:破窗锤的正确使用与重要性
正确使用破窗器,确保车辆落水时的黄金逃生时间
正确使用破窗器,确保车辆落水时的黄金逃生时间
秋冬头痛?试试燕麦+香蕉+牛奶!
三七伤药片:功效、使用方法与注意事项
秋冬头痛怎么办?中医教你几招!
亲子DIY小馒头,萌娃秒变厨房小达人!
点妈辅食教你做松软紫薯小馒头
尼山圣境《金声玉振》:穿越时空的文化盛宴
尼山圣境《金声玉振》:一场穿越千年的文化盛宴
尼山圣境《金声玉振》获国家艺术基金评审推荐
湿疹最简单的自愈方法
石家庄资本市场,正式发力了
复盘186家上市公司年报,消费龙头企业谁在狂奔?
骨质疏松可防可治
春节前的年轻人:盼归还是想逃?
春节不回家?教你轻松应对家人关心
中国会费涨16亿!联合国这次的“账单”合理吗?
跆拳道:全面提升青少年心理素质的有效途径
跆拳道:塑造坚韧精神的最佳课堂
油爆鱼(熏鱼)
一口吃下苏式爆鱼,满口鲜香(以苏式独特鱼料烹制的鲜美佳肴)