数仓指标体系:原子指标、派生指标与衍生指标详解
创作时间:
作者:
@小白创作中心
数仓指标体系:原子指标、派生指标与衍生指标详解
引用
CSDN
1.
https://m.blog.csdn.net/qq_45972323/article/details/137651509
在数据仓库的设计与开发中,建立一个清晰且标准化的指标体系至关重要。这不仅能确保数据的一致性和准确性,还能提高数据的复用性和分析效率。本文将详细介绍原子指标、派生指标和衍生指标的概念,并探讨它们在数据仓库建模中的具体应用。
数仓指标体系
明确统计指标的具体工作是深入分析需求,构建指标体系。构建指标体系的主要意义在于实现指标定义的标准化。所有指标的定义都必须遵循同一套标准,这样能有效避免指标定义存在歧义或重复等问题。
指标体系相关概念
- 原子指标
原子指标基于某一业务过程的度量值,是业务定义中不可再拆解的指标,原子指标的核心功能就是对指标的聚合逻辑进行了定义。我们可以得出结论,原子指标包含三要素,分别是业务过程、度量值和聚合逻辑。
例如订单总额就是一个典型的原子指标,其中的业务过程为用户下单、度量值为订单金额,聚合逻辑为sum()求和。需要注意的是原子指标只是用来辅助定义指标一个概念,通常不会对应有实际统计需求与之对应。
- 派生指标
派生指标基于原子指标,其与原子指标的关系如下图所示。
与原子指标不同,派生指标通常会对应实际的统计需求。请从图中的例子中,体会指标定义标准化的含义。
- 衍生指标
衍生指标是在一个或多个派生指标的基础上,通过各种逻辑运算复合而成的。例如比率、比例等类型的指标。衍生指标也会对应实际的统计需求。
指标体系对于数仓建模的意义
通过上述两个具体的案例可以看出,绝大多数的统计需求,都可以使用原子指标、派生指标以及衍生指标这套标准去定义。同时能够发现这些统计需求都直接的或间接的对应一个或者是多个派生指标。
当统计需求足够多时,必然会出现部分统计需求对应的派生指标相同的情况。这种情况下,我们就可以考虑将这些公共的派生指标保存下来,这样做的主要目的就是减少重复计算,提高数据的复用性。
这些公共的派生指标统一保存在数据仓库的DWS层。因此DWS层设计,就可以参考我们根据现有的统计需求整理出的派生指标。
热门推荐
什么是抗阻训练?老年人为什么要进行抗阻训练?
《哪吒2》票房破140亿,周边商品成交额超3亿
海水淡化设备实现电厂能量的有效转换与水资源的可持续供给
“讹诈”行为是否违法?一文详解敲诈勒索罪的法律边界
养老金差距22倍!白岩松对话北大教授,提议大幅提高农民养老金!
薯片的制作方法
拔罐有什么讲究
惊蛰养生,不能错过这10种食物
盐水漱口的功效与作用
RGP镜和OK镜有什么区别?作用机理、佩戴时间、验配过程及适用人群全解析
火影忍者手游:蝎绯流琥全面解析——技能与实战表现
京东股权曝光:刘强东控制11.2%股份 有70.5%投票权
头发软化需要多长时间?资深理发师为你讲解,看完就知道
Cult电影:小众中的经典
PCB故障排除:提示、工具和维修指南
哪些句子可以在与老公沟通时避免误解?
婚姻解读:从法律角度解析婚姻关系
父子关系可以断绝吗
一句网络热梗背后的潜台词:请走进年轻人的心
直播切片,香不香?
李重润墓壁画:初唐艺术的辉煌与历史的印记
纽约高线公园,一个非营利项目的运营奇迹
小球反弹问题详解(蓝桥杯)
如何安装门缝胶条?安装门缝胶条的步骤有哪些?
紧急救护知识:掌握关键步骤为生命护航
近视科普:如何通过改善睡眠预防近视?
干货贴 | 自用大路灯6个月,真实反馈来了
油炸薯片的加工工艺:从原料到成品的完整生产流程
家庭电路短路和开路的检修方法
为什么狮子擅长协作