如何管理数据指标
如何管理数据指标
1. 为什么要进行指标管理
随着公司的业务快速发展,数据指标越来越多,开始出现数据问题导致了一系列业务问题。
(1)由于企业数据资产庞大,但数据分散、口径不一致,导致员工不知道有哪些可用数据,也无法准确找到所需的数据,从而影响了数据的有效利用和决策效率。
(2)随着业务的变化,需求多变,但数据取数过程繁琐缓慢,导致需求满足速度不足,影响了业务的敏捷性和反应速度。
(3)由于数据来源多样、处理人员众多,且记录不及时,导致不同部门或人员对同一指标的理解和计算方式不一致,造成了指标不统一的问题。
(4)当系统数据出现问题时,由于数据加工链路较长,人员流动和交接不及时,导致问题排查和修复时间较长,影响了业务的稳定性和运营效率。
(5)同一指标多个口径,多个计算脚本,多处数据存储,造成了人力、数据计算、存储的极大浪费。
这些问题不仅会给基层员工带来困扰,还可能逐渐积累成为整个组织的大问题,严重影响到日常工作、战术目标的达成以及战略愿景的实现。
因此,企业需要进行信息化升级,重点是数据治理。
在这个过程中,完成指标管理,构建指标管理平台,可以让员工清楚地了解可用的数据指标,自助取数,并方便地将其应用到业务决策和运营中,从而提高整体业务的效率和竞争力。
2. 如何进行指标管理
2.1 明确指标归口
在指标管理过程中,明确指标的归口至关重要。
(1)业务归口:明确公司级和部门级指标的责任人以及口径定义、更新和删除流程。
(2)技术归口:明确每个指标的技术负责人,数据出问题时第一时间找谁排查。
明确数据从需求到生产的流程,以确保数据源到数据指标的生产路径清晰可控。
2.2 明确数据应用场景
首先,明确生产出的指标在哪些看板和数据产品中被使用。
这些看板和数据产品可能涵盖了不同的业务领域和决策层级,从管理层的战略决策到基层员工的日常工作。
明确每个指标在各个层级的应用情况,以及其在决策过程中的重要性。
其次,了解这些看板和数据产品的使用频次。
不同的指标可能在不同的时间尺度上被使用,有些可能是实时监控,有些可能是每日、每周或每月的分析报告。
了解使用频次有助于确定数据指标的更新频率和维护周期,以满足用户的实时决策需求。
3.3 数据指标分级维护
通过指标的使用情况,评估这些指标在业务中的价值,通过对指标的价值进行评估,对指标进行重要性分级,并据此分级制定维护响应方案,合理规划数据指标的生产资源,确保资源的优先分配和合理利用。
3. 通过线上共享文档指标管理
在业务量较小、复杂程度不高、团队规模较小且指标数量有限的情况下,通过线上共享文档(如Excel)进行指标管理是一种简便有效的方式。
这种方式可以满足团队之间的指标口径拉齐和信息同步的需求,同时也具有以下优势:
(1) 简便易行:Excel等在线文档平台易于使用,无需复杂的学习过程,团队成员可以快速上手,实现指标元数据的录入、共享和更新。
(2)低成本: 使用在线文档平台进行指标管理不需要额外的软件或硬件投入,只需使用现有的网络连接和电脑设备即可,成本较低。
(3)实时更新: 在线文档可以实现实时更新和同步,团队成员可以随时查看最新的指标数据,保持信息的及时性和准确性。
(4)信息透明:所有团队成员都可以在同一文档中查看和编辑指标数据,促进信息共享和透明化,减少信息沟通的误差和延迟。
综上所述,线上共享文档是一种适用于小型团队和简单业务环境的指标管理方式,能够满足基本的指标口径拉齐和信息同步的需求,同时具有简便易行、低成本、实时更新、信息透明等优势。
4. 指标管理平台
4.1 指标管理平台建设时机判断
当数据指标的生产效率已经成为提升业务效率的瓶颈时,主要表现为以下几点:
(1)指标口径统一性问题: 当公司内部存在着数据指标口径难以统一的情况,即同一指标在不同部门或场景下存在多个口径,导致不同部门对同一问题产生不同建议,公司管理决策困难。
业务端的多口径也间接导致了,在数据生产端存在一个指标有多个生成逻辑脚本,增加了计算和存储成本。
(2)业务元数据丢失或不一致:业务元数据丢失或不同版本,导致存在大量的简单重复取数需求,每次取数据都需要经过BA确认数据口径,数据开发;导致取数周期长,难以满足业务的对数据的及时性要求。
(3)技术元数据缺失:技术元数据缺失,导致在数据指标异常时不知道找谁进行排查和处理,要从指标的生成过程逐层查看,技术排查难度大且耗时。
(4)多个数据产品上出现同一指标数据不一致:可能多个数据产品从不同数据源头,自行加工数据生成了数据指标,导致了数据不一致,也是对开发、计算、存储资源的浪费。
4.2 提炼产品价值
(1)统一数据口径,提升公司通过数据决策的效率:通过建立统一的数据指标管理平台,可以确保不同部门和团队使用的数据指标具有一致的口径和定义,从而提高了公司通过数据做出决策的效率和准确性。
(2)提升数据生产效率,减少多套逻辑带来的计算和存储成本:通过统一管理数据指标的生成逻辑,可以避免出现多套逻辑导致的重复计算和存储,从而降低了数据处理的成本,提高了数据生产的效率。
(3)减少数据排查时间,快速解决数据问题: 建立了数据指标管理平台后,可以快速定位和解决数据异常问题,节省了数据排查的时间,提高了数据质量和可靠性。
(4)为后续大规模的数据产品应用提供统一的数据接口,提升开发效率:通过提供统一的数据接口,可以为后续开发数据产品提供了便捷的数据接入途径,从而提高了开发效率和产品交付速度。
(5)积累企业的数据资产,推进企业业务数字化:建立数据指标管理平台有助于积累和管理企业的数据资产,为企业的业务数字化提供了重要支持,促进了企业的业务发展和竞争优势的提升。
4.3 明确产品定位
企业内部数据生产应用的效率工具。
可以满足前端各种数据需求,对后端各种数据源进行统一加工清洗,输出统一的数据指标接口,以支持各前端产品的数据指标需求。
4.4 主要用户角色
(1)业务人员:可以基于数据分析需求,了解可用的数据指标及其定义,并根据自身需求快速完成自助提取数据的需求。
(2)数据分析师:通过建立数据指标管理平台,可以将他们从基础的数据提取需求中解放出来,从而将更多的精力用于更有价值的专题分析。
(3)数据工程师:可以利用该平台快速完成数据开发,优化数据生产流程,提高数据效率和质量;当数据异常时快速定位和解决数据问题。
4.5 指标管理系统架构规划
4.5.1 基本概念
(1)业务域:涵盖组织或企业所涉及的业务范围或领域,例如,电商公司的业务域可能包括商品管理、订单管理和用户管理等。
(2)数据域:指一个业务领域所涉及的数据集合,包括各种数据类型和数据源。举例来说,在商品管理业务域中,数据域可能包括商品信息和库存信息等。
(3)指标主题:根据部门管理职能和业务覆盖范围,在特定数据域中定义的一组相关指标,用于衡量业务绩效或监控数据状态。通常以某个特定活动或数据对象为核心,衍生出一系列相关指标。
(4)业务过程:业务过程是不可拆分的行为事件,在业过程中可定义指标、维度。
(5)维度:是度量的环境,用来反映业务的一类属性,这类属性集合构成一个维度,也称为实体对象。
(6)度量:度量是数据表中的数值数据,是被聚合的统计量,是聚合运算的结果。
(7)修饰词:是统计维度以外对指标的业务场景限定抽象。
(8)修饰词类型:对修饰词的一种抽象划分,从属于某个业务域。
(9)时间周期:用来明确统计的时间范围或时间点,例如最近30天、自然周、截止当日等。
(10)指标:衡量目标的参数,是预期中打算达到的指数、规格或标准。
原子指标:是基于某一业务事件行为下的度量,不可再拆分,如支付订单量。
派生指标:派生(衍生)指标= 1个原子指标 + 多个修饰词+ 时间周期。是原子指标业务统计范围的圈定。
事务型指标和存量型指标:分别对业务过程和实体对象某些状态进行衡量。
复合指标:是事务型指标和存量型指标的基础上复合成的指标。
4.5.2 系统模块介绍
4.5.2.1 前台模块
(1)指标查询:用户可查询系统内的指标,了解指标定义;负责人和申请权限,以及发现数据问题时的联系方式。
(2)指标取数:支持用户查询到需要的指标后,按需组合维度、修饰词和时间周期,进行即席数据查询,并下载查询数据,完成自助取数。
4.5.2.2 后台模块
(1)原子指标管理:包括指标基本信息录入,涵盖指标名称、单位、业务含义、负责人、技术负责人,以及分类信息如业务域、数据域、主题和业务过程等。
计算规则定义,基于数仓中的哪个事实表的哪个字段进行何种计算得到。
(2)衍生/复合指标管理:包括指标名称、定义和计算规则即在原子指标基础上增加维度、修饰词和时间周期形成的衍生/复合指标。
(3)维度管理:将维度的逻辑和具体的维度物理表映射起来。
(4)修饰词、修饰词类型管理:类似于词库管理,包括修饰词和修饰词类型的增删改查。然后用于构建衍生/复合指标的时候,进行关联。修饰词类型从属于某个业务域,用于对指标进行分类。
(5)业务域、数据域、指标主题管理:用于对指标进行分类,类似于词库管理。
参考文献
数据产品小lee.指标管理系统从0到1,从规划到落地,这篇文章手把手教会你.
等待下一个秋天.数仓建模—指标体系.