数据仓库建设规范方案
创作时间:
作者:
@小白创作中心
数据仓库建设规范方案
引用
CSDN
1.
https://blog.csdn.net/weixin_44292902/article/details/136905195
数据仓库建设规范是确保数据仓库项目成功的关键。规范约束的是数仓建设的全流程,以及后续的迭代和运维。事实上,数仓规范文档,应该随着架构设计文档,在数仓开发启动之前,分发给所有相关人员,且是所有人都必须严格遵守的约定。
在数据仓库建设过程中,经常会遇到一些困惑,比如不知道该从哪张表出数,表A和表B似乎都可以,但实际操作时却发现数据对不上,最后不得不从源头重新计算。为了避免这类问题,建立一套完善的数仓建设规范显得尤为重要。
分层设计规范
分层设计是数据架构设计的产出之一,在模型设计环节做为强制规范遵守。数据仓库通常分为以下几层:
- 应用层:面向最终应用,生命周期与应用同步。
- 汇总数据层+主题宽表:对数据源做清洗、转换、补全、编码转换后加载到明细数据层。
- 贴源层:原始数据不做变化或者仅做最简单的补全后存入。
各层之间的调用规范如下:
- ODS 只能被 DWD 调用。
- DWD 可以被 DWS 和 ADS 调用。
- DWS 只能被 ADS 调用。
- 数据应用可以调用 DWD、DWS、ADS,但建议优先考虑使用汇总度高的数据。
主题域划分规范
主题域通常是联系较为紧密的数据主题的集合,方便寻找和使用数据。基本原则包括高内聚、低耦合,数量不宜过多(建议不超过十个),必须保持稳定等。
主题域的划分依据可以是:
- 业务或业务过程:如广告域、客户域等。
- 需求方:如财务主题域。
- 功能或应用:如朋友圈数据域。
- 部门:如运营域、技术域等。
流程规范
上线支持团队就绪,严格按照上线操作步骤执行,失败时需要有回滚机制。同时,需要确保内外网隔离,核心数据存储和功能模块只开放给特定人员。至少要做到表级别的权限控制,对于特别敏感的数据(如用户年龄、号码等)应该放到专门的数据库中。
其他要求
- 表、字段的备注信息必须言简意赅。
- 字段类型的约束要明确,比如字符串用 String,数值用 Int,日期用 yyyyMMdd 等格式。
本文从设计规范、流程规范、质量管控、数据安全四个方面,详细阐述了数仓规范,基本涵盖了数仓规范的方方面面,供参考。
热门推荐
漏洞挖掘实战:从信息收集到渗透测试全流程详解
买电视好还是买投影仪好?电视机和投影仪哪个适合家用
徐医附院:电磁导航支气管镜联合ROSE技术助力疑难病例诊疗
铁路新客规!你关心的学生旅客购票问题都在这里——
夏威夷是如何成为美国一个州的?
饭后恶心呕吐?探究5大原因,教你如何有效缓解!
《谁是狼人》平民攻略:三个实用技巧助你练就“火眼金睛”
“三英战吕布”中的“三英”及故事简述
包饺子调饺子馅,正确使用这5种调料,饺子才能味道鲜美
业务中台架构怎么与前台和后台协作
《怀孕后哭红眼沈小姐不回头了》:婚姻中的失望与痛苦
中国古代服饰:从信仰到科技的文明印记
兄弟姐妹之间,最好的相处方式,是“四个字”
最佳第六人!本赛季发挥最好的6位替补,伊森上榜 希尔德表现惊艳
糖醋黄河鲤,鲜香美味的家常菜(传统美食糖醋黄河鲤的家庭做法)
概率思维:从不确定性中寻找确定性
白沙县新入职公务员到社区锻炼纪实
椭圆机减肥实用指南:3个月减23斤,三款高性价比产品推荐
起诉的证据材料如何整理寄法院
丘成桐谈“杰出少年示范数学班”:若“一刀切”培养,对有天分者反而不公平
智能制造专业就业前景分析:七大方向全面解析
海东市交通运输事业高质量发展综述:大道如虹天地宽
漫威封神之作,后劲大揭秘!
2024山东夏季学考成绩发布!合格考与等级考有何区别?
智慧养猪场:数字化转型与智能化升级的未来之路
五一商圈24小时便利店,不夜星城的温馨补给站
五行属土的寓意及其相关字词象征意义
日本鬣羚:日本特有珍稀野生动物
嬴政之父:历史与传说的交织
《全面战争三国》外交攻略详解 各势力外交技巧解析