数据仓库建设规范方案
创作时间:
作者:
@小白创作中心
数据仓库建设规范方案
引用
CSDN
1.
https://blog.csdn.net/weixin_44292902/article/details/136905195
数据仓库建设规范是确保数据仓库项目成功的关键。规范约束的是数仓建设的全流程,以及后续的迭代和运维。事实上,数仓规范文档,应该随着架构设计文档,在数仓开发启动之前,分发给所有相关人员,且是所有人都必须严格遵守的约定。
在数据仓库建设过程中,经常会遇到一些困惑,比如不知道该从哪张表出数,表A和表B似乎都可以,但实际操作时却发现数据对不上,最后不得不从源头重新计算。为了避免这类问题,建立一套完善的数仓建设规范显得尤为重要。
分层设计规范
分层设计是数据架构设计的产出之一,在模型设计环节做为强制规范遵守。数据仓库通常分为以下几层:
- 应用层:面向最终应用,生命周期与应用同步。
- 汇总数据层+主题宽表:对数据源做清洗、转换、补全、编码转换后加载到明细数据层。
- 贴源层:原始数据不做变化或者仅做最简单的补全后存入。
各层之间的调用规范如下:
- ODS 只能被 DWD 调用。
- DWD 可以被 DWS 和 ADS 调用。
- DWS 只能被 ADS 调用。
- 数据应用可以调用 DWD、DWS、ADS,但建议优先考虑使用汇总度高的数据。
主题域划分规范
主题域通常是联系较为紧密的数据主题的集合,方便寻找和使用数据。基本原则包括高内聚、低耦合,数量不宜过多(建议不超过十个),必须保持稳定等。
主题域的划分依据可以是:
- 业务或业务过程:如广告域、客户域等。
- 需求方:如财务主题域。
- 功能或应用:如朋友圈数据域。
- 部门:如运营域、技术域等。
流程规范
上线支持团队就绪,严格按照上线操作步骤执行,失败时需要有回滚机制。同时,需要确保内外网隔离,核心数据存储和功能模块只开放给特定人员。至少要做到表级别的权限控制,对于特别敏感的数据(如用户年龄、号码等)应该放到专门的数据库中。
其他要求
- 表、字段的备注信息必须言简意赅。
- 字段类型的约束要明确,比如字符串用 String,数值用 Int,日期用 yyyyMMdd 等格式。
本文从设计规范、流程规范、质量管控、数据安全四个方面,详细阐述了数仓规范,基本涵盖了数仓规范的方方面面,供参考。
热门推荐
有蚕豆病能吃西替利嗪片
世经述评 | 法国经济长期性风险仍待解决
有案底 滴滴通过了:法律合规与企业责任的双重考量
宿命与自由意志:人生选择与命运的深刻思考
出口退税全攻略:轻松搞定流程和资料准备
测头测量误差产生的原因与应对策略
胎教从什么时候开始?【医生监督】
自制淡奶油
火箭弹的发展、使用以及未来趋势
二十八宿的正确读音及其文化意义
路由器设置相同SSID就可以无缝漫游?
TLIF术的围手术期护理
首例微创内镜下脊柱融合手术:UBE-TLIF微创手术治疗腰椎滑脱、椎管狭窄症
Fortinet防火墙VPN配置详解:从入门到实战
如何治疗手指内的风湿性疼痛
中医考研科目全解析
有何食物可供上夜班者食用,既对身体有益又不致肥胖
银行存折开通手机银行功能指南:不同银行政策全解析
健康小知识 | 在健康管理中,如何帮助老年人维持慢性疾病稳定?
专家支招:科学有效的方法帮你快速放屁
文和乱武:东汉末年的一场权力游戏
米诺地尔副作用全解析:使用后长红点怎么办?
掌握ping命令,轻松检测网络状态与连接质量的方法解析
《英勇之地》国服公测:一年打磨后的蜕变与革新
SSD固态硬盘坏道修复方法详解(实用技巧教你快速修复SSD固态硬盘坏道)
信用卡逾期一次上征信了怎么办影响贷款吗
半夜胃里反酸水怎么回事
二楼改下水道多少钱?不同情况下的费用估算
守望先锋安娜英雄威能全面解析 精准治疗与强大控制技能详解
咖啡与红牛提神效果大比拼:谁更能提升你的精力?