大数据之数据仓库的分层:ODS/DWD/DWS/ADS
创作时间:
作者:
@小白创作中心
大数据之数据仓库的分层:ODS/DWD/DWS/ADS
引用
CSDN
1.
https://blog.csdn.net/goodjava2007/article/details/141712462
数据仓库的分层架构是大数据处理中一个重要的概念,它将数据按照不同的处理阶段和用途进行分类存储,以提高数据处理的效率和灵活性。以下是数据仓库的主要分层及其职责:
分层简介
数据仓库按自下而上的顺序分为:
ETL层(Extract-Transform-Load):数据清洗层,存原始数据;
ODS层(Operational Data Store):操作数据源层;
CDM层(Common Dimensional Model):公共维度模型层,
主要包括DWD层(Data Warehouse Detail 数据明细层) 和 DWS层(Data Warehouse Summary 数据汇总层)两部分;
ADS层(Application Data Service):数据应用层。
职责简介
ODS层(Operational Data Store):贴源层,也称为操作数据源层,是数据仓库中的一个核心组成部分,该层主要用于保存原始数据,完成数据积存,通常反映了企业业务系统中的最新操作,同时也是进行数据仓库的基础,ODS层的数据被保存在磁盘中,直接体现了数据仓库的一个特性——非易失性。
CDM层(Common Dimensional Model):公共维度模型层,是数据仓库中最核心和最关键的一层,该层主要用于提供标准化、共享的维度模型,为数据分析提供便利。CDM层通常包括数据明细层(DWD)和数据汇总层(DWS)两个部分。
DWD层(Data Warehouse Detail):数据明细层,接收数据仓库ODS层的原始数据,并进行清洗、标准化、维度退化、异常数据剔除等操作,进行统一处理,用于存储详细的完整的数据,为数据分析提供支持。DWD层一般按照业务主题建模,包含多个维度表和事实表,维度表可以用来描述业务数据的特征,而事实表则包含了关键数据指标(如销量、价格等)。
DWS层(Data Warehouse Summary):数据汇总层,也称宽表层,通过聚合和汇总,将DWD层中的数据按照主题进行汇总,形成宽表,进而提升数据分析性能。DWS层通常包含多个宽表,每个宽表都是由多个事实表和维度表经过聚合和分组运算生成的,DWS层中的宽表可以满足特定主题和不同维度的分析需求,减少了对其他表的操作,提升数据分析性能。
- ADS层(Application Data Service):数据应用层,其主要功能是保存结果数据,为外部系统提供查询接口,基于数据仓库的数据为企业提供增值应用,并将数据仓库的数据应用于企业决策、报表、分析、控制等领域。数据仓库ADS层通常采用OLAP(Online Analytical Processing)技术,用于快速访问和查询数据。数据仓库ADS层一般包括多个宽表,这些宽表一般可以通过BI工具或自定义应用程序查询和访问,以满足企业的各种数据需求,为了提高访问和查询速度,ADS层通常使用数据索引、缓存和预聚合等技术。
数据流转
借助帆软的图,来描述数据分层的数据流向。
热门推荐
银杏叶好还是血塞通好
司法鉴定程序:重新鉴定的条件与操作指南
合租生活指南:如何与室友和谐相处
山不过来,我过去
2025年立春时间及其文化意义
航空航天制造业企业的航空器产品适航认证
惜败5分!中国男篮球员赛后评分分析:3人不达标,胡明轩荣获满分
肇庆宋城墙的历史故事
姜茶,暖心暖胃的同时,注意自身体质
食用油炸食物后胃疼怎么办?4个实用缓解方法
AI在办公智能推荐系统中的应用:个性化服务,提升用户体验
OpenAI Whisper:语音识别技术的革新者—深入架构与参数
《哪吒》里的家族企业传承启示录
数说中国家庭|年轻一代亲戚关系疏远,家族规模或减小
安卓或原生支持卫星通信,谷歌此举的原因并不复杂
多模态模型架构演变与相关知识总结
如何判断自己是否患有抑郁症?5个实用的自我评估方法
如何识别抑郁症?90道题帮你自测,这些相处之道请收好
虚拟号码验证码短信接收平台——数字化时代的隐私守护者
如何妥善处理投资盈利本金以实现资产增值?这样的处理方式存在哪些潜在风险?
陈凯歌的浪漫主义
怪物猎人荒野检查网络连接并重试?试试这些措施
激光治疗飞蚊症效果怎么样
外媒实测山地车把顺应性
司法鉴定撤销的标准及法律适用分析
如何评估取证方法的效果
传谷歌携手联发科开发TPU芯片
如果地球只有1厘米,按比例缩小的宇宙有多大?答案让人绝望!
拘留所环境如何?揭秘我国强制收容所的内部生活
急救指南:出血、烫伤、卡喉、胸痛、脑梗,这个春节从容应对这些情况