问小白 wenxiaobai

资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

大数据入门：大数据数据仓库解析

创作时间:

作者:

@小白创作中心

大数据入门：大数据数据仓库解析

引用

CSDN

1.

https://blog.csdn.net/shuimuzh123/article/details/111181459

在大数据时代，数据仓库的选型策略变得至关重要。从传统数据仓库到现代大数据环境下的数据仓库，其核心的技术架构随着最新技术趋势不断演进。本文将为您详细解析大数据环境下的数据仓库，包括离线数仓、实时计算以及两种主流的数仓架构（Lambda架构和Kappa架构）。

数据仓库的概念最早在1991年被提出，而近年来随着大数据趋势的发展，实时数据处理技术的快速发展推动了数据仓库技术架构的不断演进。目前，实时数据仓库主要分为两种架构：批数据+流数据和批流一体。

1. 离线数仓

离线数仓，即传统数仓，其数据以T+1的形式计算并存储，为前台的各种分析应用提供预计算好的数据。在大数据时代，这种模式被称为“大数据的批处理”。具体的技术组件替换如下：

数据采集：Flume/Logstash + Kafka 替代传统数仓的FTP
批量数据同步：Sqoop、Kettle 替代传统数仓工具
大数据存储：Hadoop HDFS/Hive、TiDB、GP等MPP数据库替代Oracle、MySQL等传统数据库
大数据计算引擎：MapReduce、Spark、Tez 替代传统数据库执行引擎
OLAP引擎：Kylin/Druid（Molap，需预计算）、Presto/Impala（Rolap，无需预计算）替代BO、Brio、MSTR等BI工具

2. 实时计算

实时数仓最初在日志数据分析业务中广泛应用，随后在各种实时战报大屏的推动下得到进一步发展。与离线计算相比，实时计算减少了数据落地环节，主要替换了数据计算引擎。目前，纯流式数据处理主要采用Spark Streaming，而Flink则实现了批流一体的处理能力。实时计算的结果可以存储到各种数据库中，也可以直接对接到大屏进行展示。

3. 大数据环境下的两种数仓架构

Lambda 架构

Lambda架构的核心包括批数据处理层、流数据处理层和服务层。批数据处理层负责处理历史长时间数据计算，流数据处理层则应对短时间内的实时数据计算。如果一个需求需要历史到当前所有数据的累加结果，那么就在服务层将两部分数据进行累加。

Kappa 架构

Kappa架构的设计理念是将所有数据都进行流式计算。数据来源是消息队列（如Kafka），流计算引擎（如Flink）计算所有数据并存储结果。当需求发生变化时，可以通过调整Kafka的offset，重启任务重新计算，并将新结果存储到新的表中。当新表的数据进度赶上旧表时，就可以停止旧表的任务。

关于大数据环境下的数据仓库，以上内容为大家提供了基本的介绍。总体来说，大数据时代的数据仓库架构设计需要更多结合具体的业务需求进行考量。

热门推荐

曼陀罗在佛教的意义

曼陀罗在佛教的意义

单亲妈妈的逆袭之路：用坚韧精神感动千万网友

单亲妈妈的逆袭之路：用坚韧精神感动千万网友

八字命理中的炎上格：特征与命理分析

八字命理中的炎上格：特征与命理分析

夏日黄昏：100句优美描写

夏日黄昏：100句优美描写

2026年“轰20”将亮相？美国专家：与B21完全不同，太可怕了！

2026年“轰20”将亮相？美国专家：与B21完全不同，太可怕了！

人工草坪材质选择指南：哪种最适合你？

人工草坪材质选择指南：哪种最适合你？

投资基金的有效组合策略及其潜在风险

投资基金的有效组合策略及其潜在风险

UPF多少才够用？如何选购护理？防晒服全方位评测

UPF多少才够用？如何选购护理？防晒服全方位评测

春季前胸后背长痘痘该如何处理

春季前胸后背长痘痘该如何处理

DIF与DEA是什么意思？详解MACD指标核心要素

DIF与DEA是什么意思？详解MACD指标核心要素

水龙头净水器选购指南：作用、选购要点及注意事项全解析

水龙头净水器选购指南：作用、选购要点及注意事项全解析

有效的热身：训练前如何以及为何进行热身

有效的热身：训练前如何以及为何进行热身

晚上在家如何充实自己？七个适合夜晚的兼职项目

晚上在家如何充实自己？七个适合夜晚的兼职项目

职业队连场不敌大学生队，CBA全明星赛场内外皆遇冷

职业队连场不敌大学生队，CBA全明星赛场内外皆遇冷

项目型销售如何制定有效的销售策略？

项目型销售如何制定有效的销售策略？

一个平方散养多少只鸡，0-4周龄能养10-15只/平方米

一个平方散养多少只鸡，0-4周龄能养10-15只/平方米

宝安区首届模拟联合国校际线上展示活动成功举办

宝安区首届模拟联合国校际线上展示活动成功举办

离婚率持续上升：现代女性独立意识的崛起与家庭关系的变化

离婚率持续上升：现代女性独立意识的崛起与家庭关系的变化

新会陈皮：从南宋宫廷到现代产业的六百年传奇

新会陈皮：从南宋宫廷到现代产业的六百年传奇

海南从七个方面提升琼州海峡客滚运输高峰期服务保障能力

海南从七个方面提升琼州海峡客滚运输高峰期服务保障能力

跌停！360亿龙头被ST了

跌停！360亿龙头被ST了

什么兼职能让高中生赚到钱？

什么兼职能让高中生赚到钱？

浓香型白酒：以四川泸州老窖、五粮液为典型代表，也称泸香型酒。

浓香型白酒：以四川泸州老窖、五粮液为典型代表，也称泸香型酒。

银行高管与基层员工薪酬差距有多大？这份数据告诉你真相

银行高管与基层员工薪酬差距有多大？这份数据告诉你真相

焦虑症患者的饮食指南：七类食物助力情绪稳定

焦虑症患者的饮食指南：七类食物助力情绪稳定

VMware虚拟机BIOS设置完全指南

VMware虚拟机BIOS设置完全指南

甲骨文“安”字：守护千年安宁的文化符号

甲骨文“安”字：守护千年安宁的文化符号

鱼龙“混”杂：像鱼不是鱼，叫龙不是恐龙？

鱼龙“混”杂：像鱼不是鱼，叫龙不是恐龙？

鲁迅身上的“父味”

鲁迅身上的“父味”

公司调整薪资结构违法吗

公司调整薪资结构违法吗

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号