解密数据血缘:数据资产管理核心技术详解
创作时间:
2025-01-21 22:41:25
作者:
@小白创作中心
解密数据血缘:数据资产管理核心技术详解
《数据资产管理核心技术与应用》是由清华大学出版社出版的一本图书,该图书主要特点如下:
- 依托于大数据技术,独家解密数据血缘的底层技术实现
- 详解数据资产管理的知识体系和核心技术
- 应用元数据管理和数据建模技术,充分发挥出数据资产的更大潜力和价值
- 全书从元数据、数据血缘、数据质量、数据服务、数据监控、数据建模、数据架构等多个维度来剖析大数据资产管理的核心技术与应用
核心章节重点介绍了数据血缘的底层技术实现,包括:
- 如何从Hive中获取数据血缘
- 从Spark 执行计划中获取数据血缘
- 从Spark SQL语句中获取数据血缘
- 从Flink中获取数据血缘
- 从数据任务的编排系统中获取数据血缘
通常来说,数据血缘的来源可以包括数据源自身、数据处理的任务、数据任务的编排系统等。
数据源自身:比如像Hive,由于其本身就是支持通过HQL做数据处理的,所以其本身就可以通过数据处理的过程来分析从而获取血缘。
数据处理的任务:这点很容易理解,因为不管是实时任务还是离线任务,都会涉及到数据逻辑的处理,从数据任务的底层实现技术上来说,不管是Hadoop的Map-Reduce 任务还是Spark任务还是Flink任务,本质也都是在做数据的转换处理,有数据的转换,就可能会有数据血缘的变化。
数据任务的编排系统:这点也很容易理解,如下图所示,在任务编排时,可能会将很多不同的任务节点按照依赖顺序串联起来。前一个任务节点的数据输出会是下一个任务节点的数据输入,所以肯定也会产生数据的转换,就肯定也会存在血缘。
热门推荐
宋清辉等专家:特朗普重返白宫 全球经济与资本市场面临新挑战
内燃机研究的领军人物:Zoran Filipi教授
地球上进化最成功的物种,竟然是蝎子?那为啥它们没成地球霸主?
白萝卜炖排骨的创新改良:养生与美味的完美结合
秋季养生必备:白萝卜炖排骨的创新搭配
长沙橘子洲头青年毛泽东雕塑:一座承载历史记忆的艺术丰碑
交通肇事逃逸:法律后果与预防措施
白萝卜炖排骨:冬季暖心必备的养生美味
从梵高到毕加索:艺术大师教你玩转Photoshop设计
玩转Photoshop,提升设计水平:从基础学习到审美进阶
熊猫邀你来雅安之寻古路篇丨雅安还有这些徒步胜地
一碗雪菜肉丝面的热量
雪菜肉丝面:从历史传承到烹饪技巧的全面解析
庐山东门必打卡:三叠泉&牯岭镇
三叠泉:庐山东门的网红打卡地
重庆大学B区的老校门和老礼堂:见证历史的建筑之美
春季美食推荐,这些菜你吃过吗?
来腾冲吃春,体验有一种叫云南的生活
520胶水粘手?教你几招轻松搞定!
520胶水去除技巧大揭秘:从皮肤到家居,多种实用解决方案
黑木耳海苔飯包:黑米紫米怎么选?中医师教你用黑色食物养出乌黑浓密的秀发
“新中式”在饮品届火出圈,“五黑”食材能否搭上这波新潮流?
基于血清脂质组学的胃癌诊断与预后分型模型研究取得重要进展
大蒜可以怎么吃最好 大蒜水有什么功效
中国定位专家顾均辉出席第41届闽商财富经济论坛,分享企业定位实践之道
周玉明和许雯雯的性格大揭秘
脾氨肽口服冻干粉疗程多少属于安全的
为什么医生不建议吃脾氨肽
写给自己的生日感言,简短走心
《恐怖奶奶2》多人联机模式角色职责揭秘