解密数据血缘:数据资产管理核心技术详解
创作时间:
2025-01-21 22:41:25
作者:
@小白创作中心
解密数据血缘:数据资产管理核心技术详解
《数据资产管理核心技术与应用》是由清华大学出版社出版的一本图书,该图书主要特点如下:
- 依托于大数据技术,独家解密数据血缘的底层技术实现
- 详解数据资产管理的知识体系和核心技术
- 应用元数据管理和数据建模技术,充分发挥出数据资产的更大潜力和价值
- 全书从元数据、数据血缘、数据质量、数据服务、数据监控、数据建模、数据架构等多个维度来剖析大数据资产管理的核心技术与应用
核心章节重点介绍了数据血缘的底层技术实现,包括:
- 如何从Hive中获取数据血缘
- 从Spark 执行计划中获取数据血缘
- 从Spark SQL语句中获取数据血缘
- 从Flink中获取数据血缘
- 从数据任务的编排系统中获取数据血缘
通常来说,数据血缘的来源可以包括数据源自身、数据处理的任务、数据任务的编排系统等。
数据源自身:比如像Hive,由于其本身就是支持通过HQL做数据处理的,所以其本身就可以通过数据处理的过程来分析从而获取血缘。
数据处理的任务:这点很容易理解,因为不管是实时任务还是离线任务,都会涉及到数据逻辑的处理,从数据任务的底层实现技术上来说,不管是Hadoop的Map-Reduce 任务还是Spark任务还是Flink任务,本质也都是在做数据的转换处理,有数据的转换,就可能会有数据血缘的变化。
数据任务的编排系统:这点也很容易理解,如下图所示,在任务编排时,可能会将很多不同的任务节点按照依赖顺序串联起来。前一个任务节点的数据输出会是下一个任务节点的数据输入,所以肯定也会产生数据的转换,就肯定也会存在血缘。
热门推荐
生成式AI:重塑人类心理的新力量
国债逆回购投资攻略:证券经理不愿透露的技巧与方法!
民国第一村:画境水乡,时光深邃
分手后保持联系,复合可能性有多大?
心理学:不要轻易跟一个男人断联,就算你认为自己不爱他了
分手后的冷静期:他再次联系我,该如何回应?
离婚复合:挽回老婆的成功案例分享
低卡蛋饼火遍健身圈,减脂必备!
江安幼儿园亲子互动:火腿鸡蛋饼DIY
韭菜鸡蛋饼:简单美味的早餐新宠
天津风味鸡蛋饼在家轻松做
黎光社区亲子活动:一起做蔬菜鸡蛋饼
心理健康在职业发展中的重要性
抑郁症患者能否参军?从身体到心理的全面解析
年轻人为什么爱开封:八朝古都也passion
开封二日游路线推荐 | 开封2天自由行行程安排
河南五天最火网红路线打卡攻略,河南旅游亲身经历分享
八朝古都开封,你知道是哪八朝吗?
揭秘3亿年前的飞行巨兽:巨型蜻蜓的兴衰史
猪蹄界的“双雄争霸”,你站哪边?
猪前脚VS猪后脚:谁更适合煲汤?
猪前脚和后脚,谁才是真正的"下饭神器"?
杏仁粉:冬季养生的新选择
早餐新宠:西红柿鸡蛋饼的完美营养组合
学会这招,西红柿鸡蛋饼秒杀街头早点!
亲子DIY美味鸡蛋饼,共度温馨周末时光
白蛋白偏低,健康警示需关注
汉语拼音发音技巧全攻略:从声母到声调的完整指南
汉语拼音发音技巧大揭秘!
经济日报聚焦:房地产新政策对楼市影响几何?