主数据管理对于数据科学有多重要
创作时间:
作者:
@小白创作中心
主数据管理对于数据科学有多重要
引用
36氪
1.
https://www.36kr.com/p/3176111208993411
主数据管理(MDM)是确保企业各部门之间数据一致、完整和准确的关键环节。对于数据科学家而言,高质量的主数据是开展工作的基础。本文通过具体案例,深入分析了主数据不一致对供应链运营、分析和战略报告的影响,强调了主数据管理在现代企业中的重要性。
主数据管理(MDM)是实施流程以在公司各部门之间提供一致、完整和准确的主数据。
作为数据科学家,良好的主数据对您的活动有多重要?
根据在物流运营方面的工作经验,我遇到过由于主数据不一致而影响运营、分析和战略报告的问题。
为了解释主数据的重要性,我将分享一些可能受到不一致数据严重影响的关键分析产品的示例。
这些示例可用于说服您的高层管理人员投资主数据管理资源。
零售行业的主数据管理
设想
您是一家在世界各地设有门店的国际服装集团供应链部门的数据科学家。
该零售商在位于亚洲的工厂生产服装、箱包和配饰。
上图展现了通过系统管理的供应链网络。产品在商店出售,并从当地仓库补货。
不同的系统(IMS、WMS、ERP、TMS)记录产品从生产线末端到商店货架的交易数据。
如何确保跨不同系统的产品端到端跟踪?
什么是主数据管理?
这些产品通过主数据中记录的唯一 SKU ID(库存单位)进行识别。
主数据是有关供应链中管理的所有项目的重要信息,是组织的中心事实来源。
在已售商品组合中,您有两个类别
- 季节性产品
:仅在一个系列(春/夏、秋/冬)内销售的商品 - 结转
:从一年结转到另一年的永久物品
我们如何在主数据中引入新项目?
在创建过程中,主数据专家将产品相关信息输入 ERP。 - 产品信息
:净重、尺寸、危险分类 - 包装
:总重量、尺寸等。 - 处理单位
:每个(纸箱、托盘)的物品数量、托盘高度 - 商品销售
:供应商名称、采购成本、上市地点(仓库、商店)、每个市场的定价等。
这些信息将与管理您的供应链(从工厂到商店)的不同系统中的 SKU ID 相关联。
这些参数如何记录在主数据中?
数据输入过程
大多数时候,这些参数是由主数据专家手动输入到 ERP 中的。
- 采购团队
以Excel 模板的形式发送产品数据。
MDM 专家检查模板以确保其完整性,并进行随机检查以确保信息的有效性。
MDM 专家在 ERP 中创建项目
现在这些物品已经记录在系统中,
采购团队可以向供应商发送采购订单。
物流团队可以在仓库和商店接收产品。
销售团队可以跟踪商店的销售和库存水平。
- 分析团队
可以将这些新项目纳入他们的报告中。
这对数据科学家有何影响?
问题陈述
作为数据科学家,您不参与项目创建过程。然而,流程中的缺陷可能会直接影响您在组织中部署的分析产品的性能。如果该流程不可靠,会出现什么问题?
在下一部分中,我们将介绍直接影响数据科学和运营团队的问题的真实案例。
对供应链分析产品的影响
由于公司中的多个业务部门使用它,不一致的主数据会极大地影响您的端到端供应链运营。
国际货运:集装箱优化
物流团队正在使用海运从海外工厂运送工厂。
由于疫情期间运费暴涨,您的团队设计并部署了一种算法来优化集装箱托盘的装载。
其目的是找到最佳装载顺序,以最大化集装箱中装载的托盘数量。
在上图中,您可以观察到直观的加载策略(右)和优化版本(左)之间的区别。
对于这个具体的例子,该工具可以在同一个容器中装载两个额外的托盘。
主数据问题可能出现什么问题?
该工具使用主数据根据托盘中的物品估算托盘的尺寸、大小和重量。 - 如果尺寸不正确,优化后的装载计划可能与集装箱尺寸不匹配。
例如,如果主数据中单个项目的尺寸不正确,则托盘高度可能高于预期。 - 如果物品重量错误,货物总重量可能会超出限制。
例如,如果我们装载 50 箱特定物品,主货单上的每箱重量比实际重量低 2 公斤,则整个货盘将比预期重 100 公斤。
如果操作员不能遵守装载计划,后果可能是极其昂贵的。
运营:你的工具低估了货物量!
数据科学家:这不是工具;这是主数据。
运输团队可能必须预订额外的集装箱(价格非常高)或将您的货物存放在集结区数天(这可能会导致运送过程延迟)。
让我们继续讨论另一个专注于仓库拣选操作的优化算法。
仓库运营:拣货路线优化
在仓库中,在拣选路线上从一个位置走到另一个位置可占操作员工作时间的60% 到 70% 。
您与流程工程师团队一起设计并部署了一种算法,以尽量减少操作工的步行距离。
这个想法是使用空间聚类来按区域对订单进行分组,以最大限度地减少每波步行次数。
该工具将支持仓库管理系统 (WMS) 按波次(仅限于特定区域)对订单进行分组,并将其分配给操作员。
如果主数据中的尺寸错误,会发生什么情况?
仓库操作员正在使用体积和重量有限的拣选车。
该算法使用项目主数据来最大化每波的订单数量。 - 如果主数据中的尺寸不正确,算法可能会生成不适合放入购物车的订单批次。
操作员就必须在运送过程中停下来卸下购物车中的货物,从而降低生产效率。 - 如果主数据中的重量低于实际重量,算法可能会使推车超载。
这将影响操作员的生产力,并可能导致工伤事故。
这表明主数据中的问题可能会完全浪费您在开发优化工具上所付出的努力。
那么战略报告又如何呢?
战略报告:供应链可持续性
随着多年来对可持续发展透明度的需求不断增长,可持续发展团队请求您的支持以实现二氧化碳排放量报告的自动化。
本报告重点关注公司价值链中产生的3大间接排放,其中以交通运输为重点。
其中,E_CO2:排放量(以千克二氧化碳当量计算)(kgCO2eq)W_goods:货物重量(t)D:从您的仓库到最终目的地的距离(km)F_mode:每种运输方式的排放因子(kgCO2eq/t.km)
这个简单的公式可以估算出以特定运输方式在D(公里)距离内运输W_goods (吨)时产生的二氧化碳排放量。
这些结果对于衡量推动可持续发展路线图的排放基线至关重要。
如果主数据不完整怎么办?
您将面临的最大挑战是不完整性和不一致性。 - 不完整性
:您可能会发现缺少尺寸或重量的物品,因为工厂(或采购团队)没有完整填写输入模板。 - 不一致
:数据输入错误可能会将 12.2 千克变为 122 千克
风险在于提供不完整的报告或高估排放量。
对于此类战略报告来说,这是不可接受的,因为它们在年度报告发布之前要经过详细的审计。
小结
此示例列表并不详尽,但它概述了主数据管理问题如何影响操作。
垃圾进,垃圾出。没有神奇的算法可以改变这一现状。
您可能会投入资源设计优化工具来降低成本,但如果解决方案采用了错误的数据,那么这些努力就可能白费。
这对任何人来说都不足为奇;本文的目标是关注主数据,因为这个单一表可以影响整个价值链。
解决方案是实施数据质量计划。
数据质量定义了如何信任、理解和有效利用您的主数据以实现其预期目的。
热门推荐
如何找到正确的工作与生活平衡——创造健康、有益的生活
怀孕产检中遇到问题如何沟通和求助?
如何查找衣服上的品牌信息?
枣庄市峄城区探索低成本、易维护的农村生活污水治理新模式
新会冲刺千亿GDP|古井镇:全国千强镇,和美新乡村
联合保护中越边境上的金灵——东黑冠长臂猿(图)
东莞地铁2号线三期提速,滨海湾多处迎新进展
练习瑜伽对女性的好处,你一定要了解!
保底工资的算法怎么算
一个泻热逐水的名方,仅3味中药,可调理腹痛、便秘,用药需谨慎
怎么利用宏设置合并excel表
马年宝宝起名与黄姓宝宝起名:传统与现代的融合
深圳十大特色名小吃,带你领略鹏城风味
Bellevue市大型综合立体交通网络立交桥项目:30%设计完成在即
马克思主义哲学辩证法:联系、发展与矛盾的统一
如何在云服务器上进行数据库管理?
Excel表格数据整理归类全攻略
Spring Security 注册过滤器注意事项
石油焦的应用与市场前景分析
河南十大经典名菜:从黄河鲤鱼到牡丹燕菜
如何选择最适合的宣传片风格?创意、情感与表现力的平衡
手指骨折后的康复训练方法
考研英语阅读怎么训练
如何高效进行wiki知识库搭建?【详尽指南】
盲人餐厅点餐:科技之光照亮餐桌上的美食之旅
对比分子束外延(MBE)与金属有机化学气相外延(MOCVD)技术
显卡和CPU的品牌大观,市场主流解析与案例分享
考研调剂服务系统的常见问题
药师解析:褪黑激素的作用、副作用及使用注意事项
从“多巴胺”到“薄荷曼波”,流行穿搭换个马甲就能继续火?