主数据管理对于数据科学有多重要
创作时间:
作者:
@小白创作中心
主数据管理对于数据科学有多重要
引用
36氪
1.
https://www.36kr.com/p/3176111208993411
主数据管理(MDM)是确保企业各部门之间数据一致、完整和准确的关键环节。对于数据科学家而言,高质量的主数据是开展工作的基础。本文通过具体案例,深入分析了主数据不一致对供应链运营、分析和战略报告的影响,强调了主数据管理在现代企业中的重要性。
主数据管理(MDM)是实施流程以在公司各部门之间提供一致、完整和准确的主数据。
作为数据科学家,良好的主数据对您的活动有多重要?
根据在物流运营方面的工作经验,我遇到过由于主数据不一致而影响运营、分析和战略报告的问题。
为了解释主数据的重要性,我将分享一些可能受到不一致数据严重影响的关键分析产品的示例。
这些示例可用于说服您的高层管理人员投资主数据管理资源。
零售行业的主数据管理
设想
您是一家在世界各地设有门店的国际服装集团供应链部门的数据科学家。
该零售商在位于亚洲的工厂生产服装、箱包和配饰。
上图展现了通过系统管理的供应链网络。产品在商店出售,并从当地仓库补货。
不同的系统(IMS、WMS、ERP、TMS)记录产品从生产线末端到商店货架的交易数据。
如何确保跨不同系统的产品端到端跟踪?
什么是主数据管理?
这些产品通过主数据中记录的唯一 SKU ID(库存单位)进行识别。
主数据是有关供应链中管理的所有项目的重要信息,是组织的中心事实来源。
在已售商品组合中,您有两个类别
- 季节性产品
:仅在一个系列(春/夏、秋/冬)内销售的商品 - 结转
:从一年结转到另一年的永久物品
我们如何在主数据中引入新项目?
在创建过程中,主数据专家将产品相关信息输入 ERP。 - 产品信息
:净重、尺寸、危险分类 - 包装
:总重量、尺寸等。 - 处理单位
:每个(纸箱、托盘)的物品数量、托盘高度 - 商品销售
:供应商名称、采购成本、上市地点(仓库、商店)、每个市场的定价等。
这些信息将与管理您的供应链(从工厂到商店)的不同系统中的 SKU ID 相关联。
这些参数如何记录在主数据中?
数据输入过程
大多数时候,这些参数是由主数据专家手动输入到 ERP 中的。
- 采购团队
以Excel 模板的形式发送产品数据。
MDM 专家检查模板以确保其完整性,并进行随机检查以确保信息的有效性。
MDM 专家在 ERP 中创建项目
现在这些物品已经记录在系统中,
采购团队可以向供应商发送采购订单。
物流团队可以在仓库和商店接收产品。
销售团队可以跟踪商店的销售和库存水平。
- 分析团队
可以将这些新项目纳入他们的报告中。
这对数据科学家有何影响?
问题陈述
作为数据科学家,您不参与项目创建过程。然而,流程中的缺陷可能会直接影响您在组织中部署的分析产品的性能。如果该流程不可靠,会出现什么问题?
在下一部分中,我们将介绍直接影响数据科学和运营团队的问题的真实案例。
对供应链分析产品的影响
由于公司中的多个业务部门使用它,不一致的主数据会极大地影响您的端到端供应链运营。
国际货运:集装箱优化
物流团队正在使用海运从海外工厂运送工厂。
由于疫情期间运费暴涨,您的团队设计并部署了一种算法来优化集装箱托盘的装载。
其目的是找到最佳装载顺序,以最大化集装箱中装载的托盘数量。
在上图中,您可以观察到直观的加载策略(右)和优化版本(左)之间的区别。
对于这个具体的例子,该工具可以在同一个容器中装载两个额外的托盘。
主数据问题可能出现什么问题?
该工具使用主数据根据托盘中的物品估算托盘的尺寸、大小和重量。 - 如果尺寸不正确,优化后的装载计划可能与集装箱尺寸不匹配。
例如,如果主数据中单个项目的尺寸不正确,则托盘高度可能高于预期。 - 如果物品重量错误,货物总重量可能会超出限制。
例如,如果我们装载 50 箱特定物品,主货单上的每箱重量比实际重量低 2 公斤,则整个货盘将比预期重 100 公斤。
如果操作员不能遵守装载计划,后果可能是极其昂贵的。
运营:你的工具低估了货物量!
数据科学家:这不是工具;这是主数据。
运输团队可能必须预订额外的集装箱(价格非常高)或将您的货物存放在集结区数天(这可能会导致运送过程延迟)。
让我们继续讨论另一个专注于仓库拣选操作的优化算法。
仓库运营:拣货路线优化
在仓库中,在拣选路线上从一个位置走到另一个位置可占操作员工作时间的60% 到 70% 。
您与流程工程师团队一起设计并部署了一种算法,以尽量减少操作工的步行距离。
这个想法是使用空间聚类来按区域对订单进行分组,以最大限度地减少每波步行次数。
该工具将支持仓库管理系统 (WMS) 按波次(仅限于特定区域)对订单进行分组,并将其分配给操作员。
如果主数据中的尺寸错误,会发生什么情况?
仓库操作员正在使用体积和重量有限的拣选车。
该算法使用项目主数据来最大化每波的订单数量。 - 如果主数据中的尺寸不正确,算法可能会生成不适合放入购物车的订单批次。
操作员就必须在运送过程中停下来卸下购物车中的货物,从而降低生产效率。 - 如果主数据中的重量低于实际重量,算法可能会使推车超载。
这将影响操作员的生产力,并可能导致工伤事故。
这表明主数据中的问题可能会完全浪费您在开发优化工具上所付出的努力。
那么战略报告又如何呢?
战略报告:供应链可持续性
随着多年来对可持续发展透明度的需求不断增长,可持续发展团队请求您的支持以实现二氧化碳排放量报告的自动化。
本报告重点关注公司价值链中产生的3大间接排放,其中以交通运输为重点。
其中,E_CO2:排放量(以千克二氧化碳当量计算)(kgCO2eq)W_goods:货物重量(t)D:从您的仓库到最终目的地的距离(km)F_mode:每种运输方式的排放因子(kgCO2eq/t.km)
这个简单的公式可以估算出以特定运输方式在D(公里)距离内运输W_goods (吨)时产生的二氧化碳排放量。
这些结果对于衡量推动可持续发展路线图的排放基线至关重要。
如果主数据不完整怎么办?
您将面临的最大挑战是不完整性和不一致性。 - 不完整性
:您可能会发现缺少尺寸或重量的物品,因为工厂(或采购团队)没有完整填写输入模板。 - 不一致
:数据输入错误可能会将 12.2 千克变为 122 千克
风险在于提供不完整的报告或高估排放量。
对于此类战略报告来说,这是不可接受的,因为它们在年度报告发布之前要经过详细的审计。
小结
此示例列表并不详尽,但它概述了主数据管理问题如何影响操作。
垃圾进,垃圾出。没有神奇的算法可以改变这一现状。
您可能会投入资源设计优化工具来降低成本,但如果解决方案采用了错误的数据,那么这些努力就可能白费。
这对任何人来说都不足为奇;本文的目标是关注主数据,因为这个单一表可以影响整个价值链。
解决方案是实施数据质量计划。
数据质量定义了如何信任、理解和有效利用您的主数据以实现其预期目的。
热门推荐
如何验证工作年限计算器结果的准确性?
今天你吃大蒜了吗?
罪证据链:法律实务中的构建与完善
预制菜新春“热度高”,产业发展、现状与未来几何?
健康的减肥饮食搭配,健康的减肥三餐该怎么搭配
禁食虽好,头发不保!西湖大学张兵团队发表Cell论文,证实间歇性禁食抑制毛囊再生
168身高的标准体重是多少
脱毛膏中的有害成分有哪些
科创板开户条件详解:您需要了解的关键要素
特朗普宣布胜选,对A股会有什么影响?
伤口水肿怎么处理?专业医生给出6个实用建议
AI智能家电如何改变生活:从日常便利到全屋智能的奇妙体验
财经和金融有区别吗
呼吸困难可能暗藏健康危机?这些病理因素你要知道!
危房改造去哪里投诉最有效?申请流程及补助标准全解析
手麻木的常见原因及预防方法,关注健康生活的重要性
道家修心十句口诀,让你获得内心的宁静!
周朝的公、侯、伯、子、男五等爵位到底是怎么封的
口角炎的治疗方法及注意事项
广东清远十大特产:从无核柠檬到英德红茶
喝完酒去泡澡会有危险吗
无偿赠与合同的法律问题研究
那些年,我们一起追过的“纳米陶瓷”
南通如东:向“绿”而行 为制造业高质量发展赋能
皮肤干燥症的症状
肉桂茶功效多多,饮用需注意这些
唐卡画师扎西尖措的传承创新路
朝鲜如何养活百万军队?16%国家总预算投放国防,半岛小国的“先军政治”能否持续?
怎样滋阴降火又不伤脾胃
抗生素可治疗感染也会杀死益生菌,如何兼顾肠道健康?