一文讲清生产质量场景的数据分析思路及案例实战
一文讲清生产质量场景的数据分析思路及案例实战
在制造业中,质量管理是确保产品质量、提高客户满意度的关键环节。本文将通过一个实际案例,详细介绍如何运用BI工具(FineBI)进行产品质量数据分析,帮助质量管控部门监控生产过程、防范异常风险,并为管理层提供决策支持。
业务背景
作为某生产制造企业的质量管控部门,日常主要负责监控生产过程、防范异常风险发生、产品质量评价等工作。质量管控部门需要定期向公司管理层汇报核心指标现状,辅助管理层进行经营决策和生产决策。
分析计划
由于产品的关键质量特性(CTQ)有很多,本次选择产品重量作为唯一关注指标,并衍生出检验批次合格率与达标率这两个计算指标进行分析。这三个指标均能向时间维度作趋势性延展,以及结合其他各维度进行联合分析。
采集的分析所需数据包含以下字段:产品抽检时间、生产机组、机组排班、质检员班次、品牌类别、市场分类、达标线线(mg)、平均重量(g)、重量SD(g)、抽检不合格数。
数据处理
数据集抽取
从每月生产质检数据表中抽取上述字段,进行年度汇总(特别注明:9月工厂停产无数据,1月无过程检验数据)。
数据集合并
将抽取到的转序和过程检验两个工序段数据集进行上下合并。(特别注明:抽检频次为,转序工序段每机组每排班每质检员班次仅抽检1次,过程检验工序段每机组每排班每质检员班次抽检次数大于1次,在自助数据集中新增计算字段“抽检次序”加以标识)。
新增计算字段
- 价牌:合并连接“品牌类别”与“市场分类”两个文本型维度字段;
- 重量SD(mg):重量×1000,将单位克换算为毫克,“平均重量”亦换算为毫克,字段名为“重量(mg)”;
- 合格与否(达标与否):对明细数据集操作,若抽检不合格数为零标记为1,表示合格,否则为0,表示不合格;若重量SD不大于达标线则标记为1,表示达标,否则为0,表示未达标;
- 合格率(达标率):使用聚合函数新增聚合字段。合格率=合格数/总检测数,即“合格与否”计数/记录数;达标率=达标数/总检测数,即“达标与否”计数/记录数(特别注明:合格率是重量质检合格率,达标率是重量SD达标率);
- 年/月/日/季度:从“产品抽检时间”字段利用日期函数分别进行提取。
数据清洗
- 异常值处理:剔除了1条异常数据记录。加工工序为过程检验时,有一记录,其重量值为635.7mg明显低于整体分布200mg以上,且为早班质检人员所测,经查实有操作失误嫌疑,故将其剔除。
- 缺失值处理:对数据集缺失值进行核查后作常量值插补(用于数据挖掘时可进行统计值替换、模型预测替换等插补方式),如品牌类别、生产机组、班次等文本型字段值缺省等情况进行核查后作常量插补。
具体分析实操
达标率诊断分析
这一分析模块主要是从时间维度开展分析。从时间维度上拆分达标率,发现达标率在Q2Q4骤降然后回升,继续下钻,发现具体是在6月和12月降到最低。观察具体趋势,可以发现这个达标率的降低是周期性的,如此持续下去,预计在2022年初达标率将低于50%,这是很可怕的。
具体是什么导致这个达标率呈现下降趋势的呢?继续往下挖,对比一下属于不同市场分类产品的达标率是否在某一节点有不同反应。
对比发现,3类产品的规律曲线与总体曲线轮廓相似,虽然一致很低但走势预判很好,反而45类产品衰退迹象凸显。故而应重点关注12类和45类的质量提升和稳定。
我们在结合各细分品类的产量信息进行分析。上图可知12类中Y-L产量最盛,配合生产的机组竟分布全厂10台机器,和45类T-King一样是举全厂之力攻坚的产品。但是12类的达标率只有52.58%,远远不及及格线,后续应考虑是否要继续生产,亦或是想办法提高质量(是否该品类产品本身存在技术设计缺陷后续应调研综合考虑)。后续可对比市场上同类厂家、行业内同一产品作竞品调研分析,继续挖掘可改善的途径。
重量及其合格率,SD达标率间相关分析
这一分析模块,从不同价值维度进行分析,看看是否能发现一致性规律。
看图表可知,是存在一致性规律的,即不同产品在符合MECE原则拆解后,有一致的客观规律:当产品的重量增加在一定范围内,其大部分达标的产品其SD值是会随即增加的,对应的达标率会一定程度衰减。
当然,结果规律必然是有前提条件的,当超过限定条件时,出现离群点在所难免,但对于稳态生产过程来说,大量利群点出现的是否,生产过程已经存在很大风险了。
完整数据分析报告
本作品来源2022帆软BI数据分析大赛,作者”释冰”。