基于多维关联规则的猪肉价格波动影响因素分析及预测建模研究
基于多维关联规则的猪肉价格波动影响因素分析及预测建模研究
猪肉价格波动不仅关系到农业生产,还直接影响民生福利。本文基于多维关联规则,从生猪养殖加工产业链、替代品市场、宏观经济环境、突发性事件和国际市场五个维度,分析了16种影响因素对猪肉价格波动的影响,并构建了预测模型。研究发现,生猪疫病、生猪价格和仔猪价格是影响猪肉价格波动的关键因素,且基于多维关联规则的变量筛选策略能显着提高预测精度。
研究背景与意义
我国不仅是猪肉产量大国,还是猪肉消费大国。受非洲猪瘟疫情的影响,猪肉价格从2018 年底的23.24 元/kg 持续飞速增长,到2020 年2 月达58.89 元/kg,随后保持高位震荡。猪肉价格的异常波动给农业生产、民生福利的健康发展带来负面影响,对猪肉价格波动影响因素的分析及预测具有重要而深远的意义。
图1 国内猪肉价格趋势
影响因素分析
生猪养殖加工产业链
生猪养殖加工产业链涉及种猪繁育、饲料加工、屠宰加工等环节,其中,玉米、豆粕、仔猪构成生猪养殖的主要成本,猪肉产量、出栏肉猪量和年末存栏量决定猪肉的供给数量,生猪价格则通过屠宰加工环节直接影响终端市场的猪肉价格。因此,选取猪肉产量、出栏肉猪量、年末存栏量、玉米价格、豆粕价格、仔猪价格、生猪价格作为生猪养殖加工产业链因素对猪肉价格波动进行分析。
替代品市场
猪肉价格对牛羊肉消费比例的弹性值显着为正,因此猪肉与牛羊肉之间存在一定的替代性。当猪肉价格达到极大值时,牛肉和鸡肉价格同时达到最大值,两种替代品的价格与猪肉价格的波动具有一致性。因此选取牛肉价格、鸡肉价格和羊肉价格作为替代品市场的影响因素。
宏观经济环境
货币供应量(M2)的增加推动猪肉价格的上涨。在我国消费价格指数(CPI)中,猪肉在食品行业里所占比例较大,某种程度上来说中国的CPI 就是猪肉价格指数。因此采用M2 和畜肉类CPI(MCPI)代表我国宏观经济环境因素。
突发性和随机性事件
采用由斯坦福大学和芝加哥大学联合发布的经济政策不确定性指数(EPU)作为度量随机性因素的指标,其中食品安全事件、禽流感等因素会通过影响市场的情绪、价格预期等引起农产品价格波动;采用生猪疫病宽度指数综合量化生猪疫病的严重程度,宽度指数小于0.2 代表正常水平,大于0.25 则表示生猪疫病严重。
国际市场环境
冻猪肉期货、活猪期货及瘦肉猪期货自1961 年以来陆续在美国芝加哥交易所(CME)上市,目前已成为衡量全球猪肉价格市场的一项重要指标;生猪养殖规模的扩大依靠大量的能源聚集和使用,原油价格对农产品价格存在显着的均值溢出效应,国际原油价格的波动会在一定程度上影响中国经济从而影响农产品价格,因此采用CME 瘦猪肉价格和WTI 原油价格作为度量国际市场环境的变量。
数据分析与预测模型
多维关联规则分析
通过设置不同的挖掘参数,研究发现:
- 生猪疫病的宽度指数超过0.25(即表示生猪疫病严重)时,猪肉价格上涨的概率为100%,且对猪肉价格波动的影响程度为1.84,为所有因素中影响程度最高者。
- 当生猪价格稳定波动时,猪肉价格稳定波动的概率为93%,影响程度为1.35。
- 当猪肉的替代品有牛肉和鸡肉这两种肉类的市场价格稳定波动时,猪肉价格稳定波动的概率为71%,对猪肉价格的影响程度均为1.03。
- 虽然仔猪价格稳定波动致使猪肉价格稳定波动出现的频次并不高,但两者具有较强的关联程度(82%),仔猪价格稳定波动对猪肉价格稳定波动的影响程度为1.18。
- 在表2 挖掘到的6 条低频高相关规则中,猪肉产量和出栏肉猪量对猪肉价格上涨的影响程度最大,为1.67。
预测模型构建
为了探究不同多维关联规则筛选得到的输入变量对于猪肉价格预测性能的影响,分别将6 种高频、高相关影响因素,6 种低频、高相关影响因素,12 种运用多维关联规则挖掘的强相关影响因素以及16 种未使用多维关联规则挖掘的数据作为SVR 模型的输入变量,构建4 种对比实验方案:
- 方案1:预测模型的输入变量为6 种高频高相关影响因素,即生猪疫病、生猪价格、牛肉价格、鸡肉价格、M2 和玉米价格;
- 方案2:预测模型的输入变量为6 种低频高相关影响因素,即仔猪价格、EPU 指数、MCPI、WTI 原油价格、猪肉产量、出栏肉猪量;
- 方案3:预测模型的输入变量为上述12 种高相关影响因素,即方案1 和方案2 的总和;
- 方案4:未使用多维关联规则进行变量筛选,预测模型的输入变量为原始的16 种猪肉价格波动影响因素。
实验结果
综合表3 和表4 中不同实验方案的预测结果,得到以下两个发现:
- 对于短、中期预测而言(即提前1步和3 步),方案1 和方案3 优于方案4,说明基于多维关联规则进行变量筛选,可在一定程度上提高猪肉价格的预测精度;
- 对于长期预测(即提前6 步),只有方案3 优于方案4,说明对于跨度较长的预测任务,需要考虑更全面的影响因素,方能取得理想的预测结果。
表3 SVR 模型预测的结果
表4 多维关联规则筛选变量的最优方案的改进率
结论与建议
本研究运用多维关联规则对猪肉价格波动的影响因素进行定量分析,基于生猪养殖加工产业链、替代品市场、宏观经济环境变化、突发性事件和国际市场环境等5 个分析维度,挖掘猪肉价格波动的高相关影响因素作为预测模型的输入变量,得到以下结论:
- 从多维关联规则的挖掘结果可知,与猪肉价格波动关联程度最高的前3 位因素是生猪疫病、生猪价格、仔猪价格,置信度分别为1.00、0.93 和0.82;
- 从高相关项集的提升度可知,对猪肉价格波动影响程度最大的前3 位因素是生猪疫病、猪肉产量和出栏猪肉量,提升度分别为1.84、1.67 和1.67;
- 包含12 种影响因素即生猪疫病、生猪价格、牛肉价格、鸡肉价格、M2、玉米价格、仔猪价格、EPU 指数、MCPI、WTI 原油价格、猪肉产量和出栏肉猪量的建模方案预测精度最高;
- 相较于不进行变量筛选的基准模型,最优模型在3 个步长中的平均预测精度改进率分别为29.11%(RMSE)和16.00%(MAPE)。
基于以上研究结论,提出以下建议:
- 完善猪肉价格波动预警机制,对生产端、替代品、宏观经济环境、突发性事件、国际环境等关键影响因素进行实时监测分析;
- 提高动物疫病风险防范意识,建立国家边境动物防疫安全屏障,健全边境疫病监测制度和突发疫病应急处置机制;
- 加强农业信息化建设,建立农业大数据平台,完善农业信息基础设施建设,提高农户的信息决策能力;
- 构建全链条视角下的生猪价格调控机制,综合生产成本变动以及市场价格波动研判市场风险,依据市场整体风险等级确定调控机制。