问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

做好预测,从了解数据和数据形态开始

创作时间:
作者:
@小白创作中心

做好预测,从了解数据和数据形态开始

引用
1
来源
1.
https://www.4see.tech/do-prediction-well-start-from-knowing-data-and-data-forms/

在预测分析领域,选择合适的预测模型和方法是至关重要的。而要做出准确的预测,首先要对数据的形态有深入的了解。本文将详细介绍数据的五种基本形态:水平、趋势、季节性、周期性和噪音,并通过具体案例说明如何根据数据形态选择合适的预测方法。

什么是数据形态?

数据形态就是数据所呈现的特征,通过图形描述出的形状。通常一个数据包含水平、趋势、季节、周期和噪音或异常值等一个或多个成分,或者多个成分组合起来的。通过图形可以将这些特性描述或展示出来,给我们直观的感受,使我们可以通过图形进行直接的判断出数据的模式。

水平(Stationary)

当随着时间的推移所观察的数据围绕恒定水平或均值波动时,就会存在水平模式。例如,某些日常消费品(如牙膏、牙刷)的销售量通常保持稳定,没有明显的增长或下降趋势,这种数据形态被称为水平模式。


图2:某洗发水两年的历史销售量

对于水平数据形态,合适的预测模型是移动平均或简单指数平滑。这些方法可以帮助去除随机干扰因素,呈现平稳的数据模式。

趋势(Trend)

趋势是代表时间序列在较长一段时间内的增长或下降的形态。许多宏观经济变量,如美国国民生产总值(GNP)、就业和工业生产等都表现出趋势行为。


图4:道琼斯指数日收盘价

趋势形态的数据模式,可以使用霍尔特(Holt)或布朗线性等趋势指数平滑模型进行预测,或通过二次移动平均或多次移动平均方法。如果数据是比较线性增长的模式,也可以通过一元线性回归分析进行预测。如果是非线性趋势,需要考虑其他更复杂的预测技术与模型,如增长曲线法、指数模型、ARIMA(Box-Jenkins)等方法。

周期(Cyclical)

当数据表现出上升和下降的周期性波动,且这些波动不是固定周期时,就存在周期性(C)模式。周期性成分是围绕趋势的波浪状波动,通常受到总体经济状况的影响。


图6:中国载货汽车生产量2004-2023

周期成分一般跟随经济周期,而经济周期却不如季节性那么有固定的时间规律容易捕捉,所以要预测周期性的成分并不容易,周期成分可以通过移动平均法将之分离出来,经典分解法、X-12等统计方法产生的目的就是捕捉长期的经济周期规律,但是效果不如预测专家们所预期的那样,因为影响经济周期的因素是非常难以预见到的,偶然的因素太多。

季节(Seasonal)

当一系列数据受到季节性因素的影响(例如,一年中的季度、月份或星期几)时,就存在季节性(S)模式。与我们生活中相关的大多数产品都存在季节性,比如饮料、服装、与季节密切相关的农产品等,与我们的节假日相关的产品,每年春节相关的礼品和家庭用品等,相关客运方面的服务与产品等。


图7:美国从1976年到2024年的月汽车销售总量

具有季节性的数据通常可以使用分解法、Winters(季节趋势)指数平滑法、X-12普查法、ARIMA模型(BOX-JENKINS博克斯一詹金斯法)等模型与方法进行预测。如果季节性不存在明显的趋势的情况,则可以使用简单季节模型,只要将季节指数分解出来就可以了。

复合数据形态

大多数时间序列数据包含多个成分,是趋势、季节、周期和噪音等几个成分的组合。


图10:涡轮机、发电机和其他电力传输设备等制造商新订单总量($Million)

对于复杂的数据形态,有时我们很难直接从图形上进行判断得出规律,需要通过其他的方法来帮助我们做更准确的判断。对于时间序列的判断,我需要引入另一个概念,就是ACF,Autocorrelation的缩写,中文叫自相关函数。那么ACF是什么含义呢?简单的说,由于我们的时间序列存在着某种模式,所以每个数据之间是相关的,存在某种相关关系,通过该时间序列数据的滞后阶数与前一序列的比例关系判断序列的相关程度,通常用rk表示,所以它也叫序列相关。关于自相关函数ACF,已经涉及到一些基础的统计专业知识了,由于篇幅的关系,将在下一篇中专门介绍。

注:本文中本人采用了很多的美国的一些行业的统计数据,数据来自美国政府的一些官方网站,这么做的原因不是本人崇洋媚外,而是我们国家和政府机构的官方数据相对有限和不够完善,无法取到我想要的数据,另外很多的行业专业数据都不是免费的,而是收费昂贵,希望未来我们的国家和政府也可以将这方面的统计信息完善和规范起来,并能给广大老百姓提供相关免费的行业和专业的数据。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号