基于因果驱动的特征选择,提高金融预测的准确性和可靠性
基于因果驱动的特征选择,提高金融预测的准确性和可靠性
预测股市波动性是金融领域面临的重要挑战,市场的非线性和本质上的波动性使得准确预测市场趋势变得困难。本文构建了FinSen数据集,将来自197个国家的经济和金融新闻文章与股票市场数据集成,覆盖15年的时间跨度,提供了160,000条金融市场新闻的全球视角。同时提出了一种创新的Focal Calibration Loss方法,将预测概率与实际结果紧密对齐,提高了金融预测的准确性和可靠性。通过证明情感分数与市场波动之间的因果关系,并将这些因果验证的特征集成到LSTM模型中,本文的模型实现了更细致和可靠的市场预测。
摘要
本文介绍了FinSen数据集,将来自197个国家的经济和金融新闻文章与股票市场数据集成,覆盖15年的时间跨度,提供了160,000条金融市场新闻的全球视角。利用FinSen数据集,作者提出了一种创新的Focal Calibration Loss方法,将预测概率与实际结果紧密对齐,提高了金融预测的准确性和可靠性。作者的方法展示了将情感分析与精确校准技术相结合,为金融预测提供可信的方法。
简介
预测股市波动性是金融领域面临的重要挑战,市场的非线性和本质上的波动性使得准确预测市场趋势变得困难。传统模型主要依赖历史数字数据,难以捕捉市场波动的多方面动态。公共数据集中缺乏精确的时间信息,使得追求未知因素对金融市场波动的影响变得复杂。情绪因素在市场分析中的作用备受关注,但其对市场波动的可靠性仍需探究。
本文介绍了利用神经网络和情感分析预测金融市场波动的方法。作者提出了一个新的金融数据集FinSen,并建立了情感分数和S&P 500波动之间的因果关系。作者还提出了一种新的损失函数Focal Calibration Loss,用于提高模型的可靠性和预测准确性。最终,作者的模型在预测金融市场波动方面取得了令人印象深刻的结果和解释性。
相关工作
股市预测的相关情绪数据集
常见用于预测股票价格的情感数据集,包括Financial PhraseBank、Reuters-21578 News Dataset、StockTwits Dataset、TweetFinSent、PsychSignal Dataset和AG News。这些数据集中的情感数据可以捕捉市场情绪对股票波动的潜在影响。作者认为,金融指标和新闻也是预测股票价格的主要贡献因素。
股票市场相关预测方法
情感分析和机器学习技术的融合在股市预测领域中表现出了很大的潜力。虽然LSTM模型在预测准确性方面表现出了优越性,但它在提供可靠的置信度估计方面存在缺陷。之前的研究忽略了模型的可解释性和可信度,这可能会导致在实际市场中的投资失败率。已有的一些技术在金融预测方面表现出了有效性,但它们都忽略了模型的可解释性和可信度。
神经网络模型校准技术
模型校准的相关工作如Platt Scaling和Isotonic Regression,这些方法主要集中在调整已经训练好的模型的输出上。后来的一些方法,如Focal Loss,虽然更加灵活,但也存在过度自信或过度谨慎的问题。各种网络校准技术都可以通过复杂的指标来衡量校准质量,如预期校准误差和Brier得分。
数据和方法
本文目标变量是标准普尔500指数(S&P 500)的每日百分比变化,用于探索与情绪分数之间的因果关系。建立因果证据后,将此特征纳入LSTM模型进行预测和校准实验。
FinSen数据收集和预处理
标准普尔500指数OHLCV数据,包括开盘价、高点、低点、收盘价和成交量,用于提取价格动量和波动性。该数据来源于雅虎财经API,时间为2020年1月至2023年6月。我们研究的监督目标是标准普尔500指数动量、波动率和对数波动率。数据采集采用先进的网络抓取技术,从知名财经新闻网站、Trading Economics、经济指标来源和财经新闻中采集新闻标题和内容。贸易经济平台提供来自196个国家的2000多万个指标,包括汇率、股票、指数、债券和大宗商品价格的历史和当前数据。FinSen数据集包含超过16万条记录,收集时间跨度为15年,旨在确保全球经济状况与时间信息的广泛代表。
使用FinBERT对预处理后的财经新闻文章进行情感分析和注释,FinBERT是一种专门为财经文本设计的微调BERT模型。这一步将定性的新闻内容转化为定量的情绪得分,便于情绪数据的整合。我们从FinBERT获得的情绪得分。
- 新闻的情感评分:编码的文本被输入到FinBERT中,FinBERT输出表示情感分类的逻辑。这个分数用s1表示,它的可能性范围为-1(消极)、0(中性)和+1(积极),代表了第i条新闻的情绪。
- 每日情绪汇总:为了获得每日情绪得分,我们汇总了每天所有新闻的情绪得分。第d天的每日情绪得分SAgg d = n1 d PN i=1 d((- 1∗P负)+(0∗P新)+(1∗P pos))),计算为当天所有新闻情绪得分的平均值,其中N d是第d天新闻的总数。
方法
基于因果验证情感评分的LSTM波动率预测
为了探索市场情绪作为标准普尔500指数波动预测因素的潜力,我们进行了格兰杰因果检验,并将SAgg d视为x。这种统计方法确定了一个时间序列是否可以预测另一个时间序列,有效地检验了两个变量之间的因果关系。我们评估了从金融新闻中得出的情绪得分(X)是否可以预测标准普尔500指数的波动性(y)。鉴于市场情绪得分(X)与标准普尔500指数波动率(y)之间建立了格兰杰因果关系,我们将情绪分析整合到LSTM模型中来预测波动率。LSTM模型使用传统的输入特征和情绪得分。
将因果验证特征嵌入DAN 3进行文本分类
我们使用DAN 3,通过首先将标记索引转换为向量,然后对这些向量进行平均以形成每个文本实例的固定大小的向量表示来处理文本数据。然后,这个表示通过一系列密集的层进行处理,这些层与批处理规范化相互交错,最终形成一个映射到输出类数量的输出层。
焦点校准损失
焦点校准损失(Focal Calibration Loss)旨在解决文本分类器在训练过程中的两个主要挑战:类不平衡和模型校准。其设计背后的直觉植根于提高模型性能,同时确保预测概率与真实结果一致。焦点校准损失结合了Focal Loss和Calibration Error两个组成部分,并纳入了正则化参数λ,以平衡关注硬示例和确保模型预测的适当校准之间的权衡:
使用MAE进行校准误差的理论基础来自预期校准误差(ECE)的概念,这是一种通过将预测分组到箱中并将平均预测概率与每个箱中的实际结果频率进行比较来评估校准的流行度量。虽然ECE提供了校准的分类估计,但MAE提供了连续的实例级校准测量。
实验
建立因果关系:市场波动的情绪得分
我们的分析始于评估标准普尔500指数波动率和新闻情绪得分的百分比变化的平稳性。我们采用增广Dickey-Fuller (ADF)检验,证明它们是平稳的,适合格兰杰因果检验。为了确定因果关系,我们采用回归模型来预测标准普尔500指数的百分比变化,表示为∆SP500,基于金融新闻文章的情绪得分。该模型的结构包括滞后30天的情绪得分,表示为X t - i,其中i的范围从1到k, k是30天的最大滞后。
我们通过方程(6)对限制性模型(不包括情绪得分)和非限制性模型(包括情绪得分)的残差进行f检验。如果f值在选定的显著性水平上大于临界值(0.05),我们拒绝原假设,这表明情绪得分“格兰杰导致”标准普尔500指数的波动。每个检验的原假设是自变量的滞后值不属于回归。根据这些测试的结果,我们制定了四种可能性,表示情绪得分与∆SP500之间的潜在因果关系。我们检验了∆SP500是否能预测情绪得分,以及情绪得分是否能预测∆SP500。对所有k值(1到30)分别进行回归,其中k表示回归中的最大滞后长度。f统计量在1%、5%和10%水平上分别在滞后的第1、3、7、14和30天显著。这表明情绪得分存在“格兰杰原因”∆SP500。然而,没有一个f统计量足以拒绝原假设,这表明∆SP500不“格兰杰原因”情绪得分。结果表明,情绪得分确实“格兰杰导致”波动。
基于因果验证情感评分的LSTM增强
首先使用FinBERT预训练模型对新闻文章进行句子级情感标注,然后将情感得分聚合为每日的整体情感得分。接着将市场波动率和整体情感得分输入到LSTM模型中进行训练和预测。实验结果表明,加入情感得分的模型预测效果更好,其中Lag 14表现最佳,R2值达到94.84%。这表明,基于金融新闻的情感得分可以帮助预测股市波动率。
校准:嵌入增强DAN 3模型
使用多个数据集训练了全局池化CNN网络和DAN 3模型,其中包括20 Newsgroups、Financial PhraseBank、AG News和FinSen。使用GloVe嵌入和交叉熵、AdaFocal、DualFocal和Focal Calibration Loss等损失函数进行训练。在FinSen数据集上使用DAN 3模型和Focal Calibration Loss获得了较好的可靠性图表和ECE值。FinSen数据集在ECE方面表现出色,分类错误率显著降低。
总结
通过证明情感分数与市场波动之间的因果关系,并将这些因果验证的特征集成到LSTM模型中,我们的模型实现了更细致和可靠的市场预测。我们的FinSen数据集在文本分类任务中表现相对更好的校准性。在我们的Focal Calibration Loss上,DAN 3模型的ECE显著提高到3.34%,这表明模型不仅实现了高精度,而且其概率预测也与实际结果非常一致,使其在决策过程中非常可靠。