自己开个网站多少钱,万网域名注册流程,软件代理,汕头模板建站流程“GRU-PFG: Extract Inter-Stock Correlation from Stock Factors with Graph Neural Network”
论文地址#xff1a;https://arxiv.org/pdf/2411.18997 摘要
股票预测模型可以分为两个主要类别#xff1a;第一类#xff0c;例如GRU和ALSTM#xff0c;这些模型仅基于股票…“GRU-PFG: Extract Inter-Stock Correlation from Stock Factors with Graph Neural Network”
论文地址https://arxiv.org/pdf/2411.18997 摘要
股票预测模型可以分为两个主要类别第一类例如GRU和ALSTM这些模型仅基于股票本身的数据进行预测其准确性有一定的局限性第二类像HIST和TRA这样的模型则融合了行业趋势、财务报表以及公众情绪等多方面的信息虽然能够更全面地反映股票之间的关联但在数据的标准化处理和模型泛化能力方面遇到了挑战。本文介绍了一种新的模型——GRU-PFG它依然只利用股票本身的因素但借助图神经网络来挖掘不同股票间的联系从而实现了比单纯依赖股票数据的模型更优的预测性能并且其效果可与结合多种信息源的第二类模型相媲美。
在CSI300指数成分股的数据集测试中GRU-PFG模型的秩相关系数IC达到了0.134这一成绩不仅超过了HIST模型的0.131也明显优于传统的GRU和Transformer模型证明了该模型具有更强的泛化能力。尽管股票投资是实现资产增值的有效途径之一但它同样伴随着市场波动和企业业绩不佳所带来的风险投资者可能会因此面临资本损失。 简介
随着机器学习技术的发展特别是神经网络例如CNN和Transformer的应用越来越多的投资者开始重视其在股票预测中的潜力。股票预测模型通常可以分为两大类一类模型仅依赖于股票的历史价格和其他直接相关的市场数据而另一类则整合了额外的信息比如行业动态、市场资本化等非传统因素。尽管后者的模型如MDGNN和HIST能够提供更高的预测精度但它们也面临着信息选取的主观性、数据更新的滞后性以及适应快速变化的行业环境的挑战。
本研究引入了一种新的模型——GRU-PFG它以股票自身因素为基础并通过图神经网络捕捉股票之间的关系以此来增强预测性能。GRU-PFG利用Alpha360股票因子作为输入深入挖掘这些数据中的隐含信息相较于传统的ALSTM和GRU模型表现出了显著的优势为从股票因子中提取有用信息提供了创新的方法。实验结果显示该模型的表现与那些基于多种信息源的复杂预测模型如HIST和TRA相当同时展现了更强的泛化能力成功地解析了股票因子间的相互联系。 01相关工作 股票因素
长期以来股票预测的定量分析工作由于难以获取内幕信息而带有一定的保密性。研究者们一直致力于利用公开可用的数据如市场价格和成交量来构建既稳定又可靠的预测模型。在这一领域有的量化分析师专注于根据股票的历史趋势来设定模式而其他的分析师则通过量化和标准化数据来开发用于预测的股票因子。
2015年Zurab Kakushadze与Igor Tulchinsky首次界定了4000个可能影响未来股票价格变动的数值特征。随后Kakushadze进一步简化了这些特征提炼出101个更为关键的数值。Xiao Yang等人随后将这些股票因子的概念引入到qlib这个开源量化投资平台上创建了Alpha360和Alpha158两个因子集。这些因子集成为了GRU、图注意力网络GATs、Transformer等深度学习算法进行日常股票趋势预测的标准输入广泛应用于学术研究和实际投资策略中。 基于Alpha360的预测模型
Alpha360股票因子集因其高维度特性非常适合应用于如GRU、LSTM和Transformer等深度学习模型。这些模型主要依赖标准化的股票因子进行预测虽然在处理多源信息方面有所欠缺但其数据标准化程度很高。相比之下多层感知器MLP作为基础模型能够执行多维数据的降维和非线性转换不过在学习股票因子之间的复杂关系上能力有限。而GRU、LSTM、ALSTM以及Transformer这类模型则将股票因子视为时间序列数据来处理从而能够更有效地提取特征信息但在捕捉不同股票之间的相互关系时表现并不理想。 基于多信息源的预测模型
学者们正探索将额外的信息例如公众情绪、公司的市值以及行业概念融入到股票预测模型中以期提高预测的准确性。虽然多源信息的整合有可能增强模型的性能但这种方法也遇到了一些挑战
主观性选择 确定哪些额外信息应该被包含在模型中往往依赖于研究人员的判断这引入了一定程度的主观性。不同的研究者可能会基于不同的理论或经验选择不同的信息来源从而影响模型的一致性和可重复性。标准化困难 不同类型的额外信息通常来自各种不同的源格式和质量各不相同。要将这些非结构化或半结构化的数据整合进一个统一的预测框架并确保其标准化处理是一项复杂且耗时的任务。信息滞后 许多额外信息特别是那些从新闻报道、社交媒体或其他公开渠道获取的数据可能存在更新延迟的情况。这种滞后可能导致模型使用的是过时的信息从而降低预测的准确性和时效性。新公司和新兴行业的信息匮乏 对于较新的公司或快速发展的新兴行业可能缺乏足够的历史数据和其他相关信息来进行有效的分析和预测。这使得构建适用于所有市场参与者的通用模型变得更加困难。
这些问题都对多源信息模型的实际应用构成了挑战需要通过技术创新和方法改进来逐步解决。 02基础 股票趋势相关概念
股票价格是由公司财务状况、市场情绪以及宏观经济环境等多种因素共同作用的结果其变动通常是渐进的而非突然的。我们可以通过比较价格的变化速率来研究股票的趋势这一分析方法的计算公式为 日收益率计算公式为 Alpha360因子模型旨在通过整合基本面分析、技术分析、市场情绪以及宏观经济数据等多个方面的信息来评估接下来60天内股票价格的可能走向其目标是增强预测的精确度。请注意任何预测方法都无法保证完全准确投资股市有风险决策需谨慎并建议咨询专业的财经顾问。 GRU在股票预测中的局限性
GRU网络采用360个因子来预测每日的股票回报其性能超越了Transformer和LSTM模型。这些因子每6个组成一个时间步总共构建了60个时间步。在最后一个时间步中数据经过降维处理然后通过线性函数输出一个维度的回报预测。GRU在网络中高效地提取时间序列特征并进行降维然而它在捕捉不同股票之间的关系方面的能力较弱这限制了其对市场动态变化的全面理解。 03方法
本文介绍了一种新型模型——GRU-PFG该模型基于Alpha360因子集旨在提升股票预测的性能。模型结构由三个主要部分组成初步信息提取、主要关系建模和次要关系建模。
在初步信息提取阶段采用GRU网络对360个因子进行处理生成64维的特征表示从而有效地捕捉了股票因子的基础信息。接下来在主要关系建模阶段通过使用softmax函数和Pearson相关系数来计算因子之间以及股票之间的关联度进而构建出一个反映这些关系的相关性矩阵R1。最后在次要关系建模阶段模型考虑到了未直接显现的关系并结合之前的主要关系构建了一个综合性的聚合矩阵R2。
最终模型将两个阶段提取到的特征整合为一个综合特征F_last用于预测股票的价格变动趋势。为了优化模型参数训练过程中采用了均方误差MSE作为损失函数。这一设计使得GRU-PFG不仅能够有效提取时间序列信息还能更好地理解股票之间的复杂关系从而提高预测的准确性。 04实验 实验设置
使用CSI100和CSI300数据集本研究将2007年1月1日至2014年12月31日的数据作为训练集2015年1月至2016年12月的数据作为验证集而2017年1月至2020年12月的数据则用于测试。通过qlib平台计算的Alpha360因子被用作模型输入模型的输出是预测的日收益率实际的日收益率则作为标签进行监督学习。
评估模型性能的指标包括信息系数IC、排名IC以及PrecisionN。在训练过程中IC被用作损失函数的一部分而在测试阶段较高的IC值表明模型具有更好的预测能力。GRU-PFG模型与多种其他模型进行了对比这些模型包括基于Alpha360因子的MLP、ALSTM和GRU还有依赖多源输入的TRA和HIST等。尽管HIST模型被认为是预测效果最好的但其面临数据标准化和泛化能力的挑战相比之下GRU和ALSTM在仅使用Alpha360因子的模型中表现最为出色。 结果
GRU-PFG模型在CSI100和CSI300数据集上的表现显著优于仅依赖Alpha360因子的其他模型尤其在信息系数IC、排名ICRank IC和PrecisionN等评估指标上。特别是在CSI300数据集上GRU-PFG不仅超越了HIST模型而且仅使用股票因子作为输入便实现了更高的预测精度。这表明GRU-PFG在捕捉股票间相关性方面具有更强的能力可能是其在CSI300数据集上表现出色的原因之一。
与基于Alpha360因子的其他模型如ALSTM、GRU、GATs相比GRU-PFG在大多数测试期间的月均IC表现更为突出。尽管在PrecisionN指标上GRU-PFG的优势不如在IC指标上那么明显但它在多数月份中仍然保持领先地位。这一结果进一步证明了GRU-PFG模型在股票预测方面的优越性能。 模型参数和结构的影响
为了评估模型各部分对预测性能的贡献我们进行了结构上的宏观和微观调整并通过消融实验来系统地分析每个组件的影响。以下是具体的做法和结果 1.模型结构调整与消融实验
通过宏观和微观调整模型结构进行消融实验。目的是评估各个组件对预测性能的具体贡献。
2.主要组件
初步信息提取使用GRU网络处理初始数据提取基础特征。主要关系提取捕捉因子之间及股票之间的主要关联。次级关系提取考虑潜在的、未直接显现的关系进一步增强模型表现。
3.性能提升
随着更多组件的逐步加入模型的预测性能逐步提高。特别是次级关系提取部分的引入显著提升了CSI300数据集上的预测效果。
4.关系捕捉
使用Pearson相关系数来衡量股票之间的关联性。与余弦相似度相比在信息系数IC和Precision30等关键指标上表现出更优的性能。
这些调整和优化不仅揭示了各个组件对整体模型的重要性还证明了通过精细设计模型结构可以有效提高股票预测的准确性。 05总结
本文介绍了一种新的股票预测模型GRU-PFG该模型基于Alpha360因子并引入了图表示法来描绘股票间的关联性旨在解决传统模型存在的问题。实验结果显示在相同的测试数据上此方法能够有效提高诸如信息系数IC等评估标准。展望未来我们的目标是优化这一模型使其能够在多种数据环境下展现出更出色的预测能力同时希望其应用能为投资者提供有价值的参考。然而需要注意的是任何投资都伴随着风险投资者应根据个人的财务状况和风险承受能力做出谨慎的投资决策并考虑寻求专业理财顾问的意见。