这篇文档属于类型a,即报告了一项原创研究。以下是对该研究的学术报告:
主要作者及机构
本研究由Sheng Xiang、Dawei Cheng、Chencheng Shang、Ying Zhang和Yuqi Liang共同完成。作者分别来自悉尼科技大学、同济大学、北京大学和上海亿觅数据集团。该研究发表在2022年10月17日至21日于美国亚特兰大举行的第31届ACM国际信息与知识管理会议(CIKM ‘22)上。
学术背景
股票市场的价格走势预测是一个经典但极具挑战性的问题,吸引了经济学家和计算机科学家的广泛关注。近年来,图神经网络(Graph Neural Network, GNN)通过利用公司关系显著提升了预测性能。然而,现有的关系图通常通过人工标注或自然语言处理(Natural Language Processing, NLP)构建,存在资源需求大、准确性低的问题,且无法有效应对关系图中的动态变化。因此,本研究提出了一种基于时序异构图神经网络(Temporal and Heterogeneous Graph Neural Network, THGNN)的方法,用于学习金融时间序列中价格运动的动态关系。
研究目标
本研究的主要目标是开发一种能够自动生成公司关系图并捕捉其动态变化的模型,以提高股票价格走势预测的准确性。具体而言,研究旨在通过历史价格数据生成每日的公司关系图,并利用Transformer编码器将价格运动信息编码为时序表示,最后通过异构图注意力网络(Heterogeneous Graph Attention Network)联合优化金融时间序列数据的嵌入,并推断目标运动的概率。
详细工作流程
研究包括以下几个主要步骤:
1. 公司关系图生成:首先,根据历史价格数据生成每日的公司关系图。通过计算股票之间的相关系数,生成相关性矩阵,并根据阈值确定公司之间的正负关系。关系图以异构图的形式表示,包含正相关和负相关两种关系类型。
2. 历史价格编码:输入的历史价格序列通过线性变换和位置编码(Positional Encoding, PE)进行处理,然后使用多头注意力Transformer编码器对每日的价格信息进行编码。编码器的输出用于下游任务。
3. 时序图注意力机制:在获得历史价格编码和时序关系图后,研究提出了一种时序图注意力机制,用于从图结构和时序序列中聚合信息。该机制通过两阶段注意力机制同时聚合正负邻居的信息。
4. 异构图注意力机制:在获得不同类型的邻居信息后,研究提出了异构图注意力网络,用于学习关系图中的不同关系。该网络通过自适应地计算不同关系的重要性,并聚合这些关系的信息,最终生成每个节点的嵌入表示。
5. 优化目标:研究将股票运动预测任务建模为一个半监督节点分类问题,使用多层感知机(Multi-Layer Perceptron, MLP)作为分类器,并通过二元交叉熵计算损失函数。模型的参数通过Adam优化器进行更新。
主要结果
研究在标准普尔500指数(S&P 500)和沪深300指数(CSI 300)数据集上进行了广泛的实验,结果表明所提出的THGNN方法在预测性能和投资组合回报率方面显著优于现有的基线模型。具体而言,THGNN在预测准确率(ACC)和年化回报率(ARR)等指标上均取得了最佳表现。此外,研究还将THGNN部署在真实世界的量化算法交易系统中,结果表明其累计投资组合回报率显著优于其他基线模型。
结论
本研究提出了一种新颖的时序异构图神经网络方法,用于金融时间序列预测。通过自动生成动态异构图并捕捉公司关系的动态变化,THGNN显著提升了股票价格走势预测的准确性。研究不仅在学术上具有重要价值,还为金融行业的实际应用提供了有力的工具。
研究亮点
1. 动态异构图生成:研究首次将公司关系建模为动态异构图,并利用历史价格数据自动生成这些图,避免了传统方法中人工标注和NLP技术的局限性。
2. 两阶段注意力机制:研究提出了时序图注意力机制和异构图注意力机制,能够自适应地捕捉不同关系的重要性,并有效地聚合信息。
3. 实际应用验证:研究不仅在学术数据集上验证了THGNN的有效性,还将其部署在真实世界的量化交易系统中,证明了其在实际应用中的优越性能。
其他有价值的内容
研究还进行了消融实验,验证了模型中各个组件(如Transformer编码器、时序图注意力机制和异构图注意力机制)的有效性和必要性。此外,研究还通过可视化注意力权重,进一步解释了模型的可解释性,表明不同关系的贡献如何影响最终的预测结果。
本研究为金融时间序列预测提供了一种全新的解决方案,具有重要的学术意义和实际应用价值。