本文是由Yunong Wang、Yi Qu和Zhensong Chen共同撰写的一篇综述性论文,发表于2022年的《Procedia Computer Science》期刊上。Yunong Wang和Yi Qu来自中国科学院虚拟经济与数据科学研究中心及大数据挖掘与知识管理重点实验室,Zhensong Chen则来自首都经济贸易大学管理与工程学院。本文的主题是“股票价格预测中的图构建与图学习”,旨在系统地回顾和总结图结构在股票价格预测中的应用,并为未来的研究提供方向。
股票价格预测对于投资者和监管者具有重要意义,准确的预测能够带来更高的利润和更有效的风险防范。然而,股票市场受到多种因素的影响,价格波动的内在机制和传导路径复杂多样。传统的股票价格预测研究通常将股票视为独立的个体,忽略了不同股票之间的关联性。近年来,随着图神经网络(Graph Neural Network, GNN)等技术的发展,研究者开始利用图结构来刻画股票之间的关系,以提高预测的准确性。然而,股票市场中定义良好的图结构较为罕见,如何构建适合的图结构仍然是一个挑战。
本文首先介绍了图构建的一般范式。图数据的基本定义包括节点、节点特征、节点标签、边、边特征等。在股票市场中,节点通常代表股票,节点特征可以是每日交易指标(如开盘价、收盘价、交易量等)或通过模型处理后的技术指标(如移动平均线、相对强弱指数等)。边的构建可以分为显式关系和隐式关系。显式关系是指现实中存在明确关联的股票关系,如同行业、供应链上下游等;隐式关系则是通过计算股票价格序列的相似性来构建的,常用的方法包括皮尔逊相关系数、动态时间规整(Dynamic Time Warping, DTW)等。此外,边属性可以是无权重或有权重的,权重可以通过相似性系数或节点间的重要性比例来计算。
本文还介绍了三种特殊的图结构:异构图(Heterogeneous Graph)、超图(Hypergraph)和子图(Subgraph)。异构图包含多种类型的节点和边,能够整合多种信息来源,提供更全面的股票关系网络描述。超图则通过一条超边连接多个股票,适合描述复杂的多模态数据。子图是从完整图中提取的部分图,常用的过滤方法包括平面最大化过滤图(PMFG)、最小生成树(MST)等,子图的优势在于能够识别重要节点和关系。这些特殊图结构在股票价格预测中具有独特的应用价值。
除了股票间的关系,本文还讨论了基于股票内部关系的图构建。股票内部关系通常指不同交易日之间的关系,常用的方法包括可见性图(Visibility Graph, VG)、递归网络(Recurrence Networks, RNs)等。通过将时间序列转化为图结构,可以捕捉股票价格波动的模式。例如,Zhang等人使用VG建立边,并通过链接预测来预测未来数据;Wu等人则将交易日作为节点,使用图嵌入来表示时间点之间的关联。
图构建的最终目的是股票价格预测,因此本文还介绍了图构建后的特征提取和预测过程。特征提取通常包括关系特征提取和时间特征提取,常用的方法包括图卷积网络(Graph Convolutional Network, GCN)、图注意力网络(Graph Attention Network, GAT)等。预测任务可以通过直接使用提取的特征完成,也可以结合机器学习或深度学习模型,如人工神经网络(Artificial Neural Network, ANN)、结构支持向量机(Structural Support Vector Machines, SSVMs)等。
本文最后提出了未来研究的两个方向。首先,可以考虑股票价格波动背后的内在机制,如大额交易对股票价格的影响,构建基于这些机制的股票关系可能提高预测性能。其次,可以从定性、理论和实证研究中发现股票关系,例如基于公司地理位置的协同运动。这些方向为未来的研究提供了新的思路。
本文系统地回顾了股票价格预测中的图构建与图学习方法,揭示了图结构在金融市场的应用潜力。通过总结现有的研究范式、特殊案例和未来前景,本文不仅为研究者提供了可行的图构建方法,还为图学习模型在股票预测任务中的进一步应用提供了见解。本文的综述性研究为股票价格预测领域的发展提供了重要的理论支持和实践指导。
本文的亮点在于其全面性和系统性。它不仅总结了现有的图构建方法,还提出了未来研究的方向,尤其是对股票价格波动机制的深入探讨,为未来的研究提供了新的视角。此外,本文还详细介绍了特殊图结构及其在股票预测中的应用,展示了图结构在复杂金融数据分析中的独特优势。