这篇文档属于类型a,即报告了一项原创研究。以下是对该研究的学术报告:
该研究由Wei Li、Ruihan Bao、Keiko Harimoto、Deli Chen、Jingjing Xu和Qi Su共同完成。Wei Li、Deli Chen、Jingjing Xu和Qi Su来自北京大学信息科学技术学院计算语言学教育部重点实验室,Ruihan Bao和Keiko Harimoto则来自Mizuho Securities Co., Ltd。该研究发表在《Proceedings of the Twenty-Ninth International Joint Conference on Artificial Intelligence (IJCAI-20)》的特刊“AI in FinTech”中。
股票价格预测是金融科技领域的热门话题。以往的研究通常基于每日数据进行预测,但新闻对市场的影响可能在更短的时间内被吸收,且具体时间难以估计。因此,本研究提出了一个更实际的目标:预测前一日收盘价与次日开盘价之间的隔夜股票价格变动。由于市场收盘后没有交易操作,隔夜新闻的市场影响将通过隔夜价格变动反映出来。然而,此类任务面临的一个主要障碍是数据不足。为此,本研究收集并发布了一个基于路透社金融新闻的隔夜股票价格变动数据集。另一个挑战是市场中的股票并非独立存在,而以往的研究往往忽略了这一点。为了利用股票之间的关联性,本研究提出了一种LSTM关系图卷积网络(LSTM-RGCN)模型,通过股票的相关性矩阵来建模股票之间的关联。
数据收集与预处理
本研究收集了2013年1月1日至2018年9月28日期间东京证券交易所(TSE)的路透社金融新闻和市场数据。数据集包括新闻标题和目标股票的隔夜价格变动。新闻与股票通过路透社提供的“RIC”标签关联。为了减少噪音,研究使用了一些金融关键词(如“earnings”、“affairs”、“business”、“ratings”和“corporate”)对新闻进行过滤。最终,数据集包含363,929条新闻和376,414次价格变动。
股票相关性图的构建
为了建模股票之间的相关性,研究构建了一个股票相关性图。图中每个节点代表一只股票,节点之间通过基于历史市场价格计算的相关性矩阵连接。为了减少噪音,只有当相关性矩阵中的绝对值超过阈值(0.6)时,才会在两个节点之间建立边。相关性矩阵将随数据集一起发布。
节点新闻编码
研究使用LSTM对新闻标题进行编码,并通过注意力机制表示句子。具体来说,首先使用LSTM对新闻标题中的单词进行编码,然后以股票嵌入为查询,对新闻单词的隐藏向量进行注意力计算,最终将新闻文本向量与公司嵌入结合,生成节点特征向量。
图编码器
研究提出了一种基于LSTM的关系图卷积网络(LSTM-RGCN)模型,用于编码图结构。RGCN能够处理正相关和负相关两种关系。为了缓解GCN中的过平滑问题,研究在RGCN层之间添加了LSTM机制,动态选择信息传递到上层。此外,研究还引入了全局节点,以建模整个市场的价格变动趋势。
目标函数与训练
研究将任务建模为一个二分类问题,使用交叉熵作为损失函数。通过Adam优化器训练模型参数,初始学习率为0.001,并在每次迭代后减半。
模型性能
实验结果表明,提出的LSTM-RGCN模型在TPX500和TPX100数据集上均优于所有基线模型。例如,在TPX500数据集上,LSTM-RGCN的准确率为56.14%,而在TPX100数据集上为58.71%。
图结构的影响
通过对比有无图结构的实验结果,研究发现引入图结构显著提高了模型的准确性。例如,在TPX500数据集上,引入图结构后准确率从52.72%提升到56.14%。这表明相关公司的信息能够补充当前股票的新闻信息,帮助模型更好地推断价格变动。
关联推理能力
由于图结构的存在,模型能够学习到没有直接关联新闻的股票表示,并通过图边进行信息传播。实验结果显示,模型在TPX500和TPX100数据集上的关联推理准确率分别为52.72%和57.53%,均高于随机猜测的50%。
整体市场推断
研究还测试了模型对整个TPX指数价格变动的预测能力。通过全局节点的图级表示,模型对TPX指数价格变动的预测准确率为55.74%,表现较为满意。
本研究提出了隔夜股票价格变动预测的目标,并通过引入股票相关性矩阵和LSTM-RGCN模型,显著提高了预测准确性。实验结果表明,模型不仅能够预测有直接新闻关联的股票价格变动,还能推断没有直接新闻关联的股票以及整个市场的价格变动。这为金融科技领域提供了一种新的预测方法,具有重要的科学价值和应用价值。
研究还分析了不同新闻主题对股票价格变动的影响。例如,“affairs”主题的新闻对股票价格的影响最大,而“earnings”主题的新闻影响相对较小。这为投资者提供了有价值的参考信息。