论文题目:
Can Large Language Models Beat Wall Street? Unveiling the Potential of AI in Stock Selection
论文链接:
https://arxiv.org/abs/2401.03737
博客地址:
https://www.marketsense-ai.com/
从本质上来说,股票选择是个价格发现机制,在股票投资中,市场参与者通过理解和使用各种信息做出决策。然而,自从 08 年的金融危机后,资本市场的结构和功能发生了重大变化,对价格发现产生了持久的影响。因素共同扰乱了价格发现的正常运作,导致投资者减少准确评估风险和资产价值的动力。然而,相较于拥有专业团队和全面分析工具的财富管理公司来说,由于分析信息的能力有限、易受行为偏见的影响以及缺乏健全的风险管理技能,个人投资者通常难以分析股票。
而基于 GPT-4 进行决策的 MarketSenseAI 也许能破除这个困境,与传统股票分析方法相比,MarketSenseAI 具有以下优势:
-
分析全面性:能够整合多种数据类型,包括公司新闻、基本面、市场动态和宏观经济信息,为投资者提供全面的分析。
-
基于 AI 的决策:利用 GPT-4 模型进行决策,具有更高的分析能力和更强的适应性。
-
可解释性:生成的投资建议附带详细解释,帮助投资者更好地理解分析结果。
-
灵活性:可广泛应用于不同的金融资产,特别是在传统分析较少的市场中,可能发挥更大的优势。
MarketSenseAI
MarketSenseAI 的框架如图 1 所示,该架构整合了负责处理数据输入四个核心组件,以及用于促进最终投资建议(即买入、持有或卖出)的第五个组件,该组件综合了所有信息,并为相应的决策提供简明扼要的解释。其中每个组件都建立在 GPT-4 的 API 上,利用一次性提示和上下文学习来执行不同任务。
▲图1 MarketSenseAI 的架构图
该框架可以模拟专业投资团队的决策过程,旨在提供全面而深入的投资决策支持,涵盖市场各个方面的信息。具体而言,该框架通过多个核心组件来实现这一目标。
-
新闻摘要器:追踪公司或其部门的最新发展,以保持对市场动态的敏感性。
-
基本面摘要器:对公司的最新财务报表进行分析,以评估其财务健康状况
-
宏观和价格动态摘要器:结合了对价格行为动态的考虑,对当前环境进行宏观经济分析。
渐进式新闻摘要器
渐进新闻摘要器负责新闻获取、压缩和制作股票最具影响力新闻的渐进性摘要。如图 2 所示,获取与特定股票对应的每日新闻。
▲图2 渐进新闻摘要器
首先,对每日新闻进行预处理,剔除了与公司无关的文本,并确保其以适当的格式输入系统。接着,通过 API 访问 GPT-4,系统有序地提供提示,以生成每日新闻的简明摘要,并将其集中储存。
为了弥补特定日期摘要的不足,引入了渐进式新闻摘要器,通过将最新的新闻摘要与之前的渐进摘要集成,确保全面包含公司相关新闻内容,这对于在公司决策过程中仍具有重要意义的旧新闻(如并购或法律纠纷)尤为关键。
基本面摘要器
基本面摘要器的目标是提供公司财务状况的事实性概览,而非直接提供投资建议。
在预测性金融分析中,至关重要的基本数据能提供反映公司当前健康状况和未来走势的关键量化指标。如图 3 所示,作者使用 EODHD 的基本数据 API 获取这些关键的季度信息。为了方便对财务数据进行比较,作者在将数据输入提示之前进行了预处理:采用数字缩写技术,使用诸如“百万”和“亿”等单位来表示大数,并将来自不同季度的数据以表格形式合并。作者通过将最近两个季度的财务报表输入到 GPT-4 中进行比较,深入研究了企业利润能力、收入轨迹、债务指标和现金流动态。
▲图3 股票的基本面摘要
股价动态摘要器
股价动态摘要器在 MarketSenseAI 中扮演着关键角色,它对股票的价格趋势和财务指标进行深入分析和上下文处理。如图 4 所示,该组件不仅关注目标股票本身,还通过与其他相似公司的比较,以及考虑整个市场的背景,提供了更全面的分析和情境化,以更好地理解目标股票在行业和市场整体中的表现。
▲图4 股价动态摘要
识别相似股票的方法如算法 1 概述,利用 MPNet 语言模型生成 Embedding 并计算相似性分数。
▲算法1 相似股票识别算法
摘要器获取了目标股票、与其相似的其他股票以及 S&P 500 指数的市场数据。接着,它对这些数据进行深入分析,关注关键的财务指标,其中包括 3、6 和 12 个月的累积回报和夏普比率,并进行了波动性和最大回撤的计算。其中:
-
夏普比率:提供了有关股票在市场下行期间的风险调整回报的信息。
-
最大回撤:反映了股票在某一时期内可能承受的最大损失。
这种全面的分析使我们能够深入了解目标股票相对于同行和更广泛市场的表现,包括其在市场波动和风险方面的应对能力。
宏观经济环境摘要器
进行深入的宏观经济分析对于做出明智的投资决策和有效的资本配置至关重要,因为它提供了对整体经济健康和绩效的关键见解,这有助于投资者及时获取关键信息,更好地理解当前经济环境并做出明智的投资决策。
由此,MarketSenseAI 包含了一个名为市场摘要(MarketDigest)的组件,每两周综合一次投资报告和研究文章,提供复杂经济数据和趋势的简明摘要。它通过搜集各大银行和投资机构的各种公开报告,从而确保了从多个权威来源获取信息,而且能将多种观点和分析融入连贯叙述中。具体地:
-
将这些报告和文章转化为文本形式,然后利用 GPT-4 对每份报告进行摘要。
-
将这些个别摘要浓缩成一个全面的概述。
▲图5 宏观经济环境摘要
信号生成
信号生成器是 MarketSenseAI 流程的最后一步,可以整合分析多种金融数据(包括公司新闻、基本面、市场动态和宏观经济信息),从而生成投资决策信号(买入、卖出或持有),以及对这个选择背后的推理的清晰、逐步的解释。其中,GPT-4 采用思维链方法(CoT),通过多步分析引导模型做出关于下个月投资组合分配的决策,提示结构为:
-
新闻分析:评估与目标公司相关的最新新闻摘要,以评估它们对股票绩效的潜在影响。
-
价格动态分析:将股票的价格动态与相关股票和整体市场进行比较,提供相对绩效的视角。
-
宏观经济环境分析:评估更广泛的宏观经济格局及其对目标公司的影响,考虑全球经济趋势和事件。
-
基本面分析:对公司基本的财务数据进行审查,分析其当前的财务状况和未来前景。
▲图6 MarketSenseAI 组件与信号的文本相似性
图 6 展示了 MarketSenseAI 内部的文本相似性分析,而表 1 则提供了详细说明,这表明模型的决策过程与不断变化的输入信息相一致,对于生成每月的投资信号至关重要。
▲表1 信号与组件之间的文本相似性统计
-
新闻和价格动态摘要有高相似性分数,表明模型强调了这些迅速变化的因素,以及它们对股价的即时影响。这对于短期、每月的预测至关重要,因为当前的发展和价格趋势很大程度上可以影响市场行为。
-
相反,基本面和宏观组件的平均相似性分数较低,对模型每月决策的直接影响较小。基本面每季度更新一次,提供了对公司财务健康的稳定但不经常变化的视角,而宏观经济数据则更为广泛和通用,对短期投资决策的影响更小。
实验
Bootstrapping 评估结果
自举法(Bootstrapping)是一种统计学中的重抽样方法,用于估计统计量的分布或标准误差。其基本思想是通过从原始样本中有放回地抽取大量的随机样本,来近似得到原始样本的分布情况。
▲表2 MarketSenseAI vs 自举投资组合
表 2 显示了实验结果,该评估对比了 MarketSenseAI 与各种自举投资组合的有效性。对 MarketSenseAI 在去趋势化收益方面的性能进行评估,从而提供了对其信号生成能力的精细分析。
实验结果表明 MarketSenseAI 的交易信号在各种信号类别中的累积收益和命中率明显优于随机机会。即使在去趋势化收益的评估中,相比于随机信号生成方法,MarketSenseAI 的表现更出色,有力地证明了其交易信号明显超出了单纯偶然的预期,这表明它在辨别具有利润潜力的投资机会方面具备较高能力。
市场表现评估结果
基本策略
▲表3 MarketSenseAI 基本策略的表现
对 MarketSenseAI 的基本策略进行评估,从表 3 和图 9 的结果来看,揭示了使用 LLM 推动的投资策略的效果,总体而言,MarketSenseAI 的全部信号(MS)和仅考虑“买入”信号的长期版本(MS-L)的策略都显示出相对良好的回报。
▲图9 等权重投资组合的表现
结果表明,MarketSenseAI 的基本策略在总体和风险调整回报方面明显优于等权重的 S&P 100 指数,相较于市场参与者通常采用的天真的趋势跟随策略,MarketSenseAI 在 2023 年取得了更显著的结果。
在基于市值加权的表现方面,MS-LCap 策略在夏普比率、Sortino 比率以及总回报方面均表现出色,总回报达到惊人的 40.27%,这相较于 S&P100 ETF 超过了约 12.6%,如图 10 所示。
▲图10 基于市值加权的投资组合的表现
基于排名的策略
▲表4 MarketSenseAI 基于排名的策略的表现
表 4 和图 11 的研究重点放在了实际应用这些信号的投资组合上。结果表明,融入 GPT-4 排名的策略在总回报和风险调整指标方面明显优于其他变体。此外,MS-HighGPT 与 MS-Low-GPT 策略之间存在显著差异,突显了 MarketSenseAI 信号附加解释的价值,以及作为传统风险/回报为基础的股票排名方法的较好替代方法。
▲图11 排名投资组合的表现
GPT 排名
借鉴了 GPT-4 对 MarketSenseAI 信号排名的洞察后,其买入信号在评估期间有很高的解释质量。图 12 展示了每个月每只股票的买入信号频率,并通过散点图描绘了 GPT-4 分配的评估分数,这些分数基于每个买入建议的解释深度和相关性。从图中可以观察到,技术和人工智能相关的股票得分较高,反映了这些领域在 2023 年市场上的炒作。这不仅证明了 MarketSenseAI 的买入信号的相关性,还突显了该模型在解释中捕捉和传达当前市场情绪和潜力的能力。
▲图12 由 GPT-4 排名的信号
总结
通过综合多种来源、多种模态的信息,MarketSenseAI 提供了对金融领域更全面的视角,带来更加明智和数据驱动的投资决策。这个以 AI 为基础的框架为个人和专业投资者提供了一种独特工具,可处理和分析庞大的数据集,实现生成可扩展、可操作的投资信号。该创新性方法已经通过验证,超越基准指数,这证明了在当今复杂的市场环境中的有效性。今后将有望实现:
-
分析股票:模拟顶尖投资团队,能够提供相对专业的资产洞察,为更明智的财务决策提供全面分析。
-
投资信号:提供可行、可解释、透明的投资信号。
-
个性化投资组合:根据用户独特的投资目标和风险偏好,量身定制投资组合策略。
目前为了防范资金风险,还需要进行持续研究和长期试验,以确认 MarketSenseAI 在不同市场周期和情景中的效率和灵活性。然而,相较于之前量化方案中简单地用时间序列的相关网络处理股票数据,MarketSenseAI 还综合了股票市场的其他模态信息,进行了详细而又全面地分析解读,避免了单纯地使用黑盒神经网络在股票信息中寻找特征。也许未来它能够成为一名优秀的 AI 基金经理,让相对小白的投资人士也能通过全面的分析来读懂市场。