GPT-4 的决策在股市中进行量化投资

论文题目:
Can Large Language Models Beat Wall Street? Unveiling the Potential of AI in Stock Selection

论文链接:
https://arxiv.org/abs/2401.03737

博客地址:
https://www.marketsense-ai.com/


从本质上来说,股票选择是个价格发现机制,在股票投资中,市场参与者通过理解和使用各种信息做出决策。然而,自从 08 年的金融危机后,资本市场的结构和功能发生了重大变化,对价格发现产生了持久的影响。因素共同扰乱了价格发现的正常运作,导致投资者减少准确评估风险和资产价值的动力。然而,相较于拥有专业团队和全面分析工具的财富管理公司来说,由于分析信息的能力有限、易受行为偏见的影响以及缺乏健全的风险管理技能,个人投资者通常难以分析股票。

而基于 GPT-4 进行决策的 MarketSenseAI 也许能破除这个困境,与传统股票分析方法相比,MarketSenseAI 具有以下优势:

  • 分析全面性:能够整合多种数据类型,包括公司新闻、基本面、市场动态和宏观经济信息,为投资者提供全面的分析。

  • 基于 AI 的决策:利用 GPT-4 模型进行决策,具有更高的分析能力和更强的适应性。

  • 可解释性:生成的投资建议附带详细解释,帮助投资者更好地理解分析结果。

  • 灵活性:可广泛应用于不同的金融资产,特别是在传统分析较少的市场中,可能发挥更大的优势。

MarketSenseAI

MarketSenseAI 的框架如图 1 所示,该架构整合了负责处理数据输入四个核心组件,以及用于促进最终投资建议(即买入、持有或卖出)的第五个组件,该组件综合了所有信息,并为相应的决策提供简明扼要的解释。其中每个组件都建立在 GPT-4 的 API 上,利用一次性提示和上下文学习来执行不同任务。

图片

▲图1 MarketSenseAI 的架构图

该框架可以模拟专业投资团队的决策过程,旨在提供全面而深入的投资决策支持,涵盖市场各个方面的信息。具体而言,该框架通过多个核心组件来实现这一目标。

  1. 新闻摘要器:追踪公司或其部门的最新发展,以保持对市场动态的敏感性。

  2. 基本面摘要器:对公司的最新财务报表进行分析,以评估其财务健康状况

  3. 宏观和价格动态摘要器:结合了对价格行为动态的考虑,对当前环境进行宏观经济分析。

渐进式新闻摘要器

渐进新闻摘要器负责新闻获取、压缩和制作股票最具影响力新闻的渐进性摘要。如图 2 所示,获取与特定股票对应的每日新闻。

图片

▲图2 渐进新闻摘要器

首先,对每日新闻进行预处理,剔除了与公司无关的文本,并确保其以适当的格式输入系统。接着,通过 API 访问 GPT-4,系统有序地提供提示,以生成每日新闻的简明摘要,并将其集中储存。

为了弥补特定日期摘要的不足,引入了渐进式新闻摘要器,通过将最新的新闻摘要与之前的渐进摘要集成,确保全面包含公司相关新闻内容,这对于在公司决策过程中仍具有重要意义的旧新闻(如并购或法律纠纷)尤为关键。

基本面摘要器

基本面摘要器的目标是提供公司财务状况的事实性概览,而非直接提供投资建议。

在预测性金融分析中,至关重要的基本数据能提供反映公司当前健康状况和未来走势的关键量化指标。如图 3 所示,作者使用 EODHD 的基本数据 API 获取这些关键的季度信息。为了方便对财务数据进行比较,作者在将数据输入提示之前进行了预处理:采用数字缩写技术,使用诸如“百万”和“亿”等单位来表示大数,并将来自不同季度的数据以表格形式合并。作者通过将最近两个季度的财务报表输入到 GPT-4 中进行比较,深入研究了企业利润能力、收入轨迹、债务指标和现金流动态。

图片

▲图3 股票的基本面摘要

股价动态摘要器

股价动态摘要器在 MarketSenseAI 中扮演着关键角色,它对股票的价格趋势和财务指标进行深入分析和上下文处理。如图 4 所示,该组件不仅关注目标股票本身,还通过与其他相似公司的比较,以及考虑整个市场的背景,提供了更全面的分析和情境化,以更好地理解目标股票在行业和市场整体中的表现。

图片

▲图4 股价动态摘要

识别相似股票的方法如算法 1 概述,利用 MPNet 语言模型生成 Embedding 并计算相似性分数。

图片

▲算法1 相似股票识别算法

摘要器获取了目标股票、与其相似的其他股票以及 S&P 500 指数的市场数据。接着,它对这些数据进行深入分析,关注关键的财务指标,其中包括 3、6 和 12 个月的累积回报和夏普比率,并进行了波动性和最大回撤的计算。其中:

  • 夏普比率:提供了有关股票在市场下行期间的风险调整回报的信息。

  • 最大回撤:反映了股票在某一时期内可能承受的最大损失。

这种全面的分析使我们能够深入了解目标股票相对于同行和更广泛市场的表现,包括其在市场波动和风险方面的应对能力。

宏观经济环境摘要器

进行深入的宏观经济分析对于做出明智的投资决策和有效的资本配置至关重要,因为它提供了对整体经济健康和绩效的关键见解,这有助于投资者及时获取关键信息,更好地理解当前经济环境并做出明智的投资决策。

由此,MarketSenseAI 包含了一个名为市场摘要(MarketDigest)的组件,每两周综合一次投资报告和研究文章,提供复杂经济数据和趋势的简明摘要。它通过搜集各大银行和投资机构的各种公开报告,从而确保了从多个权威来源获取信息,而且能将多种观点和分析融入连贯叙述中。具体地:

  1. 将这些报告和文章转化为文本形式,然后利用 GPT-4 对每份报告进行摘要。

  2. 将这些个别摘要浓缩成一个全面的概述。

图片

▲图5 宏观经济环境摘要

信号生成

信号生成器是 MarketSenseAI 流程的最后一步,可以整合分析多种金融数据(包括公司新闻、基本面、市场动态和宏观经济信息),从而生成投资决策信号(买入、卖出或持有),以及对这个选择背后的推理的清晰、逐步的解释。其中,GPT-4 采用思维链方法(CoT),通过多步分析引导模型做出关于下个月投资组合分配的决策,提示结构为:

  • 新闻分析:评估与目标公司相关的最新新闻摘要,以评估它们对股票绩效的潜在影响。

  • 价格动态分析:将股票的价格动态与相关股票和整体市场进行比较,提供相对绩效的视角。

  • 宏观经济环境分析:评估更广泛的宏观经济格局及其对目标公司的影响,考虑全球经济趋势和事件。

  • 基本面分析:对公司基本的财务数据进行审查,分析其当前的财务状况和未来前景。

图片

▲图6 MarketSenseAI 组件与信号的文本相似性

图 6 展示了 MarketSenseAI 内部的文本相似性分析,而表 1 则提供了详细说明,这表明模型的决策过程与不断变化的输入信息相一致,对于生成每月的投资信号至关重要。

图片

▲表1 信号与组件之间的文本相似性统计

  • 新闻和价格动态摘要有高相似性分数,表明模型强调了这些迅速变化的因素,以及它们对股价的即时影响。这对于短期、每月的预测至关重要,因为当前的发展和价格趋势很大程度上可以影响市场行为。

  • 相反,基本面和宏观组件的平均相似性分数较低,对模型每月决策的直接影响较小。基本面每季度更新一次,提供了对公司财务健康的稳定但不经常变化的视角,而宏观经济数据则更为广泛和通用,对短期投资决策的影响更小。

实验

Bootstrapping 评估结果

自举法(Bootstrapping)是一种统计学中的重抽样方法,用于估计统计量的分布或标准误差。其基本思想是通过从原始样本中有放回地抽取大量的随机样本,来近似得到原始样本的分布情况。

图片

▲表2 MarketSenseAI vs 自举投资组合

表 2 显示了实验结果,该评估对比了 MarketSenseAI 与各种自举投资组合的有效性。对 MarketSenseAI 在去趋势化收益方面的性能进行评估,从而提供了对其信号生成能力的精细分析。

实验结果表明 MarketSenseAI 的交易信号在各种信号类别中的累积收益和命中率明显优于随机机会。即使在去趋势化收益的评估中,相比于随机信号生成方法,MarketSenseAI 的表现更出色,有力地证明了其交易信号明显超出了单纯偶然的预期,这表明它在辨别具有利润潜力的投资机会方面具备较高能力。

市场表现评估结果

基本策略

图片

▲表3 MarketSenseAI 基本策略的表现

对 MarketSenseAI 的基本策略进行评估,从表 3 和图 9 的结果来看,揭示了使用 LLM 推动的投资策略的效果,总体而言,MarketSenseAI 的全部信号(MS)和仅考虑“买入”信号的长期版本(MS-L)的策略都显示出相对良好的回报

图片

▲图9 等权重投资组合的表现

结果表明,MarketSenseAI 的基本策略在总体和风险调整回报方面明显优于等权重的 S&P 100 指数,相较于市场参与者通常采用的天真的趋势跟随策略,MarketSenseAI 在 2023 年取得了更显著的结果。

基于市值加权的表现方面,MS-LCap 策略在夏普比率、Sortino 比率以及总回报方面均表现出色,总回报达到惊人的 40.27%,这相较于 S&P100 ETF 超过了约 12.6%,如图 10 所示。

图片

▲图10 基于市值加权的投资组合的表现

基于排名的策略

图片

▲表4 MarketSenseAI 基于排名的策略的表现

表 4 和图 11 的研究重点放在了实际应用这些信号的投资组合上。结果表明,融入 GPT-4 排名的策略在总回报和风险调整指标方面明显优于其他变体。此外,MS-HighGPT 与 MS-Low-GPT 策略之间存在显著差异,突显了 MarketSenseAI 信号附加解释的价值,以及作为传统风险/回报为基础的股票排名方法的较好替代方法。

图片

▲图11 排名投资组合的表现

GPT 排名

借鉴了 GPT-4 对 MarketSenseAI 信号排名的洞察后,其买入信号在评估期间有很高的解释质量。图 12 展示了每个月每只股票的买入信号频率,并通过散点图描绘了 GPT-4 分配的评估分数,这些分数基于每个买入建议的解释深度和相关性。从图中可以观察到,技术和人工智能相关的股票得分较高,反映了这些领域在 2023 年市场上的炒作。这不仅证明了 MarketSenseAI 的买入信号的相关性,还突显了该模型在解释中捕捉和传达当前市场情绪和潜力的能力

图片

▲图12 由 GPT-4 排名的信号

总结

通过综合多种来源、多种模态的信息,MarketSenseAI 提供了对金融领域更全面的视角,带来更加明智和数据驱动的投资决策。这个以 AI 为基础的框架为个人和专业投资者提供了一种独特工具,可处理和分析庞大的数据集,实现生成可扩展、可操作的投资信号。该创新性方法已经通过验证,超越基准指数,这证明了在当今复杂的市场环境中的有效性。今后将有望实现:

  • 分析股票:模拟顶尖投资团队,能够提供相对专业的资产洞察,为更明智的财务决策提供全面分析。

  • 投资信号:提供可行、可解释、透明的投资信号。

  • 个性化投资组合:根据用户独特的投资目标和风险偏好,量身定制投资组合策略。

目前为了防范资金风险,还需要进行持续研究和长期试验,以确认 MarketSenseAI 在不同市场周期和情景中的效率和灵活性。然而,相较于之前量化方案中简单地用时间序列的相关网络处理股票数据,MarketSenseAI  还综合了股票市场的其他模态信息,进行了详细而又全面地分析解读,避免了单纯地使用黑盒神经网络在股票信息中寻找特征。也许未来它能够成为一名优秀的 AI 基金经理,让相对小白的投资人士也能通过全面的分析来读懂市场。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/640792.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Web 开发 1: Flask 框架介绍和使用

在 Web 开发中,Flask 是一个流行且灵活的 Python Web 框架,用于构建 Web 应用程序。它简洁而易于上手,适用于小型到中型的项目。在本篇博客中,我将为你介绍 Flask 框架的基础知识和常用技巧,帮助你更好地掌握 Web 开发…

opencv#28 图像卷积

图像卷积 图像卷积是图像处理中最为基础的操作之一,其常用在图像的边缘检测,图像的去噪声以及图像压缩等领域。 图像卷积主要步骤: Step1:将卷积模板旋转180。 Step2:卷积模板移动到对应位置。 Step3:模板内求和,保存求和结果。 Step4:滑…

容器技术2-镜像与容器储存

目录 一、镜像制作 1、ddocker build 2、docker commit 二、镜像存储 1、公共仓库 2、私有仓库 三、镜像使用 四、容器存储 1、镜像元数据 2、存储驱动 3、数据卷 一、镜像制作 1、ddocker build 基于 Dockerfile 自动构建镜像 其机制为:每一行都会基于…

<C++>STL->string

string类的由来 这是string的定义: string类是模板实例化后的别名,basic_string是字符串类模板,常见的字符串类型有wchar_t char char16_t char32_t ,basic_string类针对的是所有字符串类型设计出来的一个模板,而我…

Elasticsearch基础篇(八):常用查询以及使用Java Api Client进行检索

ES常用查询以及使用Java Api Client进行检索 1. 检索需求 参照豆瓣阅读的列表页面 需求: 检索词需要在数据库中的题名、作者和摘要字段进行检索并进行高亮标红返回的检索结果需要根据综合、热度最高、最近更新、销量最高、好评最多进行排序分页数量为10&#xf…

flutter设置windows是否显示标题栏和状态栏和全屏显示

想要让桌面软件实现全屏和不显示状态栏或者自定义状态栏,就可以使用window_manager这个依赖库,使用起来还是非常方便的,可以自定义显示窗口大小和位置,还有设置标题栏是否展示等内容,也可以设置可拖动区域。官方仓库地…

OpenHarmony当前进展和未来趋势

操作系统自20世纪50年代诞生,经历了从专用操作系统到通用操作系统的转变。整体可以将操作系统的发展历史分为3个阶段:PC时代、移动互联网时代、万物互联时代。 PC时代主要以计算机为主,用户规模从1970年的10亿增长到1990年的30亿。这一时代诞…

鸿蒙原生应用/元服务实战-DevEco Studio 模拟器资源经常不足

DevEco Studio 模拟器资源经常不足,模拟器是最方便和最广泛的开发者可以快速体验应用元服务效果的途径,还是要加强。 除了Wearable,其他都用不了。 只能用预览器看效果,或者使用远程真机或者本地真机了。 在API9,比如分享等&…

leetcode第 381 场周赛最后一题 差分,对称的处理

第 381 场周赛 - 力扣(LeetCode)最后一题3017. 按距离统计房屋对数目 II - 力扣(LeetCode) dijkstra超时了,看了灵神的解题方法力扣(LeetCode)官网 - 全球极客挚爱的技术成长平台,其…

二.用户与权限管理(二)

用户与权限管理 5.角色管理5.1角色的理解5.2创建角色5.3给角色赋予权限5.4查看角色的权限5.5回收角色的权限5.6删除角色5.7给用户赋予角色5.8激活角色5.9撤销用户角色5.10设置强制角色(mandatory role) 6.配置文件的使用6.1配置文件格式6.2 启动命令与选项组6.3 特定MySQL版本的…

java数组ArrayList(存对象)

1、dade文件 package model;public class dade {private int id;private String name;public dade() {}public dade(int id, String name) {this.id id;this.name name;}public int getId() {return id;}public void setId(int id) {this.id id;}public String getName() {…

推荐IDEA一个小插件,实用性很高!!

插件: Convert YAML and Properties File 由于每个人的开发习惯不同,在开发过程中会遇到各种小细节的问题。今天给大家介绍一个小插件,作用不大,细节很足。 就是properties类型文件和yml文件互相自由转换 解决:…

【webrtc】neteq测试工程

设置git代理 $ git config --global http.https://github.com.proxy socks5://127.0.0.1:7890 git config --global https.https://github.com.proxy socks5://127.0.0.1:7890导入cmake直接构建 win32 debug v143 编译opus Build started...

云原生全栈监控解决方案(全面详解)

【作者】JasonXu 前言 当前全球企业云化、数字化进程持续加速,容器、微服务等云原生技术在软件架构中快速渗透,IT 架构云化、复杂化持续驱动性能监控市场。企业云化、数字化持续转型,以及为了考虑系统的弹性、效率,企业软件开发中…

【linux】 查看 Linux 重启历史记录(reboot)

了解 Linux 重启日志 /var/log 目录隐藏着 Linux 日志机制的核心信息,它是记录系统活动的宝贵仓库。然而,仅仅有日志还不够,真正的难题在于,如何从大量数据中提炼出与系统重启相关的关键信息。 在 /var/log 目录中,可…

简单但全面了解一下webSocket

文章目录 webSocket是一种协议,设计用于提供低延迟、双全工和长期运行的连接什么是实时通信? webSocket之前的世界webSocket的优势为什么需要心跳机制?webSocket的限制 webSocket是一种协议,设计用于提供低延迟、双全工和长期运行…

CRM系统的痛点,如何解决?

在当今竞争激烈的商业世界中,客户关系管理(CRM)数字化转型已经成为大企业成功的重要秘诀。大型跨国公司如亚马逊、苹果和微软等已经在CRM数字化方面走在了前列,实现了高度个性化的客户体验,加强了客户忠诚度。 然而&a…

Conda python管理环境environments 四 从入门到精通

Conda系列: 翻译: Anaconda 与 miniconda的区别Miniconda介绍以及安装Conda python运行的包和环境管理 入门Conda python管理环境environments 一 从入门到精通Conda python管理环境environments 二 从入门到精通Conda python管理环境environments 三 从入门到精通…

【Linux】解决能访问github但克隆不了的问题

文章目录 1.查看你的代理的地址:2.git设置3.尝试clone 1.查看你的代理的地址: 2.git设置 先看看当前的git设置 $ git config --list然后git中要设置好对应的地址 git config --global http.proxy 127.0.0.1:78903.尝试clone $ git clone https://git…

服务器感染了.wis[[Rast@airmail.cc]].wis勒索病毒,如何确保数据文件完整恢复?

导言: 在当今数字化的时代,恶意软件攻击已经变得越来越复杂和狡猾,[[MyFilewaifu.club]].wis [[backupwaifu.club]].wis[[Rastairmail.cc]].wis勒索病毒是其中的一种新威胁。本文91数据恢复将深入介绍[[MyFilewaifu.club]].wis [[backupwaif…