基于AgentUniverse在金融场景中的多智能体应用探索
1.基于大模型智能体超级状态机
智能体、多智能体都是当下的技术热点,但作为一个技术人应该理解,所有的技术都有自己所针对的问题、及其能力边界,并不存在普适的、放诸业务场景皆 work 的技术方案。在这里尝试区分,从大模型到智能体再到多智能体这几个 AI 热点概念背后的关键差异和适用范围。
先从语言模型说起,一个经过足够语料充分预训练的基模型(base model),就是一个压缩了海量知识的知识容器,但这些知识关在数百亿到千亿的参数黑盒中难以使用。OpenAI 在 2020 推出 GPT3 的时候,因为它生成内容的不可靠和不可控,引发了当时媒体对 AI 的嘲笑和质疑,而不是现在的追捧。
2022 年底 ChatGPT 破圈逆转了大众对大语言模型的看法,基模型在完成对齐(SFT + RLHF/ DPO)之后,就成为一个助手模型(Chat model),它可以被看作一个以自然语言为输入输出接口的 AI machine,它不仅掌握语言且对齐了人的偏好,