ChatGPT4和Gemini Ultra被Claude 3 AI模型超越了?
3月4日周一,人工智能公司Anthropic推出了Claude 3系列AI模型和新型聊天机器人,其中包括Opus、Sonnet和Haiku三种模型,该公司声称,这是迄今为止它们开发的最快速、最强大的产品。
Anthropic公司由前OpenAI的研究高管创立。在过去一年里,该公司成功完成了五轮融资,总额达73亿美元,并推出了与OpenAI的ChatGPT直接竞争的产品,获得了谷歌、Salesforce和亚马逊等大型企业的支持,从一个有前景的初创公司成长为在AI领域受到业界广泛关注和支持的热门企业。
值得一提的是,Claude 3模型具备处理和总结大量文本数据的强大能力,能够总结高达15万个英文单词,相当于长篇大作《白鲸记》或《哈利波特与死亡圣器》的长度。
相比之下,OpenAI的ChatGPT只能总结归纳大约3000个单词。此外,Anthropic还首次允许上传图像和文件。
Claude 3长文本处理能力远胜ChatGPT
该公司表示,Claude 3 Opus是三个模型中最强大的一个,它在处理复杂问题和逻辑推理方面表现卓越,超越了OpenAI的GPT-4和Google的Gemini Ultra。
其他模型Sonnet和Haiku在处理能力或功能方面相对有限,但同时也更经济实惠,因而比Opus更便宜,适合那些不需要Opus高级功能的用户或企业。
根据Anthropic联合创始人Daniela Amodei及Anthropic公司的说法,Claude 3模型存在以下特点:
1)多模态支持和文本处理能力:
-
Claude 3是Anthropic首次加入了多模态功能的模型,能够处理照片和文档、图像等多种数据类型,允许用户上传图像和文件,极大地扩展了模型的应用范围和实用性,使其成为行业内最受关注的应用之一。
-
Claude 3模型能够总结高达15万个英文单词,远超过OpenAI的ChatGPT的3000个单词,此外,Claude 3还能够根据用户的需求提供不同格式的输出,如备忘录、信件或故事等,这一能力使得Claude 3在处理长篇文本方面远超过OpenAI的ChatGPT。
-
Claude 3对用户意图和上下文的理解更加细腻,它能通过深入分析语言的语义、语境和情感等方面,提供更准确和相关的回应。
2)风险理解能力的提升:
-
Anthropic联合创始人Daniela Amodei表示,新推出的Claude 3模型在理解敏感或争议话题的风险方面较前一版本有所提升,能更准确地判断何时回应或保持谨慎。以往的Claude 2模型在处理敏感话题时过于保守,有时会过度拒绝回应敏感或有争议的话题,而Claude 3在保持安全和谨慎的同时,致力于减少不必要的回应限制,使模型更灵活实用。
具体发布时间方面,Anthropic称,Sonnet和Opus已从周一起在159个国家/地区推出,而Haiku也将很快推出。
团队方面,Amodei透露,公司在开发核心AI模型时采用了分层的团队结构。核心开发团队由60到80人组成,负责模型的算法和架构设计。技术支持团队则有120到150人,负责编程、数据处理、测试和部署等工作。
在模型的最后迭代中,直接参与开发的人数为30到35人,但整体支持团队达到了约150人。虽然直接参与核心开发的团队规模相对较小,但整个项目的支持团队规模较大,这种团队配置确保了模型开发的高效协作和优化。
仅文本不够,AI模型需多模态功能
在过去一年中,生成式AI成为商业和技术界的焦点话题,并迅速渗透到多个领域,包括教育、在线旅游、医疗行业和在线广告等,各大企业财报电话会议中也反复出现AI话题。
根据PitchBook数据,2023年AI领域的投资额达到了创纪录的291亿美元,交易量同比增长超过260%,显示出投资者对AI发展潜力的强烈信心。
AI迅速发展的同时,OpenAI首席运营官Brad Lightcap指出,仅将文本和代码作为AI模型的输入和输出是不够的,AI应该更接近于人类的自然感知和交互方式,他说道:
“世界是多模态的,人类的日常体验不仅包括文本,还涉及图像、声音等多种感觉输入。因此,仅将文本和代码作为人工智能模型的输入和输出是不够的。”
“为了让AI模型更好地模仿人类的感知和交互方式,它们需要能够处理和生成多种类型的数据。通过整合多种模态,人工智能模型可以提供更丰富、更真实的体验和应用,更接近于人类的自然感知和交互方式。”
然而,随着AI模型日益复杂化,尤其是在引入多模态功能如图像生成后,新的风险和挑战也随之而来。例如,谷歌最近因用户发现其AI图像生成器(Gemini聊天机器人的一部分)的历史不准确和有问题的回应而将其下线,这一事件在社交媒体上引起了广泛关注。
与Google的Gemini不同,Anthropic的Claude 3不具备生成图像的能力,它只允许用户上传图像和其他文档进行分析,从而在一定程度上减少了由自动生成内容引发的风险和争议。
Amodei也承认:
“当然,没有任何模型是完美的,我认为提前说清楚这一点非常重要。在开发模型时,我们不仅追求模型的性能和功能,也同样重视模型的安全性和可靠性。当然,尽管进行了严格的开发和测试,模型偶尔会犯错,并在某些情况下产生不准确或不可预测的输出。”