Anthropic 公司最新宣布,他们的 AI 聊天机器人模型击败了 OpenAI 的 GPT-4

  每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/

AI初创公司Anthropic,背靠谷歌和数亿美元的风险投资(很可能很快还会增加数亿美元),今天宣布了其最新一代人工智能技术Claude的发布。该公司声称,这款AI聊天机器人在性能上超越了OpenAI的GPT-4。

Anthropic的新一代AI,名为Claude 3,包含了多个模型——Claude 3 Haiku、Claude 3 Sonnet和Claude 3 Opus,其中Opus是最强大的。Anthropic声称,所有这些模型在分析和预测方面都显示出了“增强的能力”,在特定基准测试中的表现也优于像ChatGPT和GPT-4,以及谷歌的Gemini 1.0 Ultra(但不包括Gemini 1.5 Pro)。

值得注意的是,Claude 3是Anthropic首款多模态的人工智能,意味着它可以分析文本和图片——类似于GPT-4和Gemini的某些版本。Claude 3可以处理照片、图表、图形和技术图纸,能够从PDF、幻灯片和其他文档类型中提取信息。

与一些人工智能竞争对手相比,Claude 3在一个方面做得更好,那就是可以在单个请求中分析多张图片(最多20张)。这使得它能够比较和对比图片,如Anthropic所述。

但是,Claude 3在图像处理方面也有其限制。

Anthropic已禁用模型识别人物——无疑是出于对伦理和法律影响的考虑。公司承认,Claude 3在处理“低质量”图片(低于200像素)时容易出错,并且在涉及空间推理(例如,读取模拟时钟面)和对象计数(Claude 3不能准确计算图像中的对象数量)的任务上存在困难。

至少目前而言,Claude 3也不会生成艺术作品。模型严格用于图像分析。

不论是处理文本还是图像,Anthropic表示,客户通常可以期待Claude 3比其前代模型更好地遵循多步骤指令,产生像JSON这样的结构化输出,并且能够使用英语之外的语言进行对话。得益于“对请求更加细腻的理解”,Claude 3应该更少地拒绝回答问题。不久后,模型还将引用其回答问题的来源,以便用户可以验证。

Anthropic在一篇支持文章中写道:“Claude 3倾向于生成更具表现力和吸引力的回应,”“与我们的旧模型相比,它更易于提示和引导。用户应该发现,他们可以使用更短、更简洁的提示来达到所需的结果。”

这些改进部分源于Claude 3的扩展上下文。

模型的上下文,或上下文窗口,指的是模型在生成输出之前考虑的输入数据(例如,文本)。具有小上下文窗口的模型倾向于“忘记”即使是非常近期的对话内容,导致它们偏离主题——经常以问题性的方式。作为一个额外的好处,大上下文模型可以更好地把握它们所接收的数据的叙事流,并生成更富有上下文的回应(至少理论上是这样)。

Anthropic表示,Claude 3最初将支持200,000令牌的上下文窗口,相当于约150,000个单词,某些客户将获得高达1,000,000令牌的上下文窗口(约700,000个单词)。这与谷歌最新的人工智能模型Gemini 1.5 Pro相当,后者也提供了高达一百万令牌的上下文窗口。

然而,仅仅因为Claude 3比之前的版本有所提升,并不意味着它是完美的。

在一篇技术白皮书中,Anthropic承认Claude 3并非免疫其他人工智能模型所面临的问题,即偏见和幻觉(即,编造事实)。与某些人工智能模型不同,Claude 3不能搜索网络;模型只能使用2023年8月之前的数据回答问题。而且,虽然Claude支持多种语言,但它在某些“低资源”语言上的流利程度不及英语。

但Anthropic承诺将在接下来的几个月中频繁更新Claude 3。

“我们并不认为模型智能已经达到其极限,我们计划在接下来的几个月内发布Claude 3模型家族的[增强功能],”公司在博客文章中写道。

Opus和Sonnet现已通过网页、Anthropic的开发控制台和API、亚马逊的Bedrock平台以及谷歌的Vertex AI提供。Haiku将于今年晚些时候推出。

以下是定价细节:

Opus:每百万输入令牌15美元,每百万输出令牌75美元 Sonnet:每百万输入令牌3美元,每百万输出令牌15美元 Haiku:每百万输入令牌0.25美元,每百万输出令牌1.25美元 那么,Claude 3的全局观是什么呢?

嗯,正如我们之前报道的,Anthropic的雄心是创造一个下一代的“AI自我教学”算法。这样的算法可以用来构建虚拟助手,它们可以回答电子邮件、执行研究、生成艺术品、书籍等——我们已经通过GPT-4和其他大型语言模型尝试了其中的一些功能。

Anthropic在上述博客文章中暗示了这一点,称它计划添加使Claude 3具备开箱即用能力的功能,通过让Claude与其他系统交互、"交互式"编码和提供"高级代理能力"。

这最后一点让人想起OpenAI报道的雄心,即建立一个软件代理来自动执行复杂任务,如将数据从文档转移到电子表格或自动填写费用报告并将其输入会计软件。OpenAI已经提供了一个API,允许开发人员将“代理式体验”构建到他们的应用中,而Anthropic似乎也致力于提供可比的功能。

我们能从Anthropic那里看到图像生成器吗?坦白说,我会感到惊讶。如今,图像生成器是许多争议的主题,主要是出于版权和偏见相关的原因。谷歌最近被迫禁用了其图像生成器,因为它以对历史背景的滑稽无视注入了多样性。而且,一些图像生成器供应商正在与艺术家进行法律斗争,这些艺术家指控他们通过在未提供补偿或甚至信用的情况下,使用他们的作品训练GenAI而获利。

我很好奇看到Anthropic训练GenAI的技术进化,“宪法AI”,该公司声称使其GenAI的行为更易于理解、更可预测并且需要时更简单地调整。宪法AI旨在提供一种方式,使AI与人类意图对齐,让模型使用一组简单的指导原则回答问题和执行任务。例如,对于Claude 3,Anthropic表示,它添加了一个原则——根据众包反馈——指导模型对残疾人士表现出理解并易于接近。

无论Anthropic的最终目标是什么,它都在长期规划中。根据去年5月泄露的一份推介文稿,该公司计划在未来12个月左右的时间里筹集高达50亿美元——这可能只是它需要保持与OpenAI竞争的基线。(毕竟,训练模型并不便宜。)它已经在谷歌和亚马逊分别承诺的资本和承诺中分别获得了20亿美元和40亿美元,以及其他支持者合计超过十亿美元。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/733249.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Unity Text文本实现滚动跑马灯效果

在一些公告上我们经常会看到文字滚动跑马灯的效果。 那么在Unity上如何实现? 1、首先创建一个Text(或者TextMeshPro)组件,然后输入需要显示的文本内容,如图: 2、编写控制脚本TextRoll.cs: using System.Collections…

钉钉h5应用 globalthis is not defined vite client

钉钉h5应用 globalthis is not defined vite client problem 背景 钉钉h5应用使用 vue3 vite 构建的前端工程 问题 h5页面在pc端浏览器和pc端钉钉打开正常h5页面在移动端钉钉打开异常 页面空白 通过调试工具找到报错信息 globalthis is not defined vite client reason …

ULTRAL SCALE FPGA TRANSCEIVER速率

CPLL支持2-6.25速率 QPLL支持速率 实际使用CPLL最高可以超过这个,QPLL最低也可以低于这个,xilinx留的阈量还是比较大。

这是谁的女儿?其母亲早已红过头了,现在小小年纪的她也爆红网络,没想到吧?

这是谁的女儿?其母亲早已红过头了,现在小小年纪的她也爆红网络,没想到吧? 原来,作母亲的她在红极一时后似乎沉寂了下来,没想到她11岁的女儿近年来也在社交媒体上走红,她为何也成了小网红呢&…

数字化转型导师坚鹏:大模型的应用实践(金融)

大模型的应用实践 ——开启人类AI新纪元 打造数字化转型新利器 课程背景: 很多企业和员工存在以下问题: 不清楚大模型对我们有什么影响? 不知道大模型的发展现状及作用? 不知道大模型的针对性应用案例? 课程…

C# 高级特性(十一):多线程之async,await

之前使用Thread和Task启动多线程时都会遇到一个麻烦,就是如何反馈结果。在代码里就是如何设计回调函数。如果带界面还得考虑UI线程的问题。 而使用async,await可以达到两个效果。 1 不用设计回调函数,直接按单线程的格式写。 2 不用考虑UI…

【决策树】预测用户用电量

决策树预测用户用电量 文章目录 决策树预测用户用电量  👉引言💎一、 数据预处理数据预处理初步数据分析 二、 机器学习算法决策树回归预测用电量决策树模型介绍:回归预测 三、 可视化结果四、 数据分析与结论代码如下 👉引言&a…

代码随想录算法训练营第四天|24.两两交换链表中的节点、19.删除链表的倒数第N的节点、07.链表相交、142.环形链表II

代码随想录算法训练营第四天|24.两两交换链表中的节点、19.删除链表的倒数第N的节点、07.链表相交、142.环形链表II 24.两两交换链表中的节点 给你一个链表,两两交换其中相邻的节点,并返回交换后链表的头节点。你必须在不修改节点内部的值的情况下完成…

Vue+OpenLayers7入门到实战:OpenLayers7点聚合(聚散点)功能,地图缩小显示聚集数量,点击聚集点散开和地图放大后显示要素图片

返回《Vue+OpenLayers7》专栏目录:Vue+OpenLayers7入门到实战 前言 本章介绍如何使用OpenLayers7在地图上实现地图点聚合(聚散点)功能,实现地图缩小显示聚集数量,点击聚集点和地图放大后显示要素对应icon图片的功能。 二、依赖和使用 "ol": "7.5.2"…

猫头虎分享已解决Bug || 云服务中断:CloudOutage, CloudProviderError

博主猫头虎的技术世界 🌟 欢迎来到猫头虎的博客 — 探索技术的无限可能! 专栏链接: 🔗 精选专栏: 《面试题大全》 — 面试准备的宝典!《IDEA开发秘籍》 — 提升你的IDEA技能!《100天精通鸿蒙》 …

markdown页面宽度放宽

变成以上样式 ------------------------------------------------ 然后最后一行加上 #write{ max-width: 90%; } /* 调整源码正文宽度 */ #typora-source .CodeMirror-lines { max-width: 90%; } /* 调整输出 PDF 文件宽度 */ media print { #write{ max-w…

图|dfs bfs|最小生成树|最短路|一篇搞定图的所有知识点

文章目录 图前言项目代码仓库图的基本概念图的表示方法邻接矩阵邻接表图的一些相关概念 图的遍历bfsdfs如果给的图不是连通图? 最小生成树Kruskal算法Prim算法 最短路径单源最短路径--Dijkstra算法单源最短路径--Bellman-Ford算法多源最短路径--Floyd-Warshall算法 …

WiFi模块助力少儿编程:创新学习与实践体验

随着科技的飞速发展,少儿编程已经成为培养孩子们创造力和问题解决能力的重要途径之一。在这个过程中,WiFi模块的应用为少儿编程领域注入了新的活力,使得学习编程不再是单一的代码教学,而是一个充满创新与实践的综合性体验。 物联网…

Python快速入门系列-2(Python基础语法)

第三章:Python基础语法 3.1 变量与数据类型3.1.1 变量的定义与赋值3.1.2 数据类型3.1.3 类型转换 3.2 注释与缩进3.2.1 注释3.2.2 缩进 3.3 条件语句与循环结构3.3.1 条件语句3.3.2 循环结构 3.4 函数与模块3.4.1 函数3.4.2 参数和返回值3.4.3 模块3.4.4 标准库中的…

链表|142.环形链表

ListNode *detectCycle(ListNode *head) {ListNode *fast head, *slow head;while (fast && fast->next) {// 这里判断两个指针是否相等,所以移位操作放在前面slow slow->next;fast fast->next->next;if (slow fast) { // 相交&#xff0c…

考研复试要想顺利通关,务必掌握的一些问题

亲爱的学弟学妹们,大家好! 我是研一的学姐,深知考研路上的艰辛与不易。如今,为了回馈广大考研学子,我决定将自己精心整理的考研复试资料拿出来与大家分享,希望能为你们的复试之路添砖加瓦,助你…

【C语言】linux内核dev_queue_xmit

一、中文注释 这两个函数是Linux内核网络子系统中负责发起网络包(sk_buff结构)传输的代码。下面我将用中文对这两个函数做一个简单的注释: /*** __dev_queue_xmit - 发送一个buffer* skb: 要发送的buffer* sb_dev: 子设备,用于层…

12. 建立用户表并使用雪花算法生成用户ID

文章目录 一、建立用户表二、雪花算法生成唯一ID三、将雪花算法整合到我们的项目中 一、建立用户表 上一节我们搭建完了脚手架,从这一节开始,就正式进入到业务逻辑的开发了。首先要开发的就是博客系统的用户注册与登录功能。 既然涉及到用户&#xff0…

XSS靶场-DOM型初级关卡

一、环境 XSS靶场 二、闯关 1、第一关 先看源码 使用DOM型&#xff0c;获取h2标签&#xff0c;使用innerHTML将内容插入到h2中 我们直接插入<script>标签试一下 明显插入到h2标签中了&#xff0c;为什么不显示呢&#xff1f;看一下官方文档 尽管插入进去了&#xff0…

存算一体成为突破算力瓶颈的关键技术?

大模型的训练和推理需要高性能的算力支持。以ChatGPT为例&#xff0c;据估算&#xff0c;在训练方面&#xff0c;1746亿参数的GPT-3模型大约需要375-625台8卡DGX A100服务器训练10天左右&#xff0c;对应A100 GPU数量约3000-5000张。 在推理方面&#xff0c;如果以A100 GPU单卡…