超越GPT-4o!新王Claude 3.5 Sonnet来啦!免费使用

目录

01 比GPT-4o更智能,比Claude 3 Opus快两倍

02 最强视觉Model

03 使用Claude的新方式:Artifacts

04 安全性和透明度




Anthropic刚刚发布了全新大模型Claude 3.5 Sonnet,号称是迄今为止最智能的模型。

一文几步教你注册使用Claude 3.5 Sonnet!icon-default.png?t=N7T8https://www.zhihu.com/question/647071517/answer/3421076391

据介绍,Claude 3.5 Sonnet是即将推出的Claude 3.5系列的首个版本。



该模型在绝大多数基准评估中都超越了竞品大模型和自家前代最强Claude 3 Opus,同时在运行速度和成本上与Claude 3 Sonnet相当。



没体验过OpenAI最新版GPT-4o?快戳最详细升级教程,几分钟搞定:
升级ChatGPT-4o Turbo步骤icon-default.png?t=N7T8https://www.zhihu.com/pin/1768399982598909952

目前,Claude 3.5 Sonnet已经在Claude.ai和Claude iOS应用程序上免费提供,Claude Pro和Team计划订户可以以更高的速率访问它。

官方地址:https://claude.ai/



此外,Claude 3.5 Sonnet还可以通过Anthropic API、亚马逊云科技Bedrock等渠道使用。

每百万个输入token的价格为3美元,每百万个输出token的价格为15美元,上下文窗口为200k token。



Anthropic表示,其目标是每隔几个月大幅度改进性能、速度和成本之间的权衡曲线。


今年晚些时候将发布Claude 3.5 Haiku和Claude 3.5 Opus。

除了开发下一代大模型,Anthropic还在开发新的模式和功能,以支持更多企业用例,包括与企业应用程序的集成。

团队还在探索诸如Memory之类的功能,使模型能够记住用户的偏好和交互历史,从而实现更加个性化和高效的体验。



01 比GPT-4o更智能,比Claude 3 Opus快两倍


Claude 3真的比GPT-4强吗?icon-default.png?t=N7T8https://www.zhihu.com/question/647113899/answer/3425719762

Claude 3.5 Sonnet在研究生水平推理(GPQA)、本科生水平知识(MMLU)和编码能力(HumanEval)方面设定了新的行业基准。



它在理解细微差别、幽默和复杂指令方面表现出显著进步,并且擅长以自然、亲切的语气撰写高质量内容。

Claude 3.5 Sonnet的运行速度是Claude 3 Opus的两倍。

这种性能提升加上实惠的价格,使Claude 3.5 Sonnet成为复杂任务的理想选择。

在内部代理编码评估中,Claude 3.5 Sonnet解决了64%的问题,优于Claude 3 Opus(解决了38%)。



Anthropic评估了Claude 3.5 Sonnet根据自然语言描述的需求,修复错误或增加功能到开源代码库中的能力。

在获得指导和相关工具后,Claude 3.5 Sonnet可以独立编写、编辑和执行代码,并具有复杂的推理和故障排除功能。

Claude 3.5 Sonnet可以轻松处理代码转换,这对于更新旧版应用程序和迁移代码库特别有效。

不过我们已知的是,公开测试集更难,那么针对公开测试集的人类基线应该会更低。

下表展示了Claude 3.5 Sonnet与其他模型的比较,评估基准包括推理、阅读理解、数学、科学和编码。在所有这些基准测试中,Claude 3.5 Sonnet的表现均优于之前的前沿模型Claude 3 Opus。

我们也可以看到表中Claude 3.5与GPT-4o的对比数据,除了数学方面,得分都比GPT-4o高或接近。

02 最强视觉Model

Anthropic表示,Claude 3.5 Sonnet是其最强的视觉模型,在所有标准视觉基准测试中都超越了前代Claude 3 Opus。

尤其是在需要视觉推理的任务中表现更为明显,例如解释图表、图形或从不完美的图像中转录文本,这是零售、物流和金融服务行业的核心功能。在这些领域,人工智能可以从图像、图形或插图中收集到比单独文本更多的见解。

下图展示了Claude 3.5 Sonnet与Claude 3 Opus、GPT-4o、Gemini 1.5 Pro在视觉数学推理、科学图表、视觉问答、图表QA、文件视觉QA任务中的性能比较。

03 使用Claude的新方式:Artifacts

Anthropic在Claude.ai上推出了Artifacts,这是一项扩展用户与Claude交互的新功能。当用户要求Claude生成代码片段、文本文档或网站设计等内容时,这些工件会出现在对话旁边的专用窗口中。

这创建了一个动态工作空间,用户可以在其中实时查看、编辑和构建Claude的创作,将AI生成的内容无缝集成到他们的项目和工作流程中。

Artifacts预览功能标志着Claude从对话式AI向协作工作环境的演变,并将很快扩展到支持团队协作。未来,团队将能够安全地将他们的知识、文档和正在进行的工作集中在一个共享空间中,而Claude则按需充当队友。

04 安全性和透明度

Anthropic表示,他们对模型进行了严格的测试,并致力于减少其被滥用的可能性。Anthropic安全团队对Claude 3.5 Sonnet在化学、生物、放射性和核(CBRN)风险、网络安全和自主能力领域进行了评估,最后将Claude 3.5 Sonnet分类为AI安全等级2(ASL-2)模型,表明它不会构成灾难性伤害的风险。

此外,作为对安全和透明度承诺的一部分,Anthropic还与外部专家合作测试和完善这一最新模型中的安全机制。


如何使用WildCard正确方式打开GPT-4o,目前 WildCard 支持的服务非常齐全,可以说是应有尽有!

官网有更详细介绍:WildCard



推荐阅读:

Claude 3真的比GPT-4强吗?

更强大Mamba-2正式发布啦!!!

黎曼猜想取得重大进展!!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/857153.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【面试题】风险评估和应急响应的工作流程

风险评估和应急响应是网络安全管理中两个重要的环节。下面分别介绍它们的工作流程: 一、风险评估工作流程: 1.确定评估范围:明确需要评估的信息系统或资产的范围。 2.资产识别:识别并列出所有需要评估的资产,包括硬件…

prometheus+grafana搭建监控系统

1.prometheus服务端安装 1.1下载包 使用wget下载 (也可以直接去官网下载包Download | Prometheus) wget https://github.com/prometheus/prometheus/releases/download/v2.44.0/prometheus-2.44.0.linux-amd64.tar.gz1.2解压 tar xf prometheus-2.44…

Modbus协议转Profibus协议网关模块连PLC与激光发射器通讯

一、概述 在PLC控制系统中,从站设备通常以Modbus协议,ModbusTCP协议,Profinet协议,Profibus协议,Profibus DP协议,EtherCAT协议,EtherNET协议等。本文将重点探讨PLC连接Modbus协议转Profibus协…

RGB彩色模型理解与编程实例

一、引言 RGB彩色模型中的R、G和B为三原色,通常R、G和B分别用8位表示,因此24位的RGB 真彩色图像能表示16777216种颜色。在如右图所示RGB彩色立方体可知,任意两种原色混合可以合成一种新的颜色。红(1,0,0&a…

微型操作系统内核源码详解系列五(3):cm3下调度的开启

系列一:微型操作系统内核源码详解系列一:rtos内核源码概论篇(以freertos为例)-CSDN博客 系列二:微型操作系统内核源码详解系列二:数据结构和对象篇(以freertos为例)-CSDN博客 系列…

如何使用nginx部署https网站(亲测可行)

公司本来有网站sqlynx.com是http运行的,但因为产品出海,基本上都要求使用https,但又需要兼容已有的http服务,所以我自己尝试做了一次https的部署,目前是正常可用的。 目录 步骤 1:安装 Nginx 步骤 2&…

数据仓库的实际应用示例-广告投放平台为例

数据仓库的数据分层通常包括以下几层: ODS层:存放原始数据,如日志数据和结构化数据。DWD层:进行数据清洗、脱敏、维度退化和格式转换。DWS层:用于宽表聚合值和主题加工。ADS层:面向业务定制的应用数据层。…

node版本过高出现ERR_OSSL_EVP_UNSUPPORTED错误

错误原因: 新版本的nodejs使用的openssl和旧版本不同,导致出错 解决方法: 1.将node版本重新换回16.x 2 windows 下 在package.json文件下添加set NODE_OPTIONS--openssl-legacy-provider && "scripts": {"dev"…

Linux开发讲课8--- linux的5种IO模型

一、这里IO是什么 操作系统为了保护自己,设计了用户态、内核态两个状态。应用程序一般工作在用户态,当调用一些底层操作的时候(比如 IO 操作),就需要切换到内核态才可以进行 服务器从网络接收的大致流程如下&#xff1…

非常难找的AI衣服图片处理工具推荐,一键轻松AI编辑

在当今数字化时代,AI技术已经渗透到我们生活的方方面面。特别是在图片处理领域,AI的强大功能让很多原本繁琐复杂的操作变得简单易行。今天,我要为大家推荐一款好用的AI衣服图片处理工具——让你一键轻松完成AI编辑,快速实现专业效…

wordpress站群搭建3api代码生成和swagger使用

海鸥技术下午茶-wordpress站群搭建3api代码生成和swagger使用 目标:实现api编写和swagger使用 0.本次需要使用到的脚手架命令 生成 http server 代码 goctl api go -api all.api -dir ..生成swagger文档 goctl api plugin -plugin goctl-swagger"swagger -filename st…

变电站智能巡检机器人解决方案

我国拥有庞大的电网体系,变电站数量众多,且近年来快速增长。然而目前我国变电站巡检方式仍以人工为主,存在效率低下、监控不全面等问题。变电站通常是一个封闭的系统空间,设备种类繁多、占地面积广阔,这对巡检人员实时…

缓存雪崩(主从复制、哨兵模式(脑裂)、分片集群)

缓存雪崩: 在同一时段大量的缓存key同时失效或者Redis服务宕机,导致大量请求到达数据库,带来巨大压力。 方法一: 给不同key的TTL添加随机值,以此避免同一时间大量key失效。(用于解决同一时间大量key过期&…

qt 如何获取磁盘信息、QStorageInfo

以往获取qt磁盘信息,笔者是通过一下API转换的 BOOL GetDiskFreeSpaceExW([in, optional] LPCWSTR lpDirectoryName,[out, optional] PULARGE_INTEGER lpFreeBytesAvailableToCaller,[out, optional] PULARGE_INTEGER lpTotalNumberOfBytes,[out, optional…

excel基本操作

excel 若要取消在数据表中进行的所有筛选 步骤操作: 单击“数据”选项卡。在“排序和筛选”组中,找到“清除”按钮。点击“清除”按钮。 图例: 将文本文件的数据导入到Excel工作表中进行数据处理 步骤: 在Excel中&#xff0c…

java之文件上传代码审计

1 文件上传漏洞审计 1.1 漏洞原理介绍 大部分文件上传漏洞的产生是因为Web应用程序未对文件的格式和进行严格过滤,导致用户可上传jsp、php等webshell代码文件,从而被利用。例如在 BBS发布图片 , 在个人网站发布ZIP压缩包, 在办公平台发布DOC文件等 , 只…

高阶图神经网络 (HOGNN) 的概念、分类和比较

图神经网络(GNNs)是一类强大的深度学习(DL)模型,用于对相互连接的图数据集进行分类和回归。它们已被用于研究人类互动、分析蛋白质结构、设计化合物、发现药物、识别入侵机器、模拟单词之间的关系、寻找有效的交通路线…

Vue70-路由的几个注意点

一、路由组件和一般组件 1-1、一般组件 1-2、路由组件 不用写组件标签。靠路由规则匹配出来,由路由器渲染出来的组件。 1-3、注意点1 一般组件和路由组件,一般放在不同的文件夹,便于管理。 一般组件放在components文件夹下。 1-4、注意点…

河南大学24计算机考研数据,有三个学院招收计算机相关专业,都是考的408!

河南大学(Henan University),简称“河大”,是河南省人民政府与中华人民共和国教育部共建高校,国家“双一流”建设高校,入选国家“111计划”、中西部高校基础能力建设工程、卓越医生教育培养计划、卓越法律人…

怎么用二维码在线下载视频?视频用二维码下载的制作方法

怎么把视频转换成二维码之后还可以下载视频呢?现在使用二维码的方式来分享视频内容在很多行业和场景中都有应用,这种方式能够更加简单快捷的完成视频的传播分享,那么怎么让扫码者可以自由选择下载视频呢?下面来给大家分享扫码下载…