【人工智能】Anthropic发布强大的Claude3对齐GPT-4,大模型杂谈个人感想

北京时间3月5日,人工智能创业公司Anthropic宣布,推出其突破性的Claude 3系列模型。Claude 3系列包含三个子模型,分别为Claude 3 Haiku、Claude 3 Sonnet和Claude 3 Opus,它们提供不同程度的智能、速度和成本选择,以满足各种人工智能应用需求。复杂的推理任务上,Claude3可以说是全面吊打GPT-4。定价上,Claude 3比GPT-4 Turbo更高:GPT-4 Turbo每百万token输入/输出分别收费为10美元/30美元;而Claude 3 Opus的价格分别为15/75 美元。

看完国内铺天盖地的这类资讯,打开官网https://www.anthropic.com/ , 看了一会介绍默默关闭了窗口。

先细数下国内外相对出名的大模型吧,

语言类大模型或工具大致有:

国外 openai的chatGPT,还google的gemini、开源Gemma ,  meta开源Llama, 再加上Anthropic的Claude

国内 baidu的文心一言 aliyun的开源通义千问, 腾讯的混元大模型, 华为的盘古大模型,    智谱AI的开源ChatGLM, 百川智能的百川大模型, 月之暗面的kimiChat,再算上抖音的coze平台

标粗的是不是大家比较熟知常用的,开源的程序员可能用的多些,其他普通人用的多一些。大家会发现,其实我们选择哪款AI大模型或工具, 其实看中的是它解决问题的能力。 比如国内的chatGPT套壳软件为啥很流行,因为一般人使用不了魔法,但chatGPT这个大家都在推啊,肯定要尝尝鲜啥的。比如kimiChat, 写AI爆文啥的不少博主会推荐它,为啥, 因为它能解决长文的问题,能解决chatGPT token数限制的问题。

生图类,大家是不是知道最多的是midjourny(入门简单,生成图片下限高),  开源Stable Diffusion (入门复杂,生成图片上限高), openai的DALL-E , 其他国内的是不是很少见有人推,可能大家听到最多的是midjourny国内套壳,推SD的云部署版本。 国内生图大模型,我不得不吐槽。 抛开技术层面,生成的图片还有AI生成水印,还需要让大家P图去水印, 不知道产品经理是如何设计产品的,让大家使用带水印的图片么,或者增加工作量再P一次么。

视频类, 国外的Runway、 pika ,  以及openai 即将推出的 Sora , aliyun即将推出的EMO, 其他公司也有类似的,大家是不是很少听到。 为啥很少看到大家推这个,直接使用价格贵啊。 制作视频大家为了节省成本,可能常规使用Stable Diffusion +Control Net + Lora 固定形象图片 ,使用剪影合成了。

上面只是我的个人理解,不一定完全对。下面是我自己的一些感想。

1、先发优势。不管哪个大模型,先发就是优势。 就像跑步,大家很容易知道第一名,可能第二名第三名也有人知道的,后面做的除非特别好,基本很少人知道的。 

2、特色优势。弯道超车,一定有一项特别NB的优势。比如上面举例的kimiChat, 大家都知道他的长文厉害啊。为啥很多大模型大家不熟知,自己在huggingface上看的眼花缭乱,因为大家都不知道他的特色是什么,和其他大模型比优势是什么。

3、用户诉求。不管做什么产品,必须考虑用户诉求。还是上面的例子, 大家生成图片,是不是想用在某个地方, 突然来个水印说AI生成,大家立马反感了。会员我不清楚是否有水印,但一般人有白嫖使用的心理。看到试用这样的效果,基本很少有下一步了。

4、产品定位。做好产品定位,了解产品的用户群体,掌握消费者的预期。比如视频生成要出来大模型肯定烧钱呢,但定价可能就面向高级客户(大企业,视频制作等专业公司,高阶玩家),普通客户非刚需场景可能消费不起。这几年消费降级, 大家PDD买东西也是这个道理。但香奈儿还是很火爆,说明富人群体还是多。

5、投入性价比。学习或研究大模型一定要投入产出比,想明白自己的最终目的是什么。 我之前吭哧吭哧闷头苦学了pytorch、TensorFlow等框架皮毛,后面我发现会一些 损失函数、梯度下降、CNN、RNN、transformer等hello world用法貌似独立解决不了工作生活中的问题,自己一个非计算机本科生,当初不知道考研读博的香,年龄大了也去不了大公司卷。 作为程序员,老老实实学习LangChain  , AI agent看看应用场景吧,后续看有没有机会从JAVA、python WEB搬运工再扩展多一个大模型应用搬运工身份。

写的比较乱,  Claude3暂时先不学了(大模型框架日新月异变化太快),看他后续的潜力如何, 现阶段chatGPT4、 DALL-E、 SD等大模型暂时能满足个人需求了, 重心放在大模型应用开发 + AI应用上。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/721799.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【优化方案】Java 将字符串中的星号替换为0-9中的数字,并返回所有可能的替换结果

需求 将输入的字符串中的星号替换为0-9中的数字,并返回所有可能的替换结果,允许存在多个*号。 分析: 在每个星号位置,我们需要进行 0-9 的循环遍历,因此每个星号位置都有 10 种可能性。如果字符数组中有k个星号&#x…

轻松记录收支明细,智慧分析财务情况,一键打印保存!“

在这个信息爆炸的时代,财务管理已成为我们生活中不可或缺的一部分。无论您是家庭主妇、白领上班族还是企业经营者,都需要对自己的财务情况了如指掌。那么,如何轻松记录和分析收支明细,让财务管理变得简单高效呢?今天&a…

Mutex 争用解析

导读 上一篇文章介绍了latch争用的相关内容,本文继续介绍与latch相关的mutex争用的相关内容。 1、Mutex故障排除 查看相关视图v$sessionV$SESSION_WAIT P1,P2,P3值表示library cache 对象在争用状态下的哈希值,即持有mutex的会话。V$event_name和V$ses…

蓝凌EIS智慧协同平台 rpt_listreport_definefield.aspx SQL注入漏洞复现

0x01 产品简介 蓝凌EIS智慧协同平台是一款专为企业提供高效协同办公和团队合作的产品。该平台集成了各种协同工具和功能,旨在提升企业内部沟通、协作和信息共享的效率。 0x02 漏洞概述 由于蓝凌EIS智慧协同平台 rpt_listreport_definefield.aspx接口处未对用户输入的SQL语句…

Android中get、post、图片下载的类

创建Network公共类 &#xff08;这里面都没有加token&#xff0c;如果需要可以自行添加&#xff09; 添加依赖 implementation com.squareup.okhttp3:okhttp:4.9.3 implementation com.google.code.gson:gson:2.8.9 添加网络权限 AndroidManifest.xml里面添加 <uses-pe…

ZCC6983最大充电电流 2A、升压型 3 节锂电池充电管理器

特性 ■ 高达 2A 的可调充电电流&#xff08;受实际散热和输入功率 限制&#xff09; ■ 支持 12.6V、12.9V、13.05V、13.2V 的充满电压 ■ 高达 28V 的输入耐压保护 ■ 高达 28V 的电池端耐压保护 ■ 宽输入工作电压范围&#xff1a;3.0V~9.5V ■ 峰值效率可达 96…

Linux 文件系列:深入理解文件描述符fd,重定向,自定义shell当中重定向的模拟实现

Linux 文件系列:深入理解文件fd,重定向,自定义shell当中重定向的模拟实现 一.预备知识二.回顾C语言中常见的文件接口跟重定向建立联系1.fopen函数的介绍2.fclose函数的介绍3.代码演示1.以"w"(写)的方式打开2.跟输出重定向的联系3.以 "a"(追加)的方式打开4.…

枚举与尺取法(蓝桥杯 c++ 模板 题目 代码 注解)

目录 组合型枚举&#xff08;排列组合模板&#xff08;&#xff09;&#xff09;: 排列型枚举&#xff08;全排列&#xff09;模板&#xff1a; 题目一&#xff08;公平抽签 排列组合&#xff09;&#xff1a; ​编辑 代码&#xff1a; 题目二&#xff08;座次问题 全排…

Java8的Stream执行机制

Java8的Stream执行机制 Stream的概念解说Stream的概念解说-Stream的含义Stream的概念解说-现实类比Stream的概念解说-Stream中的概念Stream的执行机制Stream的执行机制-最直接的流水线实现方式Stream的执行机制-for循环也能干的事Stream的执行机制-基本类图Stream的执行机制-记…

AI大模型的预训练、迁移和中间件编程

大家好&#xff0c;我是爱编程的喵喵。双985硕士毕业&#xff0c;现担任全栈工程师一职&#xff0c;热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。…

jest单元测试

用jest写修改密码的弹出框的单元测试&#xff1a; import { render, fireEvent } from testing-library/react; import ChangePasswordModal from ./ChangePasswordModal;describe(ChangePasswordModal, () > {test(renders password input fields and save button, () >…

经验风险最小化(Empirical Risk Minimization, ERM)

经验风险最小化&#xff08;Empirical Risk Minimization, ERM&#xff09;是机器学习中的一个基本原则&#xff0c;它旨在通过最小化训练数据集上的损失来训练模型。这种方法基于这样一个假设&#xff1a;通过最小化模型在训练集上的误差&#xff08;即经验风险&#xff09;&a…

RS编码的FPGA实现

RS编码&#xff0c;即Reed-solomon codes&#xff0c;是一类纠错能力很强的特殊的非二进制BCH码&#xff08;BCH码是一种有限域中的线性分组码&#xff0c;具有纠正多个随机错误的能力&#xff09;。对于任选正整数S可构造一个相应的码长为nqS-1的 q进制BCH码&#xff0c;而q作…

2024-03-05 linux 分区老显示满,Use 100%,原因是SquashFS 是一种只读文件系统,它在创建时就已经被填满,所有空间都被使用。

一、这两天一直纠结一个问题&#xff0c;无论怎么修改&#xff0c;linux 分区老显示满&#xff0c;Use 100%&#xff0c;全部沾满。如下图的oem分区。 二、导致出现上面的原因是&#xff1a;SquashFS文件系统里的空间利用率总是显示为100%。 三、SDK里面也说明SquashFS文件系统…

$nextTick底层原理(详细) - vue篇

公众号&#xff1a;需要以下pdf&#xff0c;关注下方 2023已经过完了&#xff0c;让我们来把今年的面试题统计号&#xff0c;来备战明年的金三银四&#xff01;所以&#xff0c;不管你是社招还是校招&#xff0c;下面这份前端面试工程师高频面试题&#xff0c;请收好。 前言 n…

【力扣白嫖日记】1045.买下所有产品的客户

前言 练习sql语句&#xff0c;所有题目来自于力扣&#xff08;https://leetcode.cn/problemset/database/&#xff09;的免费数据库练习题。 今日题目&#xff1a; 1045.买下所有产品的客户 表&#xff1a;Customer 列名类型customer_idintproduct_keyint 该表可能包含重复…

数据结构 - Trie树(字符串统计、最大异或对)

文章目录 前言Part 1&#xff1a;Trie字符串统计1.题目描述输入格式输出格式数据范围输入样例输出样例 2.算法 Part 2&#xff1a;最大异或对1.题目描述输入格式输出格式数据范围输入样例输出样例 2.算法 前言 本篇博客将介绍Trie树的常见应用&#xff0c;包括&#xff1a;Trie…

运维随录实战(3)

Gitlab架构设计 方案一:SaaS方案 依赖资源: PostgreSQL: 阿里云SAAS服务高可用版2c4g/100GRedis:阿里云SAAS服务高可用版2G代码存储:阿里云NAS盘500GGitLab服务架构: 2*4c8g1*SLB(复用官网SLB)n*GitlabRunner备份方案 PostgreSQL通过阿里云备份功能每天备份一次 代码…

OPC DA协议网关

在工业自动化领域&#xff0c;数据的采集与传输是至关重要的环节。而OPC DA&#xff08;OLE for Process Control Data Access&#xff09;协议作为这一领域内的标准通信协议&#xff0c;为不同设备和软件之间的数据交换提供了统一的接口。今天&#xff0c;我们就来深入了解一下…

Cookie和session 及Web相关工具

一 Cookie &#xff08;一&#xff09;介绍 Cookie 又称为"小甜饼”。类型为"小型文本文件”&#xff0c;指某些网站为了辨别用户身份而储存在用户本地终端&#xff08;Client Side&#xff09;上的数据&#xff08;通常经过加密&#xff09;。由网景公司的前雇员…