开源大模型LLaMA 2会扮演类似Android的角色么?

图片

在AI大模型没有商业模式?等文章中,我多次表达过这样一个观点:不要把大模型的未来应用方式比喻成公有云,大模型最终会是云端操作系统的核心(新通用计算平台),而它的落地形式会很像过去的沃森,以系统型超级应用的形态落地。假如真的这样,那无疑的就需要一个开源的、便宜的“安卓”来真正启动这种落地。没想到的是这还没过去一个月,LLaMA 2出现了,并且表现优异。那LLaMA 2会在AI行业里扮演移动互联网中安卓的角色么?(其它如chatGPT 和AlphaGo下围棋,谁赢?垂域大模型有戏么?等一系列与此有关的大模型文章参见个人公号:琢磨事

安卓与历史性时刻

整个移动互联网有两个至关重要的历史性时刻:一个是iPhone的发布,这伴随着乔布斯而载入史册;一个则是同年Android的发布,相比之下这个则有点默默无闻。但实际上对于移动互联网而言,后者的实际影响大于前者。每年全球手机销量里面15%左右为苹果手机,其它基本是安卓手机。

换句话说,没有安卓就没有移动互联网。

那安卓这类操作系统到底是什么?为什么这么关键?我们来简单科普下操作系统的概念。

图片

(操作系统最简示意图)

这个图不十分精确,Kernel(内核)那个位置通常还有非常复杂的各种模块,但好在它能清楚说明操作系统是什么。安卓就处于中间的Kernel那个位置,对上面的各种应用比如微信、抖音来讲,他们其实根本接触不到麦克风、摄像头、内存、网络等,所有对具体物理设备的使用都要通过安卓这样的系统。

这样的分工好处是什么呢?

降低开发和应用成本。在IT行业的早期没有上面的分工,通常都是一个公司(比如IBM)把所有事都干了。这就导致对人员要求非常高。纯粹从技术复杂度角度看开发一般终端应用的难度如果是1,那很多操作系统里模块的开发难度估计是10,并且两者的难度不在一个维度上。同时操作系统只有1个,但应用会有无数个(安卓--应用商店)。所以就需要一种更为高效的分工方式,于是行业再分工,操作系统出现了。

高效的分工体系才能导致整个生态的大发展,对于移动互联网安卓就是生态大发展的最关键支点。如果微信团队需要自己做安卓,那很可能我们就看不见微信了。

如果说技术意义上的操作系统是上面那张简图,那商业意义上的操作系统则是一个引擎,为所有应用提供动力,缩减它们的开发成本、缩短周期。

大模型扮演的就是这个角色,但如果它只有一个(chatGPT),并且只是OpenAI自己用,那就像只有iOS一样,根本就造不出来五花八门的手机,也就不会有移动互联网的真正启动。

过去基于chatGPT根本没法打造沃森这样的系统,各种数据风险的考量根本不是一个技术进步就能对冲掉的,谁愿意把数据都上传到OpenAI呢,谁愿意依赖一个完全不知道的黑盒呢!

但在过去别的大模型又太差了,LLaMA 2在改变这种局面,从评测看它基本赶上GPT3.5,,也就是说在创造价值的维度它变的能用了,在落地的维度又因为开源而能对冲风险上的顾虑。再发展下去就真的会变成一个新智能生态的引擎,类似安卓的角色。

在前面系列文章里面也曾经多次提到我们普遍的看待大模型的方式是有问题的。如果就看到技术和能力,而看不到它的落地需要一套复杂系统做支撑,那就搞不清它的真正价值创造方式,就会争论是屁胡还是什么,但其实并不对。

人工智能应用会大爆发么?

如果评测结果无误,那现在就需要开始在不同的领域打造一个个类似沃森的系统。否则可能就晚了。

大模型很关键,提供了打造智能型应用的机会,但就像移动互联网上真正有价值的是微信而不是一个裸的安卓一样,大模型也需要在它上面长出自己的应用。用系统的思维模式很容易看到这类系统型超级应用的关键点。我们换一张图来对此进行说明。

图片

(Alexa基础架构,本质和安卓一样)

上图是亚马逊Alexa的基础架构图,为什么用它呢,因为Alexa是现在为止最像云端操作系统的一个产品。

实际上OpenAI的插件骨子里也是这模式。可以这么讲从大模型的角度看OpenAI的远胜,这种智能的进步大幅缩减应用(上图中的Alexa Skills Kit)的开发成本,但从系统完备性的角度看OpenAI还有很长一段路要走,比如对大规模设备的介入和管控等。

基于这种架构图很容易看出基于大模型的超级应用的关键点:

大模型:会处于中间的部分,负责提供通用智能的能力。也要与其它各类算法相配合,比如感知类算法、推荐类算法等。上图中针对交互做了一点分解,分成:语音识别(ASR)和自然语言理解,后者会完全被大模型取代,但不会改变架构。

AIoT基础设施:为了支撑大模型跑好并且和另外几部分连接起来,AIoT用的东西一个也缺不了,包括大规模设备管理通讯等。这些部分加起来才是过去系统的Kernel,也就是安卓所扮演的角色(上图中间的部分)。

用户侧(上图右侧):要提供充分感知,这种感知要有时间维度和空间维度,要有现场和历史数据。我们和智能音箱进行交互的时候,先要喊一嗓子,比如小爱同学等,它要听不到不管后面大模型多厉害也是不行。然后交互的时候肯定需要这个人的建模数据(历史)以及位置等,然后才能做好内容输出。不同场景下这部分会有比较大差别,比如沃森的场景可能就需要个人的24小时心电图、病史以及基因数据。这些部分非常关键,需要综合应用IoT和各种算法才能达成目标。大模型在这个环节扮演的角色没那么关键。

应用侧(上图左侧):智能音箱的场景就需要对接各种数据源(chatGPT的插件就干这事的),总不能天气也靠大模型来生成吧。对于沃森类系统这里就需要行业数据和法规等。

相比于过去应用侧在变薄,但问题是三个部分整个加一起才是智能云系统下的应用,非要类比的话这种新应用的创建有点像需要打造一个个属于特殊领域的手机。

有无数个领域需要这种系统型超级应用,医疗、教育、税务、企业、零售、军事、家居等,很久以前DeepMind甚至还尝试过给Google数据中心做个这样的应用来管空调。

人工智能应用确实会大爆发,在过去大模型是起点和障碍,而不是应用本身。LLaMA 2提供了跨越低成本跨越这种障碍的可能性。

普遍盈利(break-even)会来么?

在此前的系列文章中我多次总结:从商业角度看,人工智能过去10年的创业其实集体性失败了,因为没跑通任何一个像样的商业模式。而真自己做大模型的企业短期亏损会加剧,因为投入增加并且经常会被归零,而议价权并不会增加。

那现在看这会有什么变化么?

有点变化,但不是对做大模型的公司,而是对应用大模型的公司。

可以更低成本创造一种效力巨大的系统型超级应用,甚至可以简单用等于多少人来衡量其效果和商业价值。如果LLaMA 2继续再进展下去,那相当于这个超级应用总是可以用便宜却更强劲的引擎。

这时候整体成本可控了,周边的部分也需要投入,但不会像大模型研发那样导致投入产出高度失衡。

这时候效果明显了,过去的AI算法其实解决了一些不痛不痒的问题,不创造商业上的核心价值,做闸机和智能音箱能创造什么核心价值?但现在不一样,大模型在技术上的进展保证了,在用和不用上会导致大刀对坦克的差异。比如对企业而言谁能想象电脑、互联网全部都不用的企业?

更关键在于数据飞轮的Key看着是在做出系统型超级应用的企业手里,这导致上限会比较高。

琢磨事上马斯克首先是个商人,从xAI发布说起里我画了一张这样的图:

图片

(数据飞轮的三个阶段)

每一个大模型每个领域中最终追求的一定是把这个数据飞轮跑起来,但很遗憾的是到目前为止好像除了AlphaGo别的就没跑起来过。

可这不意味着未来也这样,谁在未来能把它先跑起来,谁就是那个领域的冠军,也就赢了。

现在产业链条上谁最可能把这个飞轮跑起来?

显然是成功落地系统型超级应用的人,他们才是拥有场景和用户的人。

若干年后,回看我们可能会认为LLaMA 2是一个类似2007年安卓发布的时刻。

小结

我个人前十年主要做系统,中间做了阵战略投资,后十年主要就做人工智能的产研,可能是这种背景的原因导致我越看大模型商业化的路径越觉得是系统型超级应用。希望对此感兴趣的同学和我联系,共同探讨如何在新技术要素下确立新的商业模式。确实,像DeepMind那哥们说的:不要扯图灵测试了,现在核心是看看能不能终结人工智能行业的十年亏损,这更关键些!

其它大模型相关文章,涉及团队组织等其它方面,标题有点热闹,内容不是:

chatGPT 和AlphaGo下围棋,谁赢?垂域大模型有戏么?

AI大模型没有商业模式?

从教育到就业,AI大模型到真产生影响还有多远

是时候摒弃黑暗森林式思维了,从瓦格纳反叛开始说

马斯克首先是个商人,从xAI发布说起

碳基中心 VS 硅基中心:把Vision Pro和便利蜂放一起比比

AI带来了巨大的机遇,未能善用AI的企业将面临衰退

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/7980.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【C++】开源:Linux端ALSA音频处理库

😏★,:.☆( ̄▽ ̄)/$:.★ 😏 这篇文章主要介绍Linux端ALSA音频处理库。 无专精则不能成,无涉猎则不能通。。——梁启超 欢迎来到我的博客,一起学习,共同进步。 喜欢的朋友可以关注一下&#xff0c…

Python增删改查小练习

目录 1. List操作-增加 2. List操作-查询 3. List操作-修改 4. List操作-删除 资料获取方法 1. List操作-增加 List Append(“xx”) 插入到列表尾部 Insert(x,xx) 在指定的位置插入 Extend 将列表的元素分开,插入到之前列表的尾部 小练习: 把一个字符串”abcdefg…

ssh打开远程vscode

如果想要远程打开其他终端的vscode,首先要知道远程终端的ip地址和用户名称以及用户密码 1、打开本地vscode 2、点击左下角蓝色区域 3、页面上部出现如下图,点击ssh,我这里已经连接,所以是connect to host 4、选择Add New SSH Host…

线程池几个核心参数说明

线程池几个核心参数 corePoolSize:核心线程数量大小。maximumPoolSize:线程池最大容纳线程数。keepAliveTime:线程空闲后的存活时长。TimeUnit:单位时间。BlockingQueue:缓存异步任务的队列。 ThreadFactory &#xff…

appium中toast识别

目录 一、什么是Toast? 二、环境前提 三、修改配置 四、安装驱动 五、常见报错及解决方案 1、cnpm 不识别,提示不是内部或外部命令 2、npm 也不识别 3、报错 六、代码节选 一、什么是Toast? Android中的Toast是一种简易的消息提示框…

比selenium体验更好的ui自动化测试工具: cypress介绍

话说 Cypress is a next generation front end testing tool built for the modern web. And Cypress can test anything that runs in a browser.Cypress consists of a free, open source, locally installed Test Runner and a Dashboard Service for recording your tests.…

AutoSAR系列讲解(实践篇)9.1-协议数据单元PDU

本章主要是讲解通信(不包括诊断和标定的纯通信),同样是主要以CAN来讲解。由于通信大家其实用的基本上是其最基础的功能,所以本章的实验主要就是教大家如何配置基础通信,但是高级一点的功能,博主也会在前面这几节给大家讲到,用不到的同学仅作了解就行。同样,忘了通信是怎…

day44-Spring_AOP

0目录 1.2.3 1.Spring_AOP 实体类: Mapper接口: Service和实现类: 测试1: 运行后: 测试2:无此型号时 测试3:库存不足时 解决方案1:事务声明管理器 测试&#xff1a…

Grub2基础上添加Windows引导和临时启动Windows

grub2临时启动Windows 在引导列表页按c进入Grub2终端 。 insmod part_gpt set root(hd0, 1) chainloader /efi/Microsoft/Boot/bootmgfw.efi bootinsmod part_gpt 导入模块,让grub可以看到gpt格式的硬盘(这个有没有必要我也不清楚,但执行…

WPF实战学习笔记06-设置待办事项界面

设置待办事项界面 创建待办待办事项集合并初始化 TodoViewModel: using Mytodo.Common.Models; using Prism.Commands; using Prism.Mvvm; using System; using System.Collections.Generic; using System.Collections.ObjectModel; using System.Linq; using Sy…

RocketMQ主从集群broker无法启动,日志报错

使用vmWare安装的centOS7.9虚拟机,RocketMQ5.1.3 在rocketMQ的bin目录里使用相对路径的方式启动broker,jps查询显示没有启动,日志报错如下 排查配置文件没有问题,nameServer也已经正常启动 更换绝对路径,启动broker&…

建造者设计模式go实现尝试

文章目录 前言代码结果总结 前言 本文章尝试使用go实现“建造者”。 代码 package mainimport ("fmt" )// 产品1。可以有不同的毫无相关的产品,这里只举一个 type Product1 struct {parts []string }// 产品1逻辑。打印组成产品的部分 func (p *Product…

MySQL之函数、视图、存储过程

MySQL视图、函数与存储过程 1. 函数 1.1 语法 -- 函数是需要有返回值的,只能返回一个值 CREATE FUNCTION funcation_name (param_name data_type [, param_name2 data_type]) RETURNS return_data_type DETERMINISTIC -- 可选项,用于执行函数对于相同入参&#x…

[ELK使用篇]:SpringCloud整合ELK服务

文章目录 一:前置准备-(参考之前博客):1.1:准备Elasticsearch和Kibana环境:1.1.1:地址:[https://blog.csdn.net/Abraxs/article/details/128517777](https://blog.csdn.net/Abraxs/article/details/1285177…

关于uni.createInnerAudioContext()的duration音频长度获取不到问题

关于uni.createInnerAudioContext()的duration音频长度获取不到问题 代码如下: onLoad() {let _this this//初始化语音播放对象this.audioObj uni.createInnerAudioContext();this.audioObj.src 音频链接;// 音频进入可以播放状态,但不保证后面可以流…

MySQL explain详解

文章目录 0 环境准备1 explain 之 id2 explain 之 select_type3 explain 之 table4 explain 之 type5 explain 之 key6 explain 之 rows7 explain 之 extra MySQL 的 EXPLAIN 是一个用于查询优化的关键字。它用于分析和评估查询语句的执行计划,帮助开发者理解查询语…

gerrit +git + windows 配置常见问题总结

Git 正常安装 配置 ssh-keygen 后,git clone 服务器代码报错 clone 报错1 no matching key exchange method found. Their offer: **diffie-hellman-group1-sha1**clone 报错2 no matching host key type found. Their offer: ssh-rsa解决方案 用户目录文件下.s…

尚硅谷大数据项目《在线教育之采集系统》笔记001

视频地址:尚硅谷大数据项目《在线教育之采集系统》_哔哩哔哩_bilibili 目录 P004 P006 P007 P009 P010 P017 P025 P026 P027 P028 P030 P004 将数据以图形图表的方式展示出来! P006 数据埋点 所谓埋点就是在应用中特定的流程收集一些信息&…

springboot 整合Caffeine项目中使用介绍

java接口的查询如何能提高性能&#xff0c;比每次都去数据库中查询要快的方案有了&#xff0c;就是下面要介绍的。 一、添加依赖 <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-cache</artifactId>…

(css)自定义登录弹窗页面

(css)自定义登录弹窗页面 效果&#xff1a; 代码&#xff1a; <!-- 登录弹窗 --> <el-dialog:visible.sync"dialogVisible"title"用户登录"width"25%"centerclass"custom-dialog":show-close"false":close-on-cli…