开源大模型LLaMA 2会扮演类似Android的角色么?

图片

在AI大模型没有商业模式?等文章中,我多次表达过这样一个观点:不要把大模型的未来应用方式比喻成公有云,大模型最终会是云端操作系统的核心(新通用计算平台),而它的落地形式会很像过去的沃森,以系统型超级应用的形态落地。假如真的这样,那无疑的就需要一个开源的、便宜的“安卓”来真正启动这种落地。没想到的是这还没过去一个月,LLaMA 2出现了,并且表现优异。那LLaMA 2会在AI行业里扮演移动互联网中安卓的角色么?(其它如chatGPT 和AlphaGo下围棋,谁赢?垂域大模型有戏么?等一系列与此有关的大模型文章参见个人公号:琢磨事

安卓与历史性时刻

整个移动互联网有两个至关重要的历史性时刻:一个是iPhone的发布,这伴随着乔布斯而载入史册;一个则是同年Android的发布,相比之下这个则有点默默无闻。但实际上对于移动互联网而言,后者的实际影响大于前者。每年全球手机销量里面15%左右为苹果手机,其它基本是安卓手机。

换句话说,没有安卓就没有移动互联网。

那安卓这类操作系统到底是什么?为什么这么关键?我们来简单科普下操作系统的概念。

图片

(操作系统最简示意图)

这个图不十分精确,Kernel(内核)那个位置通常还有非常复杂的各种模块,但好在它能清楚说明操作系统是什么。安卓就处于中间的Kernel那个位置,对上面的各种应用比如微信、抖音来讲,他们其实根本接触不到麦克风、摄像头、内存、网络等,所有对具体物理设备的使用都要通过安卓这样的系统。

这样的分工好处是什么呢?

降低开发和应用成本。在IT行业的早期没有上面的分工,通常都是一个公司(比如IBM)把所有事都干了。这就导致对人员要求非常高。纯粹从技术复杂度角度看开发一般终端应用的难度如果是1,那很多操作系统里模块的开发难度估计是10,并且两者的难度不在一个维度上。同时操作系统只有1个,但应用会有无数个(安卓--应用商店)。所以就需要一种更为高效的分工方式,于是行业再分工,操作系统出现了。

高效的分工体系才能导致整个生态的大发展,对于移动互联网安卓就是生态大发展的最关键支点。如果微信团队需要自己做安卓,那很可能我们就看不见微信了。

如果说技术意义上的操作系统是上面那张简图,那商业意义上的操作系统则是一个引擎,为所有应用提供动力,缩减它们的开发成本、缩短周期。

大模型扮演的就是这个角色,但如果它只有一个(chatGPT),并且只是OpenAI自己用,那就像只有iOS一样,根本就造不出来五花八门的手机,也就不会有移动互联网的真正启动。

过去基于chatGPT根本没法打造沃森这样的系统,各种数据风险的考量根本不是一个技术进步就能对冲掉的,谁愿意把数据都上传到OpenAI呢,谁愿意依赖一个完全不知道的黑盒呢!

但在过去别的大模型又太差了,LLaMA 2在改变这种局面,从评测看它基本赶上GPT3.5,,也就是说在创造价值的维度它变的能用了,在落地的维度又因为开源而能对冲风险上的顾虑。再发展下去就真的会变成一个新智能生态的引擎,类似安卓的角色。

在前面系列文章里面也曾经多次提到我们普遍的看待大模型的方式是有问题的。如果就看到技术和能力,而看不到它的落地需要一套复杂系统做支撑,那就搞不清它的真正价值创造方式,就会争论是屁胡还是什么,但其实并不对。

人工智能应用会大爆发么?

如果评测结果无误,那现在就需要开始在不同的领域打造一个个类似沃森的系统。否则可能就晚了。

大模型很关键,提供了打造智能型应用的机会,但就像移动互联网上真正有价值的是微信而不是一个裸的安卓一样,大模型也需要在它上面长出自己的应用。用系统的思维模式很容易看到这类系统型超级应用的关键点。我们换一张图来对此进行说明。

图片

(Alexa基础架构,本质和安卓一样)

上图是亚马逊Alexa的基础架构图,为什么用它呢,因为Alexa是现在为止最像云端操作系统的一个产品。

实际上OpenAI的插件骨子里也是这模式。可以这么讲从大模型的角度看OpenAI的远胜,这种智能的进步大幅缩减应用(上图中的Alexa Skills Kit)的开发成本,但从系统完备性的角度看OpenAI还有很长一段路要走,比如对大规模设备的介入和管控等。

基于这种架构图很容易看出基于大模型的超级应用的关键点:

大模型:会处于中间的部分,负责提供通用智能的能力。也要与其它各类算法相配合,比如感知类算法、推荐类算法等。上图中针对交互做了一点分解,分成:语音识别(ASR)和自然语言理解,后者会完全被大模型取代,但不会改变架构。

AIoT基础设施:为了支撑大模型跑好并且和另外几部分连接起来,AIoT用的东西一个也缺不了,包括大规模设备管理通讯等。这些部分加起来才是过去系统的Kernel,也就是安卓所扮演的角色(上图中间的部分)。

用户侧(上图右侧):要提供充分感知,这种感知要有时间维度和空间维度,要有现场和历史数据。我们和智能音箱进行交互的时候,先要喊一嗓子,比如小爱同学等,它要听不到不管后面大模型多厉害也是不行。然后交互的时候肯定需要这个人的建模数据(历史)以及位置等,然后才能做好内容输出。不同场景下这部分会有比较大差别,比如沃森的场景可能就需要个人的24小时心电图、病史以及基因数据。这些部分非常关键,需要综合应用IoT和各种算法才能达成目标。大模型在这个环节扮演的角色没那么关键。

应用侧(上图左侧):智能音箱的场景就需要对接各种数据源(chatGPT的插件就干这事的),总不能天气也靠大模型来生成吧。对于沃森类系统这里就需要行业数据和法规等。

相比于过去应用侧在变薄,但问题是三个部分整个加一起才是智能云系统下的应用,非要类比的话这种新应用的创建有点像需要打造一个个属于特殊领域的手机。

有无数个领域需要这种系统型超级应用,医疗、教育、税务、企业、零售、军事、家居等,很久以前DeepMind甚至还尝试过给Google数据中心做个这样的应用来管空调。

人工智能应用确实会大爆发,在过去大模型是起点和障碍,而不是应用本身。LLaMA 2提供了跨越低成本跨越这种障碍的可能性。

普遍盈利(break-even)会来么?

在此前的系列文章中我多次总结:从商业角度看,人工智能过去10年的创业其实集体性失败了,因为没跑通任何一个像样的商业模式。而真自己做大模型的企业短期亏损会加剧,因为投入增加并且经常会被归零,而议价权并不会增加。

那现在看这会有什么变化么?

有点变化,但不是对做大模型的公司,而是对应用大模型的公司。

可以更低成本创造一种效力巨大的系统型超级应用,甚至可以简单用等于多少人来衡量其效果和商业价值。如果LLaMA 2继续再进展下去,那相当于这个超级应用总是可以用便宜却更强劲的引擎。

这时候整体成本可控了,周边的部分也需要投入,但不会像大模型研发那样导致投入产出高度失衡。

这时候效果明显了,过去的AI算法其实解决了一些不痛不痒的问题,不创造商业上的核心价值,做闸机和智能音箱能创造什么核心价值?但现在不一样,大模型在技术上的进展保证了,在用和不用上会导致大刀对坦克的差异。比如对企业而言谁能想象电脑、互联网全部都不用的企业?

更关键在于数据飞轮的Key看着是在做出系统型超级应用的企业手里,这导致上限会比较高。

琢磨事上马斯克首先是个商人,从xAI发布说起里我画了一张这样的图:

图片

(数据飞轮的三个阶段)

每一个大模型每个领域中最终追求的一定是把这个数据飞轮跑起来,但很遗憾的是到目前为止好像除了AlphaGo别的就没跑起来过。

可这不意味着未来也这样,谁在未来能把它先跑起来,谁就是那个领域的冠军,也就赢了。

现在产业链条上谁最可能把这个飞轮跑起来?

显然是成功落地系统型超级应用的人,他们才是拥有场景和用户的人。

若干年后,回看我们可能会认为LLaMA 2是一个类似2007年安卓发布的时刻。

小结

我个人前十年主要做系统,中间做了阵战略投资,后十年主要就做人工智能的产研,可能是这种背景的原因导致我越看大模型商业化的路径越觉得是系统型超级应用。希望对此感兴趣的同学和我联系,共同探讨如何在新技术要素下确立新的商业模式。确实,像DeepMind那哥们说的:不要扯图灵测试了,现在核心是看看能不能终结人工智能行业的十年亏损,这更关键些!

其它大模型相关文章,涉及团队组织等其它方面,标题有点热闹,内容不是:

chatGPT 和AlphaGo下围棋,谁赢?垂域大模型有戏么?

AI大模型没有商业模式?

从教育到就业,AI大模型到真产生影响还有多远

是时候摒弃黑暗森林式思维了,从瓦格纳反叛开始说

马斯克首先是个商人,从xAI发布说起

碳基中心 VS 硅基中心:把Vision Pro和便利蜂放一起比比

AI带来了巨大的机遇,未能善用AI的企业将面临衰退

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/7980.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【C++】开源:Linux端ALSA音频处理库

😏★,:.☆( ̄▽ ̄)/$:.★ 😏 这篇文章主要介绍Linux端ALSA音频处理库。 无专精则不能成,无涉猎则不能通。。——梁启超 欢迎来到我的博客,一起学习,共同进步。 喜欢的朋友可以关注一下&#xff0c…

Python增删改查小练习

目录 1. List操作-增加 2. List操作-查询 3. List操作-修改 4. List操作-删除 资料获取方法 1. List操作-增加 List Append(“xx”) 插入到列表尾部 Insert(x,xx) 在指定的位置插入 Extend 将列表的元素分开,插入到之前列表的尾部 小练习: 把一个字符串”abcdefg…

ssh打开远程vscode

如果想要远程打开其他终端的vscode,首先要知道远程终端的ip地址和用户名称以及用户密码 1、打开本地vscode 2、点击左下角蓝色区域 3、页面上部出现如下图,点击ssh,我这里已经连接,所以是connect to host 4、选择Add New SSH Host…

appium中toast识别

目录 一、什么是Toast? 二、环境前提 三、修改配置 四、安装驱动 五、常见报错及解决方案 1、cnpm 不识别,提示不是内部或外部命令 2、npm 也不识别 3、报错 六、代码节选 一、什么是Toast? Android中的Toast是一种简易的消息提示框…

比selenium体验更好的ui自动化测试工具: cypress介绍

话说 Cypress is a next generation front end testing tool built for the modern web. And Cypress can test anything that runs in a browser.Cypress consists of a free, open source, locally installed Test Runner and a Dashboard Service for recording your tests.…

day44-Spring_AOP

0目录 1.2.3 1.Spring_AOP 实体类: Mapper接口: Service和实现类: 测试1: 运行后: 测试2:无此型号时 测试3:库存不足时 解决方案1:事务声明管理器 测试&#xff1a…

RocketMQ主从集群broker无法启动,日志报错

使用vmWare安装的centOS7.9虚拟机,RocketMQ5.1.3 在rocketMQ的bin目录里使用相对路径的方式启动broker,jps查询显示没有启动,日志报错如下 排查配置文件没有问题,nameServer也已经正常启动 更换绝对路径,启动broker&…

[ELK使用篇]:SpringCloud整合ELK服务

文章目录 一:前置准备-(参考之前博客):1.1:准备Elasticsearch和Kibana环境:1.1.1:地址:[https://blog.csdn.net/Abraxs/article/details/128517777](https://blog.csdn.net/Abraxs/article/details/1285177…

MySQL explain详解

文章目录 0 环境准备1 explain 之 id2 explain 之 select_type3 explain 之 table4 explain 之 type5 explain 之 key6 explain 之 rows7 explain 之 extra MySQL 的 EXPLAIN 是一个用于查询优化的关键字。它用于分析和评估查询语句的执行计划,帮助开发者理解查询语…

尚硅谷大数据项目《在线教育之采集系统》笔记001

视频地址:尚硅谷大数据项目《在线教育之采集系统》_哔哩哔哩_bilibili 目录 P004 P006 P007 P009 P010 P017 P025 P026 P027 P028 P030 P004 将数据以图形图表的方式展示出来! P006 数据埋点 所谓埋点就是在应用中特定的流程收集一些信息&…

(css)自定义登录弹窗页面

(css)自定义登录弹窗页面 效果&#xff1a; 代码&#xff1a; <!-- 登录弹窗 --> <el-dialog:visible.sync"dialogVisible"title"用户登录"width"25%"centerclass"custom-dialog":show-close"false":close-on-cli…

【NLP】温和解读:transformer的核心思想

变压器模型及其关键组件的概述。 一、介绍 在这篇博文中&#xff0c;我将讨论本世纪最具革命性的论文“注意力是你所需要的一切”&#xff08;Vaswani et al.&#xff09;。首先&#xff0c;我将介绍自我注意机制&#xff0c;然后介绍变形金刚的架构细节。在之前的博客文章《从…

基于C#的无边框窗体动画效果的完美解决方案 - 开源研究系列文章

最近在整理和编写基于C#的WinForm应用程序&#xff0c;然后碰到一个其他读者也可能碰到的问题&#xff0c;就是C#的Borderless无边框窗体的动画效果问题。 在Visual Studio 2022里&#xff0c;C#的WinForm程序提供了Borderless无边框窗体的样式效果&#xff0c;但是它没提供在无…

区间预测 | MATLAB实现基于QRF随机森林分位数回归多变量时间序列区间预测模型

区间预测 | MATLAB实现基于QRF随机森林分位数回归多变量时间序列区间预测模型 目录 区间预测 | MATLAB实现基于QRF随机森林分位数回归多变量时间序列区间预测模型效果一览基本介绍程序设计参考资料 效果一览 基本介绍 1.Matlab实现基于QRF随机森林分位数回归多变量时间序列区间…

Visual Studio Code Python 扩展中的包管理

排版&#xff1a;Alan Wang Python 凭借其简单的语法和强大的库&#xff0c;目前已成为最流行的编程语言之一&#xff0c;也是最适合那些刚接触编程的人们的语言。但是&#xff0c;随着项目复杂性和规模的增长&#xff0c;管理依赖项的复杂性也会增加。当新用户不断承接更成熟的…

数分面试题-SQL常见面试题型1

目录标题 1、连续时间问题1.1 最近一周内的活跃天数1.2 每个用户一周内最大连续活跃天数1.3 计算截至当前&#xff0c;每个用户已经连续签到的天数 2、时间间隔问题举例3、sql窗口分析函数3.1 有一个日志登陆列表&#xff0c;获取用户在某个页面停留时长3.2 寻找至少连续出现3次…

【Docker】Docker容器编排

目录 一、Docker Compose1.2Docker Compose 环境安装1.3 YAML 文件格式及编写注意事项2.3 Docker Compose配置常用字段2.4 Docker Compose 常用命令 二、Docker Compose实验2.1编写Nginx的Dockerfile脚本2.2编写MySQL&#xff0c;Dockerfile脚本2.3编写PHP&#xff0c;Dockerfi…

K8S中网络如何通信

Kubernetes 提出了一个自己的网络模型“IP-per-pod”&#xff0c;能够很好地适应集群系统的网络需求&#xff0c;它有下面的这 4 点基本假设&#xff1a; 集群里的每个 Pod 都会有唯一的一个 IP 地址。Pod 里的所有容器共享这个 IP 地址。集群里的所有 Pod 都属于同一个网段。…

STM32MP157驱动开发——按键驱动(POLL 机制)

文章目录 “POLL ”机制&#xff1a;APP执行过程驱动使用的函数应用使用的函数pollfd结构体poll函数事件类型实现原理 poll方式的按键驱动程序(stm32mp157)gpio_key_drv.cbutton_test.cMakefile修改设备树文件编译测试 “POLL ”机制&#xff1a; 使用休眠-唤醒的方式等待某个…

MySQL主从复制、读写分离

目录 一、MySQL的复制类型 二、MySQL主从复制工作流程 三、MySQL的同步方式 1、异步复制&#xff08;Async Replication&#xff09; 2、同步复制&#xff08;sync Replication&#xff09; 3、半同步复制&#xff08;Async Replication&#xff09; 四、MySQL应用场景 …