大模型火了一年半,AI还在「钻木取火」?

图片

伴随着AI大模型的新一轮进化,这个夏天,人工智能正在引领一波新的热潮。

美国当地时间6月18日,AI大模型的主要显卡芯片供应商英伟达收涨3.51%,市值升至3.34万亿美元,一度超越微软和苹果等科技巨头,成为全球市值最高的上市企业。从2022年11月末ChatGPT发布算起,英伟达市值已上涨9倍以上。

5月至今两个月以来,围绕AI大模型,一个月内十几场发布会,每一场都极具科技含量:国际市场,AI2.0时代的开创者OpenAI公司公布了ChatGPT-4o,AI大模型概念的提出者谷歌,以及微软、Facebook母公司Meta,都有新发布;6月11日,苹果推出Apple Intelligence,其缩写还恰好与AI一模一样。在中国,从腾讯、阿里巴巴到字节跳动,也进行了新发布。

这十几场发布会,每一场都极具科技含量。梦幻的场景,激昂的演讲,全世界的倾听。

然而,人们兴奋着,也失望着。

兴奋的是,重要性堪比电的发明,对人类影响可能比互联网、移动互联网更大的AI,依然在进化、突破,快速接近着人类智能。失望的是,被寄予厚望的AI大模型离期望值依然较远,其应用水平仍在人类初级助手里打转。

或许,是时候冷静盘点一下AI大模型了。

作为经常用来与AI类比的互联网和移动互联网,起码应该具备三个特点:一是拥有海量的大众用户,二是在企业端、政府端被广泛应用,三是成为社会基础设施并带来极大的经济效率提升。更直观地看,互联网、移动互联网都催生了经济新形态,产生了微软、谷歌、亚马逊、苹果、腾讯、阿里巴巴、百度和华为等现象级科技企业,数十亿的现代人接受着这些科技巨头的服务。

从以上三个角度看,从2022年11月30日ChatGPT发布至今,AI大模型在爆火并持续进化一年半之后,其应用水平或者说被接受程度远未达预期,只能说还在发展初期。最为用户接受的ChatGPT,其日活量在尝鲜期过后,下降较快。业内公认的是,迄今为止,没有任何一款AI大模型的应用或产品的使用能达到流行的移动应用水平。

图片

有悲观的业界声音开始发出,代表着AI2.0时代开启的AI大模型,或许依然不会带来真正的AI爆发,这有可能就像十多年前计算机视觉潮(同为AI技术潮)一样,潮来,也将潮去。要迎来比肩互联网和移动互联网的AI爆发,人类或许还需要等待更多时间。

近日,蚂蚁集团 CTO 何征宇的“钻木取火”观点在业内广为流传。他在蚂蚁技术日上公开表示:AI发展目前还处于钻木取火阶段,尽管我们能够利用AI技术,但还没有找到最高效办法,仍然没有找到AI的本质。

这并非危言耸听,事实上,创造了AI大模型Transformer架构的谷歌,其CEO桑达尔·皮查伊近日受访时也表示:AI浪潮仍处于早期阶段。在本轮AI热潮中再次创业的李开复也表示“感觉AI发展仍处早期”。

当然,更多AI领域专家认为,即使AI大模型不是AI爆发的终级形态,但它带来的数字化浪潮和潜力,依然具有想象力。

“AI对于人类来说,一定是和人类发明了电一样的级别。AI大模型,一年前我曾认为它拥有和互联网、移动互联网一样的级别,现在觉得当时有些乐观了。但是,AI大模型依然代表迄今AI技术发展的最高点,只不过我们需要回归理性去看待它。让大模型做它能做到的,让它进步化得更智能、更有用,它依然具有很大的空间。”第四范式总裁胡时伟的话,具有代表性。

图片

杀手级AI爆款应用并没有出现

全世界一直在思考,互联网、移动互联网之后,下一个对人类产生划时代影响的技术是什么?大数据、云计算、区块链、元宇宙、人工智能AI都曾在候选名单之中。AI就是近年的新晋胜者,几乎获得科技界一致认同。

“我认为,人类未来回望历史,AI技术的地位一定是超过互联网和移动互联网的。互联网没有智能,AI可以产生类似人的智能这一点已经被确认,因此它为人类带来变革的想像空间更大。”这是一位资深行业研究者的话,在《凤凰周刊》记者的采访中,被其他受访对象广泛认同。

在深入讨论AI之前,可以略回顾一下互联网和移动互联网给人类带来的改变。

互联网和计算机一起,给人类带来了第三次工业革命即信息革命。互联网诞生至今50多年,几乎完成了全世界普及,给全球绝大部分个人、企业和政府机关的生活、生产和运行,带来了几何级别的便利。以微软为代表的大量专业软件系统供应商崛起,谷歌、亚马逊等搜索类、电商类企业崛起。

将移动通信和互联网二者结合起来的移动互联网,在2010年前后与智能手机结合,迎来爆发。在不到10年的时间内,移动互联网对全球大部分个人完成覆盖,大量企业和政府端为完成To C服务,进行了移动互联网变革。在中国,大部分60岁以上老人近年也成为智能手机用户。

全球范围内,崛起于互联网时期的科技企业,几乎全部利用移互技术进行升级,新出现了Facebook、YouTube、微信、抖音、淘宝等10亿级用户移动应用。移动互联网还催生了移动支付、共享经济、数字政务等,初步带来便捷的数字生活、生产方式。

图片

AI技术的提出时间在1956年,甚至比互联网诞生的1969年都要早13年。长期以来,AI都是一门被认为重要但难得其法去使用的技术。

2013年至2017年,第一轮AI技术热潮——计算机视觉热潮掀起。在这轮热潮中,2016年,谷歌的AlphaGo成为第一个战胜围棋世界冠军的人工智能机器人,我国的“AI四小龙”——依图、商汤、云从、旷视诞生。但该轮热潮最终未能带来AI的爆发,大量资本投资失利,大量创业者艰难维持。

2022年11月30日,ChatGPT横空出世,基于Transformer架构的AI大模型自此被捧为AI技术的新未来。

人类通过20余年的继承式学习,才能具有一项或多项专有技能,胜任生活中各种角色,而人工智能则通过数月甚至更短时间的数据训练,拥有比人高得多的技能甚至是智能。

ChatGPT引发的震憾则是全方位的,机器通过类似人的神经网络一样的学习方式,将所见、所听、所看结合既有数据、记忆,在瞬间进行成千上万的并行计算,再以文本、图表、语音、视频等方式表达出来。似乎,人之所以为人的知、情、意,人工智能除了情、意之外,在认知的数量方面超过和辗压人类,质量方面正无限接近人,甚至是超过多数人。

至今,全球大多数科技企业均涉足AI大模型发展和训练,作为科技领先国家的美国和中国,更是各自诞生数百个大模型。这被形象地称为“百模大战”,甚至“千模大战”。

大量的资本冲向AI领域,席卷全球的AI热潮再次涌起。一年半的喧闹之后,人们暮然回首,与投资端的喧闹相比,市场对AI大模型的热情,还远远不及互联网、移动互联网。

除了训练AI大模型需要巨量GPU芯片,因此将芯片企业英伟达一度送上全美市值第一宝座外,这轮热潮下还没有诞生新的科技巨头。全球最好的AI大模型ChatGPT的日活至今只有数千万,国内大模型应用虽然均呈现向好态势,但C端日活和B端尝鲜者数量均不理想。

至今,全行业都在追问:杀手级、现象级或者说爆款AI应用,何时会出现?简单的问题,直击灵魂。业内回答,乐观者说1年内,中观者说2至3年,悲观者说“无法预计”。

6月13日,北京智源人工智能研究院院长王仲远接受媒体群访时说,回顾移动互联网时代或更早期的技术革命,每次新技术的出现都需要一定的周期,包括技术能力的提升、成本的降低以及硬件的支持。当这些条件具备时,能够解决真实用户需求的C端爆款应用才会出现。“因此,对于C端爆款应用,我们还需保持一定的耐心。未来,我们可能会先从B端看到非常好用的工具,然后C端应用会逐步出现。”

图片

AI大模型峥嵘初显

尽管可以说AI至今还不能与互联网、移动互联网的技术地位类比,但谁也没法否认AI大模型带来的数字化潜力。“人工智能+”的时代,确实是到来了。

市场研究机构Gartner分析师张桐告诉《凤凰周刊》:“近期的AI领域一系列发布,还是带来了一些惊喜。一是在多模态方面进步巨大,OpenAI、谷歌、微软的最新发布,均强调了处理图像、语音的多模态能力,这与之前主要在文本处理方面的进步,有显著区别,十分关键。二是中国各家企业的AI大模型发布,显示的技术进步程度表明中国没有被美国明显拉开。”他特意提到了美国斯坦福大学AI团队被证实套壳抄袭国内清华与面壁智能团队的AI大模型。

从中国老百姓的角度,也可以从多个方面感受到AI大模型的扑面春风。

首先,我们熟悉的各类应用APP,正在被AI入驻甚至“爆改”。百度搜索关键词的结果,第一条不再是互联网广告或百度词条,而是文心一言大模型给出的智能回答。微信也嵌入了元宝小程序,用户可以进行AI搜索、文档总结、AI作图等应用。淘宝的“淘宝问问”可以用语言方式与用户交互并推荐商品。金融应用支付宝,只要下拉首页,就可以领取并使用AI金融助理、生活助理。

多位业内人士认为,虽然将AI大模型应用于传统APP只是大模型比较简单的初步应用,但这种趋势将继续,并且逐步向深度应用发展。这对公众直观认识AI大模型还是较为有用。

第二个变化是AI大模型正成为人们的工作和生活助手。文本能力方面,AI大模型能力进化最大,已达到上下文数百万至1000万汉字的水平。因此,多数大模型应对文本、文档、书籍的要点总结,简单文章生成和PPT制作等,已显得轻松。音频转文本、视频生成等多模态能力,已让短视频创作的效率明显提高。

第三个变化是AI大模型开始入驻手机。6月11日,苹果2024年全球开发者大会宣布苹果智能(Apple Intelligence)系统适用于iPhone、iPad和Mac等操作系统。会后产生了民间新梗“Siri终于成了人工智能,不再是人工智障了”。苹果AI发布,使世界大致感知到了AI大模型手机的雏形,AI获得类操作系统的权限,可以跨APP调用、统合信息,包括通讯录等隐私信息,最终可以告知你“我太太的航班几点降落”。

图片

瑞银近期的一项预测是,生成式AI智能手机将从2023年的5000万部稳步增长,至2027年将达到5.83亿部,且到2027年收入或达5130亿美元。

下一步AI大模型场景或是汽车。4月,一年一度的北京车展举行,展会的最大亮点并不是117款新车型全球首发,而是AI大模型“上车”。据不完全统计,已有20家左右的汽车品牌宣布AI大模型正式“上车”。

未来,AI上车后大致的场景是:司机可以用自然语言与汽车进行交互,如“打开一半的右边窗户”“空调开到23度”,还可以问“现在堵车的原因是什么”。当然,也要预防坏人提出的“打开车门”要求。

图片

千行百业尝鲜AI大模型

今年4月初,阿里巴巴宣布入职一位“AI员工”——程序员通义灵码,其将担任阿里云代码助理,它具备扎实编程基础和200多种编程语言技能,可优化代码、生成测试框架和用例,提高工作效率。它也背了阿里的KPI:未来20%阿里云代码将由其编写。

事实上,AI员工现象,已是全球科技企业常态。高度规则化的程序编写,正是AI大模型最擅长的工作之一。

图片

〓 通义成为阿里云001号AI员工 图/阿里云官微

AI客服是当前行业公认的最适合落地AI大模型的领域。近年第一代智能客服是生活中的槽点,相声、小品、脱口秀中诞生了大量的梗,我们不少人也对其狂喊过“请转人工”。AI大模型加持的智能客服显然会更加智慧,在猜你想问、推你所推方面会更加精准。

值得一提的是,随着数字经济的推进,发达国家、地区以及我国近年的各行各业均在主动或被动地推进数字化进程。AI大模型的出现,客观上对这一进程起着巨大助力作用。例如,阿里巴巴官方资料显示,其大模型已经在汽车、航空、天文、矿业、教育、医疗等行业落地,解决各行各业实际面临的具体问题。例如,在重工业领域,一汽集团联合阿里云打造了汽车行业首个大模型BI应用——GPT-X,通过智能化数据治理和商业分析能力,助力一汽提升决策效率。

王仲远认为,2023年之后,人工智能逐步进入通用人工智能时代,其最大的特点是泛化性、通用性和跨领域的特性,这将影响所有行业。一些行业受到的影响会更快,比如大模型在生成摘要方面效果非常好,因此对所有与文书相关的工作、文案处理等效率提升作用显著。再比如,当前的文生图、文生视频技术,虽然还处于早期阶段,但都是提升效率的工具。“只要与这些能力相关,各行各业都会受益,并且未来会不断出现好用的工具。”

业内专家同时普遍认为,目前AI大模型在大量行业的应用,还处于初级阶段,还不够智能。“可以起到一些效率提升作用,是智能助手,但带来革命性变化,还谈不上。”张桐说。

图片

AI爆发或需更多等待

业内的一个共识是,从各方面看,AI技术可能已经接近首次爆发。但无法排除的可能是,AI也有可能需要一个更长的周期才能迎来爆发。

无论如何,有几个现实是AI大模型当前发展不容回避的。

首先,AI大模型十分烧芯片、烧数据,甚至烧电力。每一个大模型动辄需要上万块英伟达GPU,每块价值1万至1.5万美元以上。每次训练还需要规模达百亿、千亿级TOKEN的数据物料,无论英文数据物料还是中文数据物料,现有物料都难以接续。

很难想象,大模型的耗电量会成为能源专家的最新关注点。训练Open AI的GPT-3模型耗电量相当于120个美国家庭一年的用电量。在这背后,大模型的CPU(中央处理器)和GPU(图形处理器)等硬件在执行复杂计算时会消耗大量电力,同时大模型所需巨大内存带来的读写操作,同样需要电力。“这样集中、持续、稳定供应电力的地方并不好找,在这方面,中国的电力基础设施将比美国更容易支持本国的AI大模型发展。”张桐说。

相比动辄数十亿级别的投入,AI大模型带来的收入还十分有限,甚至暂时可以忽略。

图片

其次,AI大模型还有“硬伤”,即不够靠谱的问题仍然没有解决。虽然大部分时候,AI大模型的推理和判断结果令人欣喜,但时而“一本正经地胡说八道”还是会出现。目前任何大模型都不能幸免。在生活中,AI大模型的错误我们可以容忍,可以一笑置之,但这却关乎大模型商用的前途,例如金融系统和制造业的容错空间就极小。

再次,AI大模型目前的使用门槛还比较高。除了核心功能价格不够普惠外,内行与外行的使用效果差别明显。大多数模型的使用需要进行专门培训。而一个改变人类的基础技术,最终一定是像互联网一样低门槛的。

“AI技术已发展了30年,现在说它还处于钻木取火阶段可能有些夸张,但它仍然处于技术早期这不可否认。”一位大厂的AI专家表示。

科学技术发展带有不可确定性,没有人是先知。或许,AI爆发只差临门一脚。又或许,AI大模型并不是AI爆发的最终解。那么,我们可能需要继续等待。

如何学习AI大模型?

作为一名热心肠的互联网老兵,我决定把宝贵的AI知识分享给大家。 至于能学习到多少就看你的学习毅力和能力了 。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

一、全套AGI大模型学习路线

AI大模型时代的学习之旅:从基础到前沿,掌握人工智能的核心技能!

img

二、640套AI大模型报告合集

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。

img

三、AI大模型经典PDF籍

随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。

img

四、AI大模型商业化落地方案

img

作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/35777.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ElasticSearch中的BM25算法实现原理及应用分析

文章目录 一、引言二、BM25算法实现原理BM25算法的实现原理1. 词频(TF):2. 逆文档频率(IDF):3. 长度归一化:4. BM25评分公式: BM25算法示例 三、BM25算法在ElasticSearch中的应用分析…

在 Java 中的使用Selenium 测试框架

Selenium 测试框架:在 Java 中的使用 Selenium 测试框架就是这样一个强大的工具,它为 Web 应用的自动化测试提供了全面且高效的解决方案。 一、Selenium 简介 Selenium 是一个开源的自动化测试工具集,专门用于测试 Web 应用程序。它支持多…

数据结构:队列详解 c++信息学奥赛基础知识讲解

目录 一、队列概念 二、队列容器 三、队列操作 四、代码实操 五、队列遍历 六、案例实操 题目描述: 输入格式: 输出格式: 输入样例: 输出样例: 详细代码: 一、队列概念 队列是一种特殊的线性…

【单片机毕业设计选题24032】-基于STM32的电瓶车电池检测系统

系统功能: 系统上电后显示“欢迎使用电池检测系统请稍后”后两秒后正常显示界面 第一页面第一行显示“系统状态信息” 第二行显示获取到的电压值 第三行显示获取到的电流值 第四行显示获取到的温度和剩余电量值 短按B4按键可切换到第二页面 第二页面第一行显示“温度阈值…

2020年全国大学生数学建模竞赛C题中小微企业信贷决策(含word论文和源代码资源)

文章目录 一、部分题目二、部分论文三、部分源代码(一)数据处理代码(二)熵权法与TOPSIS代码(三)最小二乘法代码(四)粒子群代码 四、完整word版论文和源代码(两种获取方式…

Nest 的 IoC 机制

后端系统中,会有很多对象: Controller 对象:接收 http 请求,调用 Service,返回响应 Service 对象:实现业务逻辑 Repository 对象:实现对数据库的增删改查 此外,还有数据库链接对…

内外网文件流转场景日益复杂,看麒麟信安如何构筑安全防线?

随着信息化快速发展,数据已成为企业核心资产,根据信息安全分级保护和等级保护的相关要求,诸多单位都采取了内外网隔离措施以确保信息安全。但在管理内外部数据流通时,用户单位在集中加密存储、文件流转管理机制、外带文件审批管理…

AI原力觉醒:华硕NUC组团出道,快来Pick属于你的NUC

NUC 家族组团出道,全新的计算体验,重新定义桌面设备。AI加持下,谁最适合你? 颜值担当 NUC 14 Pro 居家必备单品 适用于广大消费者的NUC 14 Pro,不仅颜值在线,更多方位考虑您的日常所需,工作娱…

2024/6/28 英语每日一段

The Supreme Court on Thursday rejected a challenge to an obscure provision of President Donald Trump’s 2017 tax package, ending a lawsuit that many experts feared could destabilize the nation’s tax system. In a divided decision, the court upheld a one-ti…

基于SpringBoot养老院管理系统设计和实现(源码+LW+调试文档+讲解等)

💗博主介绍:✌全网粉丝10W,CSDN作者、博客专家、全栈领域优质创作者,博客之星、平台优质作者、专注于Java、小程序技术领域和毕业项目实战✌💗 🌟文末获取源码数据库🌟感兴趣的可以先收藏起来,还…

Java网络编程(JavaWeb的基础)

Java网络编程(JavaWeb的基础) 文章目录 Java网络编程(JavaWeb的基础)前言一、网络编程概述1.1 软件架构&网络基础1.2 网络通信要素:IP/端口/通信协议1.3 传输层协议:tcp/udp 二、网络编程API2.1 InetAddress类2.2 Socket类&am…

控制台扫雷(C语言实现)

目录 博文目的实现思路项目创建文件解释 具体实现判断玩家进行游戏还是退出扫雷棋盘的确定地图初始化埋雷玩家扫雷的实现雷判断函数 源码game.cgame.h扫雷.c 博文目的 相信不少人都学习了c语言的函数,循环,分支那我们就可以写一个控制台的扫雷小游戏来检…

中小企业进行数字化转型会面临哪些挑战?

在当今这个信息化、数字化的时代,中小企业进行数字化转型已不再是选择,而是必然。然而,这条转型之路并非坦途,它充满了未知与挑战。今天,我们就来探讨一下中小企业为社么要进行数字化转型以及在数字化转型过程中可能遇…

1983springboot VUE兼职招聘管理系统开发mysql数据库web结构java编程计算机网页源码maven项目

一、源码特点 springboot VUE兼职招聘管理系统是一套完善的完整信息管理类型系统,结合springboot框架和VUE完成本系统,对理解JSP java编程开发语言有帮助系统采用springboot框架(MVC模式开发),系统具有完整的源代码和…

重磅!免费一键批量混剪工具它来了,一天上万短视频不是梦

很多做短视频营销的朋友需要批量生成大量的短视频,但是市面上的工具一是不好用,二是要收费。 今天给大家介绍一款免费的,可以自动化批量生成短视频的工具MoneyPrinterPlus。 同时支持windows和linux平台。 有了它,一天生成上万短…

从零创建深度学习张量库,支持gpu并行与自动微分

多年来,我一直在使用 PyTorch 构建和训练深度学习模型。尽管我已经学会了它的语法和规则,但总有一些东西激起了我的好奇心:这些操作内部发生了什么?这一切是如何运作的? 如果你已经到这里,你可能也有同样的…

Linux 的启动流程

第一步、加载内核 操作系统接管硬件以后,首先读入 /boot 目录下的内核文件。 以我的电脑为例,/boot 目录下面大概是这样一些文件: $ ls /bootconfig-3.2.0-3-amd64config-3.2.0-4-amd64grubinitrd.img-3.2.0-3-amd64initrd.img-3.2.0-4-amd6…

云效BizDevOps上手亲测

云效BizDevOps上手亲测 什么是云效项目协作Projex配置2023业务空间原始诉求字段原始诉求工作流创建原始诉求配置2023产品空间创建主题业务原始诉求关联主题配置2023研发空间新建需求需求关联主题 与传统区别云效开发流程传统开发流程云效BizDevOps 操作体验 什么是云效 在说到…

【vue3】【vant】 移动本草纲目案例发布收藏项目源码

更多项目点击👆👆👆完整项目成品专栏 【vue3】【vant】 移动本草纲目案例发布收藏项目源码 获取源码方式项目说明:其中功能包括 项目包含:项目运行环境文件截图 获取源码方式 加Q群:632562109项目说明&am…

揭秘搜索引擎核心机制:网页爬行、索引、预处理、建立索引、查询处理与结果排序策略的深入解读

搜索引擎的工作原理与流程是一个复杂而精细的系统工程,旨在帮助用户从互联网的海量信息中快速找到最相关、最有价值的内容。 理解搜索引擎工作原理对于内容创作、网站优化、广告投放及日常搜索至关重要。它能指导网页设计更加友好,提高搜索引擎排名&…