科技云报道:走出“实验室”,GenAI迎来关键拐点

科技云报道原创。

对传统产业来说,GenAI是一场“哥白尼式的革命”,它改变了传统的业务模式,开启了人类与AI合作的新纪元。基于AI助手和大语言模型,企业能够实现智能运营的目标。

如果说,2022年是AI大模型元年,那么2024年就是AI大模型从技术切实走向落地的元年。从市场发展趋势来看,各家大模型厂商已经不仅局限于一味地“卷”参数,而是将更多的注意力放在如何在行业侧落地。

与此同时,AI大模型已经在以不可阻挡的趋势向企业侧、行业侧渗透,而GenAI的出现,也让企业对于云计算及AI技术的需求,逐步从技术部门转向业务部门。据市场研究机构预测,到2025年,全球GenAI市场规模将达到100亿美元以上。其中,企业级GenAI市场将占据相当大的份额,成为最大的应用领域之一。

在这里插入图片描述

GenAI将从“实验室”走向“生产线”

随着这一轮AI技术的快速发展,AI已经从“卷”技术走向“卷”应用的阶段,如何帮助用户更好地落地使用AI大模型,用AI大模型为业务提供更多助力已经成为企业的必修课。

根据麦肯锡的研究,GenAI每年对全球经济的贡献至多达7.9万亿美元。GenAI不仅对全球经济产生重要影响,也为各个行业带来了变革机遇。各行各业领先企业已开始积极应用GenAI,并取得成果。从媒体到金融、从医疗到交通,GenAI正成为推动新一轮创新浪潮的核心动力之一。其中,零售和消费品行业、银行业、制药和医疗产品三个行业的价值潜力最大。

今年,Google、OpenAI、阿里巴巴等科技巨头都陆续推出生成式AI技术,但是还没有多少客户真正把GenAI系统投入到业务中。

究其原因,GenAI从理论转向实践企业需要解决两大挑战。第一,要把GenAI投入到企业以及业务用例的过程当中,意味着GenAI将从构建训练基础架构转向构建推理基础架构。这时,企业必须要能更好地理解、搞清楚,除了训练的基础架构,如何打造一个推理的基础架构。这包括“把推理放在什么地方?”训练是在数据中心当中,推理可能会放在边缘,接近企业客户所在的位置。

同时,随着这一转变的发生,如何确保推理基础架构的安全将成为企业关注的重点。因为训练基础架构保护好数据中心就够了,但如果把推理的基础架构部署到现实的世界中,离开数据中心到边缘中,来到了工厂、制造中心和客户所在的地方,包括交通运输的网络中,这样的安全保护的模式就不同了,需要面对不同类型的风险、不同类型的攻击。

第二大挑战是,企业CIO和领导者必须做一个决定,即选出几个需要优先实施的GenAI应用项目,这是很有风险的事情,对企业至关重要,如果选错了会出现大量的资源浪费。“做出正确的选择”要求企业必须充分理解到GenAI的价值,对自己的企业而言GenAI在哪些方面能帮上最大的忙。

此外,GenAI转向实践还将带来一个新趋势,之前大家认为GenAI的成本就是训练成本,即在训练的时候构建模型需要用多少台服务器、需要有多少架构开发和维护的人员等。但是,当GenAI转向实践时,在企业的用例中,在应用阶段的主要成本将是运营成本。

为了帮助企业更好地落地GenAI应用,越来越多的科技巨头推出不同的技术解决方案,以求帮助企业更好地落地AI应用。

从应用层面看,大模型并不是越大越好,企业需要根据自身适用的场景,选择适合自身使用的AI模型产品,企业需要根据不同的任务场景,选择不同的工具。比如医药研究,更大的模型、更大的token和参数很重要,但是一些需要快速响应的领域,例如智能客服,小模型反而能提供更低的延迟,更高的性价比。

从市场格局上看,诸如亚马逊云科技、IBM、微软、阿里云、百度等全球科技巨头也将平台化的大模型产品视为接下来重点布局的方向。显然,平台化、多元化的大模型产品已经成为众多科技巨头积极抢占的市场。

企业引入GenAI的关键点

在国内,GenAI应用发展最迅速的领域包括电商、传媒、娱乐和游戏,尤其是数字虚拟人和电商视频营销,而大部分传统行业(如金融、能源、教育等)仍处于小规模试点阶段。

中国GenAI企业利用国内垂直场景优势,将GenAI优先应用于商业化基础设施较完善的新兴行业中,市场上主流的商业模式包括云资源售卖、模型API调用、SaaS收费、素材收费等,大规模应用GenAI的商业模式仍有待探索。

当前,企业GenAI应用主要有三个定位:创造者——推动核心商业模式转型,重塑核心业务和/或面向客户的方式,例如抵押评估、直接客户互动;塑造者——聚焦幕后整合,改变业务模式的应用程序,例如虚拟专家,前线培训;使用者——有针对性地提高生产力,利用SaaS解决方案,提高现有任务的效率或准确性,例如编码协助、文案写作、客户协助。

企业在考虑引入GenAI时应以速度为先,遵循“四步走”方法论,高效实现GenAI部署和规模化应用。首先,企业应构建“内、外、快、慢”四大战略来平衡企业内部和外部要素,以及速赢举措和端到端体系化转型。

其次,企业应在“负责任的AI”(Responsible AI)框架下,快速制定初版用例图谱和转型路径图。

第三,企业需要根据用例的重要性与潜在效益进行优先级排序,以“先动起来”的方式逐步推进试点工作,为全公司规模化应用夯实基础。

最后,企业需要进行全方位运营模式转型,并将AI内嵌到业务的每个环节,从而实现规模化推广GenAI。

另外,值得注意的是,金融机构在应用GenAI时尤其需要关注模型幻觉、恶意使用、信息泄露等三大关键风险。

GenAI应用的“最后三公里”

一项技术只有应用到生产中才能体现它的真正价值。

从GenAI应用的关键路径来看,从技术应用的想法到最终的生产上线,要经过定义场景、选择合适自己的基础模型、到利用自己的数据做模型适配/调优和评估、再到部署模型、在模型之上构建GenAI应用、评估是否负责任的AI的原则等多个环节。其中,最为关键的是要卡住三个环节:选对业务场景、选择正确的工具、工程化“最后三公里”挑战。

针对业务场景选择,科技巨头亚马逊云科技基于与各个行业企业的共同尝试,总结出了一些容易落地、同时企业收效较快的场景。

其次,针对模型选择,行业客户需求纷繁复杂,“不会有一个模型一统天下”,企业需要根据自身业务的需求来选择合适的模型,因此,很多企业都在采取“多模型”的策略。

企业选择模型时要考虑多方面的因素,但其中最重要的就是在三角形的三点上进行平衡:准确性、成本、响应速度。比如,如果是2C的生成式AI对话应用,响应速度就是最为重要的因素;相反,如果是生成法律文书,那么最重要的因素就是准确性。

第三,技术生态合作的重要性日趋凸显。近日,在亚马逊云科技中国峰会2024上,亚马逊云科技就推出了多个合作伙伴计划,包括GenAI合作伙伴计划、行业合作伙伴计划等。

一方面,亚马逊云科技继续扩展和中国AI大模型厂商的合作,另一方面也更加重视各个垂直行业的智能化应用落地。

比如,亚马逊云科技在会上宣布,百川智能的基础模型Baichuan2-7B、零一万物的基础模型Yi-1.5 6B/9B/34B都将登陆中国区域SageMaker JumpStart,能够为中国企业提供更多模型选择。

垂直行业方面,亚马逊云科技还和四维图新加强合作,计划联合设计并推出面向汽车行业本地化的服务及专属解决方案,涉及智能网联汽车、智能驾驶开发和量产等领域。

即将上任亚马逊科技CEO的马特·加尔曼(Matt Garman)表示,中国是亚马逊云科技全球最具战略重要性的地区之一,过去十多年间,亚马逊云科技持续投资并扩大在中国的基础设施。在他看来,GenAI也将以前所未有的方式改变各行各业。

在帮助合作伙伴拥抱GenAI方面,亚马逊云科技提出了三条路径。首先,是场景选择,需要从自身熟悉的业务场景出发应用GenAI,而不是生搬硬套地将AI技术强加于业务之上。选择契合度高的场景,可以快速找到切入口。

其次是工具/模型的选择,应利用成熟有效的工具和模型,加快落地进程,避免重复“造轮子”。

第三,是融合生态的建设,为打造有竞争力的AI应用,需要充分利用云上融合的生态体系,平衡快速落地与合规治理,两手并重,从而获得可持续的商业价值。

为进一步提高企业的GenAI应用能力,亚马逊云科技还推出了业内首个GenAI能力认证,旨在验证、认可在利用亚马逊云科技GenAI技术方面拥有专业知识、实践经验和成功案例的合作伙伴。

据Canalys全球调查数据统计,在2023年投入生产的GenAI应用之中,有36%是由合作伙伴交付的。亚马逊云科技认为,这个比例未来还会增长。随着GenAI的场景越来越复杂,一定会需要大量的合作伙伴在其中扮演重要的角色,这其中从行业客户而来的更多场景需求是需要合作伙伴来提供的。

亚马逊云科技大中华区合作伙伴及业务赋能总经理李晓芒表示,“在亚马逊云科技合作伙伴网络第二个十年新征程的开局之年,秉持长期主义,我们基于合作伙伴价值成就合作伙伴战略。这将进一步强化亚马逊云科技合作伙伴网络建设,加速为合作伙伴赋能,助力他们实现业务增长和规模化发展,与亚马逊云科技共赢新征程。”

在这里插入图片描述

亚马逊云科技大中华区合作伙伴及业务赋能总经理 李晓芒

GenAI落地行业应用才刚刚开始,谁能先找到创造高价值的场景,谁就会先人一步获得差异化竞争力,这或许比“卷”价格更有意义。以亚马逊云科技为代表的科技企业通过帮助企业提高GenAI的应用能力,让GenAI真正成为提高生产力的工具,为企业和行业打开更大成长空间。

【关于科技云报道】

专注于原创的企业级内容行家——科技云报道。成立于2015年,是前沿企业级IT领域Top10媒体。获工信部权威认可,可信云、数博会、国家网安周与全球云计算等大型活动的官方指定传播媒体之一。深入原创报道云计算、人工智能、大模型、网络安全、大数据、区块链等企业级科技领域。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/22040.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【全开源】Java AI绘画MJ绘画源码小程序APP公众号源码AI绘图

🎨 探索AI绘画的奥秘 一、引言:AI绘画的魅力 🌈 在这个数字化飞速发展的时代,AI绘画已经不再是遥不可及的梦想。通过源码小程序,我们可以轻松探索AI绘画的奥秘,感受科技与艺术的完美结合。今天&#xff0…

电脑误删除文件如何恢复?几种常用的数据恢复方法分享!

处理电脑文件时误删是大部分电脑用户可能都会面临的一个问题。如果是比较重要的文件,很多用户就会开始心慌,不知道如何是好。那么,电脑怎么恢复删除的文件呢? 其实方法很简单,下面小编就给大家分享几种常用的数据恢复方…

react-学习基础偏

1.新建文件夹 2.vscode引入这个文件夹 3.打开vscode终端 执行命令 npx create-react-app react-basic 创建基本项目(react-basic项目文件夹名) 4.进入到这个文件夹 可用的一些命令 这就算启动成功 5. 这是项目的核心包 渲染流程

java自学阶段二:JavaWeb开发06(mybatis学习)

目录: 学习目标mybatis的基础用法(新增、删除、修改、查询) 一:学习目标: 1)了解mybatis的基础概念; 2)学会mybatis的基础用法; 二、mybatis的基础概念: M…

手把手教你改进YOLOv8小目标检测(多尺度特征融合iAFF)

1,YOLOv8改进策略指南 YOLOv8是目标检测领域中一个重要的模型,它在YOLO系列的基础上进行了进一步的改进和优化。 根据搜索结果,YOLOv8的一些改进策略包括: 注意力机制的增加:通过引入注意力机制,可以提高模型对目标特征的捕捉能力,从而提升检测性能2369。 卷积和Block的…

Unity Obi Rope失效

文章目录 前言一、WebGL端Obi Rope失效二、Obi Rope 固定不牢三、使用Obi后卡顿总结 前言 Obi 是一款基于粒子的高级物理引擎,可模拟各种可变形材料的行为。 使用 Obi Rope,你可以在几秒内创建绳索和杆子,同时完全控制它们的形状和行为&…

scipy.io.loadmat加载.mat文件,出现KeyError: ‘xxx‘

源代码: input_image loadmat(rC:\Users\admin\Downloads\Indian_Pines\SVM/aa.mat)[aa] #影像图 错误显示: 解决方法: 因为loadmat函数读取出来的高光谱数据是dict格式的所以需要定位才能进行后续操作,定位通常是通过列名&a…

运筹说 第116期 | 算法介绍之排队论

在这个快节奏的时代,无论是线上购物、线下服务,还是工业生产,我们都不可避免地与“排队”打交道。今天小编将带你一起探索利用Python和MATLAB这两种编程工具,来求解排队论中的常见模型和排队优化问题。我们将从排队论的基础模型开…

U盘杀毒是否会导致文件丢失?误删文件如何恢复?

在数字化时代,U盘作为便携的数据存储设备,广泛应用于我们的日常生活与工作中。然而,随着网络环境的复杂化,U盘也时常成为病毒传播的媒介。因此,对U盘进行杀毒成为保护数据安全的重要步骤。但许多用户担心,给…

centos安装vscode的教程

centos安装vscode的教程 步骤一:打开vscode官网找到历史版本 历史版本链接 步骤二:找到文件下载的位置 在命令行中输入(稍等片刻即可打开): /usr/share/code/bin/code关闭vscode后,可在应用程序----编程…

10Linux 进程管理学习笔记

Linux 进程管理 目录 文章目录 Linux 进程管理一.进程1.显示当前进程状态(ps)进程树(pstree)1.1实时显示进程信息(top)顶部概览信息:CPU 状态:内存状态:进程信息表头:进程列表:1.2(htop) 2.终止进程(kill)2.1通过名称…

Jetson Orin Nano安装使用;cuda、pytorch安装;yolo使用

参考: https://blog.csdn.net/q839039228/article/details/126278528 1、jtop工具安装 安装jtop资源查看: sudo apt update sudo apt upgrade安装: sudo apt install curl nanosudo pip install jetson-stats查看: jtop 按2查看GPU 按3查看CPU 2、JetPack套件 参…

修改云主机配置 - 内存增容

文章目录 一、修改云主机配置缘由二、修改云主机配置步骤1、查看云主机概述2、查看master云主机3、更改master云主机配置4、查看master云主机 三、使用Spark Shell玩Saprk SQL1、启动HDFS服务2、启动Spark集群3、启动集群模式Spark Shell4、读取文件生成单例数据帧5、将单列数据…

C语言----字符串、字符数组

一、定义 C语言中的字符串是以字符数组的形态存在的 在C语言中,没有字符串类型,字符串实际上是使用空字符\0结尾的一维字符数组。因此,\0是用于标记字符串的结束。 二 、如何创建字符串? 1.通过字符数组来创建字符串&#xff0…

某黑产组织最新攻击样本利用BYVOD技术的详细分析

前言概述 最近一两年BYVOD技术被广泛应用到了各种黑产攻击、APT攻击以及勒索病毒攻击活动当中,笔者近期在对某黑产组织进行跟踪,捕获到该组织的最新攻击样本,通过某安全厂商的驱动漏洞,利用BYVOD技术对抗其他安全软件包括各种EDR…

单片机+M26429+PAM8403+MH-M18无线蓝牙音频功放设计 原理图PCB源程序

目录 功能描述: 原理图 PCB ​代码 资料下载地址:单片机M26429PAM8403MH-M18无线蓝牙音频功放设计 原理图PCB源程序 功能描述: 1,无线蓝牙连接,手机可控制歌曲音频选择。 2,音频声音的大小可控制一排…

三维模型轻量化工具:手工模型、BIM、倾斜摄影等皆可用!

老子云是全球领先的数字孪生引擎技术及服务提供商,它专注于让一切3D模型在全网多端轻量化处理与展示,为行业数字化转型升级与数字孪生应用提供成套的3D可视化技术、产品与服务。 老子云是全球领先的数字孪生引擎技术及服务提供商,它专注于让…

sectigo和certum ip ssl证书的区别

IP SSL证书是一种数字证书,为客户端和服务器之间的信息传输提供加密服务。但是和应用比较广泛的域名SSL证书相比,IP SSL证书是为只有公网IP地址的网站准备的数字证书。市场上常见的IP SSL证书品牌就是Sectigo和Certum,那么,这两种…

[AI Google] Ask Photos: 使用Gemini搜索照片的新方法

借助Gemini模型,将Google Photos提升到一个新的水平。 Google Photos是我们最早以AI为核心构建的产品之一,让你能够搜索照片和视频中的人、宠物、地点等。现在,我们通过我们最强大的AI模型Gemini对Google Photos进行重大升级。通过Ask Photos…

【C/C++】——小白初步了解——内存管理

目录 1. C/C内存分布 代码区(Code Segment): 数据区(Data Segment): 堆区(Heap): 栈区(Stack): 常量区(Constant Seg…