“创新的速度比创新本身更重要。”埃隆·马斯克曾这样说到。
近日,由马斯克所掌舵的特斯拉,在2024年世界人工智能大会上正式推出了第二代Optimus(擎天柱)人形机器人,距离第一代面世,仅过去9个月。
加速升级的人形机器人不负所望,成了今年WAIC大会(世界人工智能大会)的一大看点。除此以外,今年的WAIC大会还引发了哪些热门话题?带来了哪些前瞻指引?
开源和闭源,是互补关系
今年,华为盘古、百度文心、阿里通义、腾讯混元等国内知名大模型悉数都参加了WAIC,大模型依旧是重头戏之一。
大会开幕期间,在谈及大模型闭源与开源的选择时,两大头部企业陷入明显分歧。百度创始人、董事长兼首席执行官李彦宏称,模型开源无法做到众人拾柴火焰高,商业化闭源模型才最能打。
阿里云CTO周靖人则重申了阿里云开源开放的选择,并强调阿里两年前决定将通义大模型开源开放,时至今日,通义千问已经实现真正意义上的全尺寸、全模态开源,拉平了开源、闭源模型之间的差距。
相较而言,开源大模型和闭源大模型孰好孰坏,其实并没有定论。
从技术层面来看,闭源由于不公开源代码,安全性和服务质量更高,而且可以通过销售许可或提供基于模型的服务来盈利;但同时许可费高昂,外界难以审查监管,而且升级迭代高度依赖内部团队,速度有限。
开源则恰好相反,技术门槛和成本较低,吸引了全国范围的开发者和研究者参与,创新和迭代速度更快,适配更多应用领域,但无门槛的技术共享也带来了权益被侵犯的风险,质量、稳定性和安全性难以保证。
对比来看,闭源想要走向“成功”,唯一的路径就是进化为“超级应用”,从而创造价值;而开源凭借独有的兼容性打造了强有力的获客手段。由此可见,看似截然不同的两个方向背后,是由各自的商业利益驱使。
从应用层面来看,开源和闭源并不像手机端的iOS系统或者安卓系统只能二选一,尤其在ToB的情况下,应用端既需要技术共享也会考虑应用安全性,还需要满足多样化需求。
对此,百川智能CEO王小川表示,预计未来将有80%的企业会用到开源大模型,因为闭源没办法对产品做更好的适配,或者成本特别高,闭源可以给剩下的20%提供服务。
由此可见,二者并不是非此即彼的对立关系,在不同产品和应用场景中也可以是互补的关系。但归根究底,大模型在发展之余如何创造价值,选择开源还是闭源就不是核心问题,因为仅有基础模型却没有应用,就等同于一文不值。
AI落地的三大方向:大模型、机器人、终端产品
大模型作为人工智能大家族的组成部分,一直是热议的话题之一。随着WAIC 2024的落幕,AI应用落地的最新趋势也昭然若揭。
(一)大模型加速商业化
继百模大战后,大模型的“精耕细作”一直在持续。以ChatGPT和Sora为代表的大模型技术,也已进入新一轮迭代。从今年的WAIC来看,百度、阿里巴巴、腾讯、华为等行业巨头带来众多新技术和新产品,展现了大模型在金融、医疗、政务等多个行业场景的应用潜力。
截至目前,百度有千帆大模型平台、文心一言,阿里有阿里云百炼、通义大模型,腾讯有腾讯云混元大模型、元宝大模型,字节跳动有火山方舟、豆包大模型等等。
在过去的2023年里,大模型的长文处理能力、数字能力、推理能力、RAG(检索增强生成)、GPTs、多模态、原生应用、开源等多方面都有大幅增强。同时,训练和部署成本、行业适配能力、幻想问题以及数据安全这四大挑战也得以优化和解决。
图源来自数巅科技
在此基础上,定制化的大模型给To B和To C业务带来了非常深刻和彻底的改造,企业用户和终端个人用户也逐渐呈现刚性需求。基于此,To C产品可以通过不断收集用户反馈、积累模型的应用实践,来反哺ToB业务,从而加速大模型商业化落地。
(二)机器人和AI高度结合
今年,人形机器人专区也是大会的一大亮点。在世博展览馆的中厅,18台人形机器人组成阵列展示“才艺”,并与观众亲切互动,可见机器人技术的协同效应以及在"异构群智"领域的重大突破。
随着人形机器人和AI两大领域的高速发展,产业进入深度融合阶段,AI大模型+人形机器人正掀起下一波技术热潮。
从技术角度看,两者在自然语言交互、知识库与推理、多模态感知与决策、运动规划、任务规划与执行、情感交互、持续学习等七个板块均有结合应用的可能性。
在实际应用方面也已经取得突破。比如WAIC 2024大会上,特斯拉的Optimus二代机器人将深度学习应用于视觉感知,实现了精准的目标识别与抓取,而且可以直立行走,进行路线规划。
自然语言交互领域,Xiaomi CyberOne等人形机器人搭载大语言模型,实现了高自然度语音交互。情感交互领域,Hanson Robotics的Sophia机器人通过面部表情合成和声音合成,实现了丰富的情感表达。
通过以上技术的融合,我们有望创造出具备感知、决策、规划、控制、交互、学习等多维能力的人形机器人,最终赋予其真正的智能化、人性化。
(三)AI终端“新物种”涌现
除了大模型、人形机器人,AI的终端产品逐渐渗透至日常生活。正如三次工业革命,蒸汽时代诞生蒸汽机、电气时代发明电灯泡、信息化时代创造计算机,每一件革命性的“新物种”都被应用于终端场景,AI大航海时代的产物也将如此。
杨元庆展示AI PC新产品
今年,多个行业涌现了"终端新物种"。比如戴尔、联想、华为的AI PC新产品、内置大模型语音助手的雷鸟AR眼镜X2 Lite、实现AI翻译的时空壶同声传译器X1,以及今年上半年被热议最多的苹果vision pro混合现实头显,等等。
追本溯源,终端产品的涌现,主要得益于AI模型、AI应用、AI硬件的协同发展。从AI产业结构来看,产业链上游为基础层,包括算力等,中游为算法和模型层,下游为应用层。先有算力、芯片等“硬件”的完善和加持,再是大模型、算法的“精耕细作”,终端“新物种”应运而生。
随着AI生态和技术的不断进化,未来AI终端还将迎来架构设计、交互方式、内容、应用生态等的全面创新和升级。或许,我们会从提问“AI终端应该长什么样”,转为好奇“AI终端会长什么样”。
2024,开启“AI+”时代
2024年,伴随大数据处理、高性能计算、深度学习等技术的快速发展和成熟,人工智能已经能够解决大量的复杂问题,加上日益成熟的大模型技术,人工智能的准确度、效率、通用性、灵活性得到显著提升。
应用层面,随着现代社会产生的数据开始爆发式增长,为人工智能的进化提供了“养料”,人工智能得以更好地学习和理解现实世界。加之,个人用户和企业客户对于个性化、高效的服务需求日益增强。
在底层技术高速发展,以及市场需求的牵引下,人工智能(AI)已经由“+AI”模式转型至“AI+”模式的阶段。
对比来看,早前的“+AI”阶段,人工智能还只是一项补充技术,被运用于传统行业的既有业务流程和产品之中,目标在于提升效率、解决特定问题。
如今的“AI+”阶段,AI不再仅仅是业务流程的附属部分,更是各行各业创新发展的重要驱动力,其核心在于数据驱动和自我学习,利用神经网络模型进行大量数据的训练,模拟人脑的学习机制,从而实现语音识别、图像识别等多领域超越人类的表现。
这一阶段跨越的完成,意味着AI从单纯的技术附加工具转向了引领行业变革的关键要素,从赋能单一功能升级为重塑整个业务形态。
业务形态的重塑具体到应用场景,覆盖了交通出行、生活服务、工业制造、文化传播、医疗健康、农村建设等多个领域。
AI+交通领域,在AI算法的加持下,车辆能够处理海量的传感器数据,实现对车辆周围环境的高精度感知。同时,还能预测其他车辆的行驶轨迹,为自动驾驶车辆提供决策依据。最重要的是,AI算法通过不断学习和优化,可以提升自动驾驶系统的性能和安全性。
AI+制造领域,由于大模型、机器学习、计算机视觉等细分技术实现突破,人工智能可以被应用于制造业全流程各环节,通过挖掘各单一环节的数据信息,进而赋能整体的预测、生产、管理、决策,从而实现精细化管理,助力企业降本增效。
工信部数据显示,经过智能化改造,制造业研发周期缩短约20.7%、生产效率提升约34.8%、不良品率降低约27.4%、碳排放减少约21.2%。
长远来看,“AI+”的潜力已经开始展现。
结语
2024年,AI应用落地的想象力无效迸发。大模型加速商业化、AI 和人形机器人深度结合、终端新物种大量涌现,大航海时代的历史齿轮开始高速运转。
不只是人工智能行业,整个产业链也在加速扩容,AI+交通、AI+汽车、AI+文化、AI+制造等都开始从理论走向实践,走进生产和生活。
“AI+”时代真的来了。
作者:琴声奏响时
来源:松果财经