AI PC行业深度研究报告:AI PC革新端侧AI交互体验

今天分享的人工智能系列深度研究报告:《AI PC行业深度研究报告:AI PC革新端侧AI交互体验》。

(报告出品方:华创证券)

报告共计:28页

点击添加图片描述(最多60个字)编辑

一、硬件端与内容端持续创新,AI PC 或有望成为首个大批量落地的 AI 终端

(一)联想首推 AI PC,2024 年 9 月有望上市

联想 All For AI,展示丰富人工智能创新成果。2023 年 10 月 24 日,在联想创新科技大 会(Lenovo Tech World 2023)上,联想集团董事长兼 CEO 杨元庆展示了联想首款 AI PC、 大模型压缩技术、人工智能双胞胎(AI Twin)等一系列人工智能创新科技成果。联想的 AI Twin 可以通过压缩模型使大模型终端设备上离线运行,在旅行规划需求下,AI Twin 会参考用户之前的旅行日记和笔记,为用户提供比公共模型更个性化的旅行计划。

基础模型包括三类,有助于分层提供不同类型服务。基础模型是在与人类价值体系相一 致的大量数据规模上训练的大型 AI 模型,因此它可以适应广泛的下游任务。基础模型分为公共、私人和个人三种,公共基础模型(Public FM)是所有人都可以获得的,私人基础模型(Private FM)是为了执行企业特定任务将信息保留在企业里的,个人基础模型 (Personal FM)可以基于个人数据提供个性化答案。

实现人工智能基础模型三个核心技术,联想将终端 AI 推理变为可能。在设备上集成智能 对于实现 AI 的全部潜力,即提供更高即时性、可靠性、个性化、安全性和隐私性至关重 要,能够在设备本地高效运行多个并发 AI 工作负载的技术是关键。其中包括三项核心技术:(1)私人模型的微调:首先使用公共数据进行训练得到公共基础模型(Public FM),它可 以执行一般的任务。然后通过使用企业特定数据进行额外训练,由此私人模型 (Private FM)可以理解公共领域任务也可以理解企业特定的任务。 (2)个人基础模型的模型压缩:发现基础模型中的耦合结构,评估这些结构的重要性。对于重要的 结构,分配更多 bits 来量化,对于不太重要的结构分配较少的 bit。通过这种联合修 建和量化算法,可以显著减小基础模型的大小,从而放进 PC 或智能手机中。(3)混合 AI 框架的数据管理和隐私保护:评估这个任务是公开的还是私人的,如果是公 开的,可以将此任务分派给所有基础模型。如果包含企业特定信息或个人信息,执行任务理解、任务分析、关键字屏蔽和取消屏蔽等操作,最后再使用这个混合 AI 框 架将所有内容重新组合成一个完整答案。

联想将与合作伙伴共同建立混合 AI 生态,首款 AI PC 有望于明年 9 月发布。未来的 AI 将是公共、私人和个人基础模型的混合体,联想将和所有合作伙伴一起建立混合 AI 生态 系统。联想将提供企业 AI 双胞胎和个人双胞胎 AI 两类服务;对于企业用户,联想将通过混合 AI 和域优化服务满足企业数据保护和安全需求;对于个人用户,联想将通过在终 端设备方面的优势,以混合方式提供模型服务,最大限度提高用户效益。

(二)从 Smart PC 到 AI PC,AIGC 驱动 PC 智能化新发展

Smart PC 推出已久,受限于成本压力普及缓慢。几年前就开始有厂商积极探索 Smart PC (智慧 PC)的使用场景,Smart PC 主要从应用场景出发(Always on Always),例如:人 机交互,包括语音智能唤醒、免接触式场景和开盖开机等功能。然而受限于成本和算力, 推进速度相对较慢。据群智咨询数据,为实现 PC 端智能化的自然语言交流,单在硬件成 本上至少需要额外付出约 2.7 美元左右来满足精确的语音录入与处理功能,使品牌方的 成本压力大大增加。混合 AI 从云到端,助力 Smart PC 向 AI PC 转化。AIGC 的迅速发展可有效解决 Smart PC 的成本压力问题,即:云端+本地端协作。利用云端的大数据处理能力丰富本地端的 PC 使用场景,依托于云端算力来提升本地性能平衡,会大大的助力 Smart PC 向着 AI PC 的方向进一步持续转化,提供更多的应用场景,这也对 AI PC 提出了本地端与云端混合发展的要求。

相比于传统 PC,AIPC 功能丰富且效率更高。传统 PC 仅能实现基础的数据处理和计算 功能,智慧 PC 可以实现本地特定场景的优化功能,而 AIPC 功能更加丰富,具备自然语言处理、图像识别等多种功能。同时本地+云协同工作,大幅提高运行效率,使得离线条 件下也能使用 AI 功能。交互方面,AIPC 提供简易化的操作界面,对用户技能要求较低, 让更多的用户能够使用人工智能来提高效率。

(三)隐私保护与低延迟催生 AIPC 需求,软硬件持续迭代为产品落地创造条件

大模型存在数据泄露等安全隐患,是企业及个人用户的核心关注点。2023 年 3 月 ChatGPT 首次遭遇了重大个人数据泄露,很多网友在 ChatGPT 网页左侧的聊天记录栏中 出现了他人的聊天记录内容。除此之外,今年 3 月自三星电子允许部分半导体业务员工 使用 ChatGPT 开始,短短 20 天有三起机密资料外泄事件。据 Cyberhaven 数据,在员工 直接发给 ChatGPT 的企业数据中,有 11%都是敏感数据。

终端 AI比云更安全,且时间延迟较低。目前常用的 AIGC 都是在云上实现,需要将个人数据上传到网络,存在泄露隐私的隐患。而未来 AIPC 的部分推理功能将发生在终端侧,用户既可以享受到 AIGC 带来的生产力提升,也无需担心上云导致的隐私泄露。对用户来说,云上的公共知识可以为其所用,但自己的人工智能数据无需分享。除安全性之外,终端 AI 节省了数据传输时间,大幅降低时间延迟。

多家厂商加速研发 AIPC,2024 有望迎来 PC 重大发展机遇。除联想之外,多家头部 PC厂商也在进行 AIPC 相关研发和合作。惠普电脑 CEO Enrique Lores 表示目前正在研发支持 AI 能力的 PC,称当前正与所有关键软件服务商和芯片供应商合作,将重新设计PC 的架构。戴尔与英伟达合作推出新的 AIGC 解决方案,同时戴尔将提供新的硬件设置、托管服务平台和计算机,以更快地运行客户所创建的生成式 AI项目。Acer 品牌创办人施振荣表示,Acer 目前已经与 CPU 厂商展开合作,预计将把 AIGC 或其他 AI 应用导入到终端设备上,相关 AI笔记本方案会在 2024、2025 年陆续推出。

2024 或将迎来 AIPC 规模出货元年,软硬件持续选代为产品落地创造条件。据群智咨询数据,预计 2024年全球AI PC 整机出货量将达到约 1300 万台。在2025 年至 2026年,AI PC 整机出货量将继续保持两位数以上的年增长率,并在 2027 年成为主流化的 PC产品类型,这意味着未来五年内全球 PC 产业将稳步迈入 AI时代。由于 AIPC 产品对硬件和软件基础设施的要求均有所提高,软硬件仍需持续迭代为产品落地创造条件。

二、硬件端:AI PC 催化硬件端迭代升级,英特尔 AI PC 芯片将于年底落地

(一)可获取性及安全性是办公领域核心问题,AI 从云端走向终端

人工智能引发数据安全问题,需平衡技术应用和隐私保护。随着人工智能技术的不断发 展和 AIGC 的应用,大量的个人和企业数据被采集、处理并传输到云端,而将数据传输 到云端存在数据泄露的风险。在应用人工智能技术的同时,仍需关注如何做好数据隐私保护问题。

AI从云端走向终端部署,最大幅度保障数据安全和运行稳定性,边缘计算是指发生在网络边缘的计算,更靠近数据源,而云计算发生在数据中心。云计算通常具有高可用性,高性能和高伸缩性,可以处理大规模数据和应用程序;而边缘计算通常具有低延迟、高带宽和实时功能,可以支持更多实时应用场景。除此之外,由于边缘计算中仅向云端传输少量信息或不传输信息,隐私性和安全性较高。同时,由于边缘 AI 不受网络访问限制,可离线使用,可充分保障系统稳定运行。

多种方法进行大模型压缩,从而将其部署至终端设备。目前常见的模型压缩有三种方式, 包括知识蒸馏、量化和权重剪枝。可以在不显著降低模型性能的前提下,节省存储空间、 提高计算效率、加速推理过程,使大型 AI 模型更容易部署到边缘设备或其他低功耗环境 中,从而拓展 AI 技术的应用领域。  知识蒸馏:通过训练轻量级模型(学生模型)来模仿重量级模型(教师模型),可以将大型 AI 模型的知识迁移到轻量级模型中,从而实现模型压缩。  量化:将浮点数权重参数转换为较低精度整数,从而降低模型的存储和计算需求。  权重剪枝:删除模型中较小的权重参数,从而减小模型的大小。为了防止模型过拟 合的情况,在压缩过程中需要加入正则项来平衡模型的泛化性能。

压缩模型终端运行的效果并不弱于原始大模型,有望催化混合 AI 架构。大模型的训练效 果并不是参数越多越好,较小参赛的模型经过微调也能具备相似甚至更好的效果。据上海人工智能实验室发表的论文《LLaMA-Adapter: Efficient Fine-tuning of Language Models with Zero-init Attention》的研究结果,基于 70 亿参数的模型 LLaMA-Adapter 在微调 180 万个参数后,回答问题的正确率高于多数大型模型,同时在 SOC(Social Science)领域的效果非常突出。

(二)终端离线 AI 对处理能力提出更高要求,硬件仍需持续迭代

高通实现安卓手机上跑十亿参数大模型,证明大模型在本地终端运行的可能性。2023 年 2 月 23 日,高通全球首次成功在搭载了骁龙芯片的安卓手机上运行了 Stable Diffusion。 Stable Diffusion 可以基于大模型从文本生成图片,其模型参数超过 10 亿个,计算量是智 能手机上运行的典型工作负载大小的 10 倍以上,而正是由于模型庞大、算力需求高、能耗高企,此前主要局限在云端运行。而搭载骁龙芯片的手机可以直接运行参数规模超过 10 亿的 Stable Diffusion,且只需要 15 秒左右就可以出图,精确度与云端处理接近。

边缘侧 AI 对终端的处理能力提出更高要求,终端处理器仍需持续迭代。以苹果 Siri 为 例,早期 Siri 在离线情况下仅支持通过预设的语音唤醒信号实现语音唤醒。2018 年苹果推出 A12 芯片,采用台积电 7nm 制程,NPU 由双核升级到八核,NPU 内核的面积是 A11 的 3.16 倍。搭载 A12 芯片的 iPhone XS 首次支持 Siri 离线运行,可以在离线条件下完成拨打电话、打开特定应用等预设简单请求。随着未来在终端运行大模型的复杂度持续提 高,终端处理器仍需持续迭代。

AI PC 带动散热、存储及外观设计创新,硬件仍需持续迭代。除了核心处理器外,AI PC 对笔记本电脑的其他零部件亦提出更高的要求。在终端运行大模型首先要解决散热问题, 要重新设计机器外壳和结构件,同时采用更好的散热材料。存储方面,为了提高数据传 输速度及存储容量,需采用更优质的存储器件。AI PC 带动笔记本电脑一系列的迭代与创新,有望驱动 PC 零部件价值量提升。

(三)具备 AI 功能的 AI PC 芯片将于年底推出,AI PC 加速落地

英特尔首款内置神经网络处理器的消费级芯片即将上市,消费级 AI 芯片走向市场。英特尔 Meteor Lake(14 代酷睿)将于 2023 年 12 月 14 日上市,该芯片首次将神经网络处理 单元(NPU)集成到 PC 处理器中。NPU 与 CPU、GPU 的主要区别在于学习能力,NPU 可 通过学习用户操作、计算任务属性,做出相应的预判来弹性调用 CPU 与 GPU 的运算能 力,大幅提升性能,同时降低功耗。该芯片采用新的 Intel4 制造工艺,相较于 Intel 7 制程工艺的 408nm 高性能库高度,Intel 4 的 240nm 达到了 2 倍的高性能逻辑库面积缩减。

英特尔宣布启动 AI PC 加速计划,构筑 AI PC 核心硬件基础。英特尔在近期“英特尔 on 技术创新大会”期间宣布,正式启动首个 AI PC 加速计划。英特尔将联合独立硬件供应 商(IHV)和独立软件供应商(ISV),利用英特尔在 AI 工具链、协作共创、硬件、设计 资源、技术经验和共同推广等方面的资源,在 2025 年前为超过 100 万台 PC 带来 AI 特 性,并由计划 12 月 14 日发布的英特尔酷睿 Ultra 处理器率先推动。处理器的性能是终 端运行 AI 及 AI PC 渗透的核心技术瓶颈,英特尔的布局构筑 AI PC 核心硬件基础,有望 驱动 AI PC 快速普及。

三、内容端:AIGC 快速发展,微软 Copilot 推出为 AI PC 内容端创造环境

(一)ChatGPT 使 AI 商业化初步落地,或可推动 AIGC 行业进入快速发展期

AI 被视为“第四次科技革命”,开启新一轮技术创新周期。人工智能概念最早于 1956 年 被提出,多年以来产业历经几轮技术快速发展周期。2012 年 AlexNet 神经网络模型问世, 成为一轮发展起点,并开启了 AI 在各行各业的应用,被视为人工智能 1.0 时代,但当时 仍存在模型碎片化等问题。2017 年 Google 团队提出的 Transformer 架构,开启了大模型为主流算法的人工智能 2.0 时代,模型参数呈现指数级增长。自 2018 年起,新一代 AI 技 术正在开始全新一轮的技术创新周期,而 GPT 也正是由此时诞生。

ChatGPT 代表通用人工智能突破的可能性,使得 AI 的“商业化”初步落地。ChatGPT 引发全球轰动的核心是代表着 AI 正在从感知智能向认知智能发展,代表通用人工智能突破 的可能性,正是“通用性”使得 AI 的“商业化”能够初步落地。此前运用人工智能的场景都 是专用人工智能模型,往往只适用于某具体领域;而 ChatGPT 及 GPT4.0 代表了人工智 能通用大模型方向的最新进展,“通用性”使得 AI 的“商业化”能够初步落地,而 AI 的通 用、商业化应用才能为各行各业具体赋能。目前 AIGC 的主要模式有文本生成、图像生成、音频生成,策略生成,跨模式生成及 Game AI。基于多种模式,AIGC 已应用于法律、 金融、工业、游戏等多种领域。

ChatGPT 具备爆款特性,或可推动 AIGC 行业进入快速发展期。众多学者将 ChatGPT 的 出现类比为“AI 的 iPhone 时刻”,关键在于 iPhone 和 Android 的推出加速了手机进入通用 化、智能化、商业化的民用时代。ChatGPT 的出世一度被认为是 iPhone 4 之后的又一次 革命,深刻改变人类生活和互联网格局。技术上,ChatGPT 一面市就展现出高完整度、 高体验性和高平台性,是成熟到一定程度的产物,而 iPhone 4 在软件和硬件方面都是高 标准、高适配;市场反应程度上,二者在短时间内都得到迅速普及,具有里程碑意义;时 代特征上,ChatGPT 和 iPhone 4 具有分别开启智能互联网时代和效率革命;二者都为用 户带来了效率的提升,iPhone 4 让大家的生活更高效、便捷、多样化,ChatGPT 则更直接 地为人类解决问题,扩展思维的多样性。

(二)生产力提升为 AIGC 率先渗透领域,PC 有望成为为 AIGC 核心交互入口

孪生编辑创作三大能力构建 AIGC 能力闭环。据中国信息通信研究院,AIGC 主要包括 三大核心能力,分别为孪生、编辑和创作。深度神经网络技术在大模型和多模态两个方 向上的持续突破,推动 AIGC 技术演化出智能数字内容孪生能力、智能数字内容编辑能 力和智能数字内容创作能力三大前沿能力。  孪生能力:将现实世界中的物理属性和社会属性高效、可感知地进行数字化。  编辑能力:高效率仿真和低成本试错为现实世界的应用提供快速迭代能力。  创作能力:算法创作能力的自我演化支持海量内容生态。

报告共计:28页

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/216905.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

12.字符串拼接【2023.12.4】

1.问题描述 我们在编程过程中经常会遇到把不同字符串拼接在一起的情况,从而更直观地展示给用户我们所要表达的信息。本题将给出两个字符串,请依次将这两个字符串拼接在一起。 2.解决思路 用字符串拼接符 进行连接两个字符串 3.代码实现 str1input(…

XSS漏洞 深度解析 XSS_labs靶场

XSS漏洞 深度解析 XSS_labs靶场 0x01 简介 XSS原名为Cross-site Sciprting(跨站脚本攻击),因简写与层叠样式表(Cascading style sheets)重名,为了区分所以取名为XSS。 这个漏洞主要存在于HTML页面中进行动态渲染输出的参数中,利用了脚本语…

Apollo配置发布原理解析

📫作者简介:小明java问道之路,2022年度博客之星全国TOP3,专注于后端、中间件、计算机底层、架构设计演进与稳定性建设优化,文章内容兼具广度、深度、大厂技术方案,对待技术喜欢推理加验证,就职于…

P1单片机定时器配置及定时器中断——C51(超详细)

目录 1. 简介 1.1 概念解读 1.2 定时器怎么定时 1.什么是晶振 2.什么是时钟周期 3.什么是机器周期 4.加1经过了多少时间 1.3 定时器编程 1.如何算出10ms定时器的初值(TL0 TH0) 2.关于TCON ,怎么知道爆表 3.怎么开始计时(TR0) 4.定时器使用是有很多种模式的&#xf…

深入了解基础故障编排:提升系统故障应对能力的关键

在当今高度数字化的世界中,系统的稳定性和可用性对于业务的成功至关重要。然而,在复杂的软件和硬件环境中,故障不可避免地会发生。为了更有效地应对这些故障,基础故障编排成为一项关键的技术。本文将探讨基础故障编排的概念及作用…

「PPT 下载」Google DevFest Keynote | 复杂的海外网络环境下,如何提升连接质量

(全网都在找的《社交泛娱乐出海作战地图》,点击获取👆) 12 月 10 日,“Google DevFest 2023 上海站”大会如期在上海市东方万国宴会中心举办。延续过往的技术交流碰撞、前沿技术学习基调传统,本届大会聚焦行…

基于导数Zernike多项式拟合技术的干涉测量二维相位展开算法(原文翻译)

Zixin Zhao1,Hong Zhao1、Lu Zhang 1,Fen Gao2,Yuwei Qin3,Hubing Du 摘要: 我们提出了一种适用于一般干涉测量应用的相位展开方法。所提出的方法依赖于导数泽尼克多项式拟合(DZPF)技术,其中相…

淡化了技术指标 还能做现货黄金交易?

技术指标是分析和预测现货黄金走势的其中一种方法,普通投资者多数依赖技术指标为自己的交易做判断。然而,近几年有一种观点认为,我们应该淡化技术指标,少使用或者不用技术分析来服务我们的交易。这个观点引起了不少投资者的思考&a…

现代密码学复习

密码学总结 目录 密码学总结 第一章——只因础模型与概念 1.1 密码学五元组(结合🐏皮卷) 1.2 Dolev-Yao威胁模型 1.3 攻击类型 1.4 柯克霍夫原则(Kerckhoffss principle) 1.5 对称、非对称加密 1.6 密码的目标…

优雅玩转实验室服务器(二)传输文件

使用服务器最重要的肯定是传输文件了,我们不仅需要本地的一些资源上传到服务器,好进行实验,也需要将服务器计算得到的实验结果传输到本地,来进行预览或者报告撰写。 首先,由于涉及到服务器操作,我强烈推荐…

【FPGA】Verilog:BCD 加法器的实现 | BCD 运算 | Single-level 16 bit 超前进位加法器 | 2-level 16-bit 超前进位加法器

0x00 BCD 运算 在 BCD 中,使用4位值作为操作数,但由于只表示 0 到 9 的数字,因此只使用 0000 到 1001 的二进制数,而不使用 1010 到 1111 的二进制数(dont care)。 因此,不能使用常规的 2complement 运算来计算,需要额外的处理:如果 4 位二进制数的运算结果在 1010 …

C++共享和保护——(1)作用域

归纳编程学习的感悟, 记录奋斗路上的点滴, 希望能帮到一样刻苦的你! 如有不足欢迎指正! 共同学习交流! 🌎欢迎各位→点赞 👍 收藏⭐ 留言​📝 人生就像骑单车,要想平衡就…

vue项目中 CDN 是vue本身的依赖可以按需加载还是项目中所有的第三方库都可以按需加载?

这是我看到CDN简介时产生的问题 相信很多小伙伴会有 和我一样的疑问 在这里 我也统一回答一下 CDN(内容分发网络)是一种通过将数据分发到全球各个节点,以提供快速、可靠的内容传输的技术。在Vue项目中,CDN可以用于按需加载Vue本…

MicroSD 卡 使用读卡器 读取速度测试

设备 - - 电脑为m.2固态硬盘 usb口为USB3.2 gen2接口(即支持1GB/s的接口) cpu: amd3600 测试方案1 直接MicroSD卡放入读卡器测试 38MB/s 从sd卡复制到本地C盘 测试方案2 MicroSD卡使用闪迪的SD卡套套上之后一起插入读卡器 76MB/s 从sd卡复制到本地C盘

HCIA-H12-811题目解析(10)

1、【单选题】DHCP客户端在租期到达哪个比例时第一次发送续租报文? 2、【单选题】在WLAN中用于标识无线网络, 区分不同的无线网络的是? 3、【单选题】我们在笔记本电脑上搜索可接入无线网络时,显示出来的网络名称实际是 4、【单…

PPT制作的几个注意事项

PPT制作的几个注意事项 字数不可过多字体大小字体颜色排版问题PPT篇末致谢什么是好的PPT关于演讲不要念PPT说话时面向观众。讲话的时候抖腿其他 事先声明: 以下展示的PPT就PPT制作技巧而言,与其内容无关。 字数不可过多 做PPT最忌讳的就是满篇全是文字&…

SpringBoot应用开发指南(01)

目录 引言1. SpringBoot简介1.1 什么是SpringBoot1.1.1 背景1.1.2 优势1.1.3 核心概念 1.1.3 特点 2. SpringBoot入门2. SpringBoot集成MyBatis3. SpringBoot集成PageHelper3.1 什么是PageHelper 通过切面实现分页4. SpringBoot集成Druid总结 引言 在当今软件开发领域&#xf…

P4 Qt基础控件——工具按钮toolButton(上)

前言 🎬 个人主页:ChenPi 🐻推荐专栏1: 《C_ChenPi的博客-CSDN博客》✨✨✨ 🔥 推荐专栏2: 《Linux C应用编程(概念类)_ChenPi的博客-CSDN博客》✨✨✨ 🌺本篇简介 :这一章我们学一…

鸿蒙系统扫盲(五):再谈鸿蒙开发用什么语言?

前段时间,发表了鸿蒙系统扫盲(三):鸿蒙开发用什么语言?这篇文章,收到一些网友的提问,一一解答了,还有网友对我进行了严厉的批评和尖锐的指责,说我有点颠倒是非&#xff0…

【lesson9】表的约束(2)

文章目录 表的约束的介绍列描述测试建表 zerofill测试建表插入测试 修改表插入测试 修改表插入测试 表的约束的介绍 真正约束字段的是数据类型,但是数据类型约束很单一,需要有一些额外的约束,更好的保证数据的合法性,从业务逻辑角…