产品经理的大语言模型课 04 -模型应用的云、边、端模式对比

目录

    • 算力部署方式的影响因素
      • 数据量
      • 计算难度
      • 前期投入
      • 数据隐私
      • 应用规模与泛化能力
    • 云、边、端部署的特点和对比
    • 典型场景举例
      • 社区人脸门禁
      • 后厨老鼠识别
    • 未来展望

算力部署方式的影响因素

最近和人工智能从业者进行了非常广泛的沟通,尝试对模型应用的云、边、端模式进行对比。

2015 年前后语音和图片相关的人工智能应用逐渐兴起,目前在不少通用场景下,都已经有了比较成熟的 AI 应用服务,例如人脸比对、车牌识别等。

而人工智能的落地离不开“计算能力”,或者说算力。考虑到业务场景下各种因素的影响,算力部署的位置选择就有所不同。

数据量

在很多应用场景中,尤其是与物联网终端设备相关的场景下,设备采集的数据非常庞大,如果将所有原始数据上传云端再进行处理,带宽费用可能远超计算成本。
以 200 万像素摄像机为例,即便采用最新的 H.265 编码,一台摄像机一天的录像空间也要 20G 以上。如果所有视频都进行实时上传,占用的带宽就是 2Mb/s,公有云一年的带宽费用就超过 1000 元。

这时,我们通常会考虑在边缘侧,也就是在设备上,或者局域网内,完成数据的初步筛选和处理,减少上传云端的数据量。

计算难度

当面临复杂的计算任务,如人工智能训练、科学模拟或密码学运算时,需要强大的算力支持。这导致对高性能硬件的需求增加,如GPU、TPU或高性能CPU集群。
举个例子,如果你希望部署 DeepSeek R1 满血版,根据某些供应商提供的部署方案,需要两张 H20 的显卡,整体部署费用达到 300 万以上。
绝大多数的项目都没有这么充足的预算。

但是有一些简单的任务,例如图像识别中的目标标定、文字识别、基本人脸比对等,算法成熟,算力要求也不高,这些任务可能只需要 2T,甚至是 0.5T 的算力。
市面上能够提供这种能力的芯片供应商则非常多,我们可以选用一些性价比更高的设备。而这些设备放在专业的机房里,占用带宽资源的同时,又无法提供足够的计算价值,通常难以为公有云提供商带来丰厚的利润,所以他们也无意做这样的事情。
所以我们可以把这些低算力的设备,部署在边缘侧。

前期投入

正如许多餐饮店由于不知道后续经营效果如何,所以在开店早期,对大部分贵重的设备采用租赁的方式。
当提到通过人工智能降本增效时,绝大多数企业主对服务的效果是不明确的,他们自然希望能够小成本验证效果。所以租赁模式就是他们的首选。
而边缘设备,尤其是存在绑定关系的边缘设备,其租赁、回收的难度均较大,这类的供应商往往不存在;而云端租赁正是公有云的成熟商业模式,相对容易实现。

数据隐私

在处理医疗、监管、金融等敏感数据时,算力部署必须符合严格的安全标准和法规要求。很多项目要求数据不能上传公网。
同样因为数据隐私的问题,模型训练的数据往往不是公开的,这也意味着市面上难有公开训练的模型,如果客户自己有充足的数据,自己进行模型的训练和部署。
那么在这些时候,边缘化部署就是唯一的选择。

应用规模与泛化能力

2015 年开始,图像类的人工智能算法就已经开始发展和商业化尝试,但十年过去了,我们看到的通用的图像类人工智能算法并没有很多。
其中一个重要原因正是标注数据的缺失,导致算法训练的效果一般,检出率及检准率不足,导致难以商用。换言之,除非场景足够通用、数据量足够大,都难以训练出一个有效的算法模型。

由于使用人群较小,需求并发少,云端租赁的商业逻辑不成立,云服务商不愿意提供此类服务。实际上找 ISV 协助开发难度也较大。
同时训练数据量小,模型泛化能力不足,一种可行的思路是针对特定的场景,进行模型微调训练,并进行针对性部署,每个场景下的模型都是进行过训练的。

因此针对使用人群较小、数据量不足的场景,边缘化部署就变成了更合理的选择。

云、边、端部署的特点和对比

人工智能算法落地的算力部署,往往有云、边、端三种方式:

  • 云端:将计算资源(如CPU、GPU、存储、网络等)集中部署在远程的数据中心,通过互联网向用户提供计算服务
  • 边缘:计算资源部署在靠近数据源或用户终端的边缘节点上,这些边缘节点可以是小型数据中心、基站、路由器、网关等设备,和终端设备在同一个局域网内
  • 终端:计算资源部署在用户终端设备上,如智能手机、平板电脑、智能摄像头、物联网设备等
特性云端边缘终端
算力强大,无限制中等,4T-200T,通常只支持 INT8较弱,通常小于 4T,通常只支持 INT8,设置 INT4
资源部署灵活,支持租赁灵活固定
模型定制缺乏支持支持
算力浪费较少较少潜在较多
并发处理难处理好处理无并发问题
网络费用无网络费用
数据隐私有风险安全安全

典型场景举例

社区人脸门禁

社区人脸门禁场景是一个典型的智能安防应用,它利用人脸识别技术,实现对社区出入口的智能化管理。可以实现以下功能:

  • 业主刷脸直接进出小区、单元门
  • 访客在线填写信息,录入人脸,
  • 记录家政、快递、外卖等人员的出入情况,并进行有效管理

同时我们需要兼顾:

  • 小区业主人脸数据属于个人隐私数据,在采集、存储、使用上,需要注意
  • 社区里通常有个机房,机房里已经部署了服务器,作为小区监控、社区服务的载体
  • 如果宽带供应商除了问题,不应该影响小区业主的使用

为了实现这些功能:

  • 首先需要采集人脸数据,并形成人脸库
  • 在小区大门、单元门等地,安装人脸采集设备(门禁等),可以识别人脸
  • 人脸采集后,我们需要通过算法进行人脸比对

因此比较合理的方案架构,可能就是:

  • 云端:负责图片的初步采集,支持业主、访客等人员上传人脸,并下发到社区边缘计算设备,但不做图片存储
  • 边缘:
    • 对人脸图片进行编码,形成特征值,并进行存储,形成人脸库
    • 对于终端能力较弱的,可以由边缘进行人脸比对
    • 对人脸识别记录进行存储和汇总、分析
  • 终端:
    • 进行基本的人脸识别、人脸采集
    • 较强的终端可以直接进行人脸比对,并上报识别结果给社区服务器(边缘)

后厨老鼠识别

后厨是食品加工的关键场所,一旦出现鼠患,将极大地增加食品污染的风险。目前食品安全作为政府监管的重要方向,监管需求逐渐提升。
另一方面识别老鼠的行动轨迹,能够帮助企业规范后厨管理,提升连锁店运营能力,保护企业形象。

实现上,就是希望在后厨安装摄像机,或利用原有的摄像机,完成监控画面采集,并对画面中有老鼠的画面和视频进行识别分析。实现后厨老鼠识别的难点在于:

  • 由于涉及企业形象,公开的后厨老鼠数据往往是缺失的,因此目前老鼠识别算法并不成熟
  • 老鼠目标较小,且形态较多,皮鞋、帽子、桌腿等都可能被识别为老鼠,检出和检准率难以同时保障
  • 很多连锁店无法为终端设备提供免费的网络环境,需要借助物联网卡,因此流量费较高

同时我们要综合考虑终端设备和边缘计算设备的成本及能力情况:

  • 目前市面上具有老鼠识别功能的摄像机较少,且价格相对较高,而支持定制的能力较弱
  • 具有边缘计算能力的 AI 盒子供应商较多,产品价格相对较优,且内置 Linux 的系统,可以进行服务定制
  • 以 4T 算力的边缘盒子为例,可以对 4 路摄像机进行单个算法的视频分析

所以目前比较合理的方案架构是:

  • 终端(通常是 2-4 路摄像机):
    • 进行初步的筛查,例如移动侦测等
  • 边缘
    • 作为视频存储介质
    • 对鼠患高发时段(夜间)的视频进行初步筛查,重在检出而非检准
    • 将老鼠识别结果上报到云端
    • 其他必要的本地管理能力
  • 云端
    • 作为连锁经营统一管理平台
    • 对老鼠检出结果进行进一步筛查,重在检准
    • 生成老鼠活动轨迹、老鼠识别报告等

这里做一些额外的延伸。后厨还有一些其他的人工智能应用,例如垃圾桶是否敞开、是否戴口罩、是否戴帽子、是否有抽烟等,都可以通过边缘计算盒子来完成。
刚刚有提到 4T 算力的边缘盒子可以对 4 路摄像机进行单个算法的视频分析。那个如果涉及到多个算法,又不想更换算力更强(更昂贵)的设备该怎么办?常见的做法有几种:

  • 从视频识别改为抽帧图片识别:视频每秒可能多达 20 帧,如果改为每秒抽一帧进行分析,能够大大降低算力要求
  • 训练多合一的算法:一个算法支持多种目标检测,比多个只支持单个目标检测的算法要更经济
  • 减少识别时间片段:各个服务的重点检测时段不同,例如鼠患是 0-6 点,工作规范是 10-14 点、16-23 点,我们可以只针对风险高发时段进行检测

未来展望

我们看得到的趋势是,随着技术发展以及计算资源价格的下降,终端和边缘设备的计算能力会越来越强。
这也意味着很多原先云端才能做的服务,边缘也可以做了;很多原先边缘才能做的事情,终端也可以自行处理了。

这种计算模式的转变,不仅优化了资源配置,也为人工智能的应用带来了新的可能性。未来,我们或许能看到更多个性化、定制化的人工智能服务,它们将更加贴近我们的需求,让生活变得更加智能和便捷。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/899892.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

基于Python设计的TEQC数据质量可视化分析软件

标题:基于Python设计的TEQC数据质量可视化分析软件 内容:1.摘要 本文旨在设计一款基于Python的TEQC数据质量可视化分析软件。随着全球导航卫星系统(GNSS)的广泛应用,数据质量的评估变得至关重要。TEQC(TransEditQualityCheck&…

Flinksql--订单宽表

参考: https://chbxw.blog.csdn.net/article/details/115078261 (datastream 实现) 一、ODS 模拟订单表及订单明细表 CREATE TABLE orders (order_id STRING,user_id STRING,order_time TIMESTAMP(3),-- 定义事件时间及 Watermark(允许5秒乱序&#x…

粒子滤波介绍

目录 粒子滤波的主要流程可以分为以下 5 个步骤: 粒子滤波(PF) vs. ESKF(误差状态卡尔曼滤波) 粒子滤波的主要流程可以分为以下 5 个步骤: 初始化(Initialization) 生成 N 个粒子&…

一场国际安全厂商的交流会议简记

今天参与了一场国际安全厂商A公司组织的交流会议 与会有国际TOP企业跨境企业 还有国内一些头部商业公司。 A公司很有意思介绍了自己是怎么做安全运营中心SOC的。 介绍了很多内容,包括他们自己的员工量/设备量/事件量/SOC中心人员量,其中人员量只有个位数…

Java面试黄金宝典30

1. 请详细列举 30 条常用 SQL 优化方法 定义 SQL 优化是指通过对 SQL 语句、数据库表结构、索引等进行调整和改进,以提高 SQL 查询的执行效率,减少系统资源消耗,提升数据库整体性能的一系列操作。 要点 从索引运用、查询语句结构优化、数据…

花洒洗澡完毕并关闭后过段时间会突然滴水的原因探究

洗澡完毕后的残留水 在洗澡的过程中,我们通常会使用到大量的水。这些水会通过花洒管子到达花洒顶喷流出。由于大顶喷花洒的喷头较大,关闭后里面的存水会更多。 气压失衡后的滴水 当花洒关闭后,内部的水管和花洒头中仍存有一定量的水。由于…

QSettings用法实战(相机配置文件的写入和读取)

很多情况,在做项目开发的时候,将参数独立出来是比较好的方法 例如:相机的曝光次数、曝光时长等参数,独立成ini文件,用户可以在外面修改即可生效,无需在动代码重新编译等工作 QSettings便可以实现该功能 内…

运维培训班之最佳选择(The best Choice for Operation and Maintenance Training Courses)

运维培训班之最佳选择 从面试官的角度聊聊培训班对运维的帮助,同时给培训班出身的运维一些建议~ 谈到运维(尤其是零基础非科班转行的运维)找工作,培训班是个不可回避的讨论热点。虽然本人也做过兼职运维培训老师,多少…

网络安全与防护策略

随着信息技术的飞速发展,互联网已成为现代社会不可或缺的一部分。从日常生活到企业运营,几乎所有活动都离不开网络。然而,网络的开放性和广泛性也使得网络安全问题愈发严峻。无论是个人数据泄露,还是大规模的网络攻击,…

LLM 分词器Tokenizer 如何从 0 到 1 训练出来

写在前面 大型语言模型(LLM)处理的是人类的自然语言,但计算机本质上只能理解数字。Tokenizer(分词器) 就是架在自然语言和计算机数字表示之间的一座至关重要的桥梁。它负责将我们输入的文本字符串分解成模型能够理解的最小单元——Token,并将这些 Token 转换成对应的数字…

【ArcGIS微课1000例】0142:如何从谷歌地球保存高清影像图片

文章目录 一、选取影像区域1. 搜索地图区域2. 导入矢量范围二、添加输出图层三、保存高清影像1. 地图选项2. 输出分辨率3. 保存图像四、注意事项一、选取影像区域 首先需要选取影像区域,可通过以下方式快速定位。 1. 搜索地图区域 在搜索框内输入关键词,例如青海湖,点击【…

Unity注册表修改分辨率:探索幕后设置与手动调控

Unity注册表修改分辨率:探索幕后设置与手动调控 在Unity开发中,调整分辨率和显示模式是开发过程中常见的需求,尤其是当我们打包并运行应用时,可能会遇到显示模式不符合预期的情况。Unity在首次运行时会自动保存这些设置&#xff…

外部流输入的 Layer

在 Android 的 SurfaceFlinger 体系中,外部流输入的 Layer 通常通过 Sideband Stream 或 BufferQueue 机制传递给 SurfaceFlinger,然后由 HWC(Hardware Composer)或 OpenGL ES 进行合成。 1. 什么是外部流输入的 Layer&#xff1f…

31-体测管理系统

介绍 技术: 基于 B/S 架构 SpringBootMySQLvueelementui 环境: Idea mysql maven jdk1.8 node 用户端功能 1.系统首页展示轮播图及公告信息 2.测试项目:展示可以参加测试的项目列表 3.公告信息:公告信息列表及详情 可进行点赞和收藏 4.在线留言 5.个人…

NVR接入录像回放平台EasyCVR视频系统守护舌尖上的安全,打造“明厨亮灶”云监管平台

一、方案背景 近年来,餐饮行业食品安全和卫生等问题频发,比如后厨卫生脏乱差等,持续引发关注,这些事情导致连锁反应,使其收益遭受损失。同时,给消费者造成了心理和生理上的伤害。 加强餐饮行业的监管成为…

Python办公自动化(3)对Excel的操作

1.读取excel文件 1.安装工具 终端下载读取excel文档的工具库: pip3 install -i https://pypi.tuna.tsinghua.edu.cn/simple xlrd 若对版本有特殊需求: 删除当前版本:pip3 uninstall xlrd 下载所需要的版本:pip3 install -i htt…

go语言:开发一个最简单的用户登录界面

1.用deepseek生成前端页面&#xff1a; 1.提问&#xff1a;请你用html帮我设计一个用户登录页面&#xff0c;要求特效采用科技感的背景渲染加粒子流动&#xff0c;用css、div、span标签&#xff0c;并给出最终合并后的代码。 生成的完整代码如下&#xff1a; <!DOCTYPE h…

blender二次元上色

前&#xff1a; 后&#xff1a;&#xff08;脸自己会发光) 参考&#xff1a;05-模型导入与材质整理_哔哩哔哩_bilibili

Mysql+Demo 获取当前日期时间的方式

记录一下使用Mysql获取当前日期时间的方式 获取当前完整的日期时间有常见的四种方式&#xff0c;获取得到的默认格式(mysql的格式标准)是 %Y-%m-%d %H:%i:%s其它格式 %Y-%m-%d %H:%i:%s.%f方式一&#xff1a;now()函数 select now();mysql> select now(); -------------…

C#核心学习(六)面向对象--封装(5)静态成员及静态构造函数和静态类 以及和常量的区别

目录 一、什么是静态的&#xff1f;什么是常量&#xff1f; 1. ​静态&#xff08;Static&#xff09;​ 2. ​常量&#xff08;const&#xff09;​ 二、类中的静态成员有什么用&#xff1f; 1. ​共享数据 2. ​工具方法与全局配置 3. ​单例模式 三、静态类和静态成…