AI+时代,谈谈产品经理对图像识别技术的阈值控制

AI+时代,谈谈产品经理对图像识别技术的阈值控制

产品满足用户的需求有一个阈值,产品值低于阈值用户会觉得了无生趣,即产品一般般,也即产品经理做了功能经理。产品值等于阈值产品功能基本满足了用户的需求,而只有产品经理驾驭了需求,把产品做成作品,产品值才有可能高于阈值,任何时候产品经理应该学习到高于需求阈值的产品方法论。AI+时代图片识别技术就是起点!

撰写本篇的目的:

当下每天看的到一个词:AI,满眼皆是AI的阶段,我们产品经理应该如何了解到AI的技术脉络和市场需求大势。AI不是新的概念,再次起来是因为有新的突破。

创新工场的李开复博士说现在是技术从业者创新的时代,那么我们产品经理究竟知道AI的哪些技术呢,本篇着重分析一下AI+时代的图像识别技术。

在AI领域之中,图像识别技术占据着极为重要的地位,而随着计算机技术与信息技术的不断发展,AI中的图像识别技术的应用范围不断扩展,如LineLian所见过的IBM的Watson医疗诊断、各种指纹识别、及常用的支付宝的面部识别以及百度地图中全景卫星云图识别等都属于这一应用的典型,AI这一技术已经应用于日常生活之中,图像识别技术将来定会有着较为广泛的运用,而为了保证AI中的图像识别技术能够较好地服务于AI+时代的几个重要产品领域,正是本篇就AI中的图像识别技术展开具体研讨的目的所在。

图像识别概况:

为了较好完成产品经理理解AI中的图像识别技术的本源,我们首先需要深入了解图像识别技术。作为智能领域的重要组成部分,图像识别的发展先后经历了文字识别、数字图像处理与识别、物体识别三个发展阶段,而在AI+时代的图像识别技术中,其本身所具备的功能早已超过了人类的极限,这也是AI的图像识别技术能够在各个垂直产品领域实现较好应用并几乎成为标配的原因所在。

最开始产品经理要明白图像识别技术本身的原理并不算太过复杂,信息的处理是这一技术的关键点所在,由于应用计算机实现的图像识别技术本身与人眼识别并不存在着本质的差别,这就使得图像识别技术同样需要根据自身对图像的记忆完成具体的识别工作。

在人类进行图像识别的过程中,人类的大脑会将图像的特征进行提取,并结合大脑中以往对各类图像的认知判断自身是否对图像存在过印象,这就是人们能够在观看一张图片后快速对其识别的原因所在。结合人类识别图像的原理,在计算机进行的图像识别中,计算机首先就能够完成图像分类并选出重要信息、排除冗余信息,根据这一分类计算机就能够结合自身记忆存储结合相关要求进行图像的识别,这一过程本身与人脑识别图像并不存在着本质差别。

对于图像识别技术来说,其本身提取出的图像特征直接关系着图像识别能否取得较为满意的结果。值得注意的是,由于计算机归根结底不同于人类的大脑,所以计算机提取出的图像特征存在着不稳定性,这种不稳定性往往会因为计算机提取图像特征的明显与普通影响图像识别的效率与准确性,由此可见图像特征对于AI中图像识别技术的重要意义。

图像识别分析:

对于当下AI+时代的图像识别技术来说,神经网络的图像识别技术与非线性降维的图像识别技术是最为常见的两种图像识别技术,LineLian将对两种常见的AI图像识别技术进行详细分析。

一、神经网络的图像识别技术

想要深入了解非线性降维的图像识别技术,我们就必须理解何为神经网络,这里的神经网络全称人工神经网络,其本身指的是在现代神经生物学研究基础上提出的模拟生物过程以反映人脑某些特性的计算结构,虽然我们使用了模拟这一名词,但事实上神经网络本身并没有完全模仿人类的神经网络,其本身只是通过对人类神经网络的抽象、简化和模拟实现相关计算结构效率的提升。

对于神经网络的图像识别技术来说,其能够实现图像的识别主要得益于神经网络学习算法的运用,而在应用神经网络进行的图像识别中,我们首先需要对相关图像进行预处理,这一预处理主要包括真彩色图像转换为灰度图、灰度图像的旋转与放大、灰度图像的归一化等内容。为了保证神经网络能够较好地实现图像识别,我们还需要针对图像识别的领域与对象完成具体的神经网络设计,这一设计主要包括以下五方面:

  • 输入层设计

  • 隐含层设计

  • 输出层设计

  • 初始权值的选取

  • 期望误差的选取

在输入层设计中,我们需要根据图像识别对象的需要确定求解的问题与数据表示方式,而在本篇进行的研究中,为了我们产品经理理解,LineLian将输入层统一设计为16×16图像样本尺寸缩放大小,256 维网络输入需要;而在隐含层的设计中,我们需要确定隐含层的数目与隐含层单元数的选择,当下业界已经确定了隐含层神经元数目的增加能够保证误差精度的降低,所以适当时候增加隐层数目就能够较好地完成神经网络的设计,而在隐含层单元数的选择中,我们可以参考经验公式 L=√M+N +a,L=log2N,这样就能够有效避免神经网络泛化能力较弱,对于训练外样本识别率降低的问题出现,公式中的 M 代表的是输出层神经元数目,而 N 则代表输入层神经元数目。

值得注意的是,通过删除那些影响较小的隐含层单元能够较好地提高神经网络的自身性能,但结构选定花费时间较长是这一方法的缺陷所在;在输出层的设计中,一般会选择多输出型作为神经网络的设计;而在初始权值的选取中,为了满足神经网络在学习过程中的较好收敛,初始权值一般选为(-1,1)之间的随机数;而在期望误差的选取中,其本身需要参考训练时间与预期误差值,这里LineLian选择 0.001 作为期望误差值。

在完成神经网络的设计后,我们还需要进行神经网络的训练才能够保证其较好的满足图像识别需求,为了保证这一设计的较好实现,LineLian选择在 MATLAB7.0 中使用函数 newff创建一个两层网络,这一网络包括 1 个输出神经元、16×16 个输入、26 个单元的隐含层,学习函数则选择了 learngdm,初始学习速率为 0.01 ~ 0.6、训练性能函数“mse”、训练指标 0.001、训练最大循环 2500。

在完成上述提到的神经网络设计与训练后,我们就可以着手对其进行应用实验,在这一实验中笔者应用这一神经网络对 26 个手写英文字母的图片进行了识别,下表 为这一识别的识别结果,结合该表我们能够发现,不同节点数目会直接影响神经网络图像识别的识别率,而 26 个隐含层节点数能够较好满足图像识别的需求,下图为隐含层为 26 时神经网络训练的误差性能曲线及训练时间。

结合这一结果我们可以断定,神经网络识别技术能够较好满足手写字母的识别,其本身在这一识别的过程中体现了准确、快速、较强抗干扰能力等特点,这些特点使得其本身能够凭借着学习算法较好地应用到更多复杂的图像识别中,更好地为我们垂直领域的产品提供服务。

AI+时代,谈谈产品经理对图像识别技术的阈值控制

AI+时代,谈谈产品经理对图像识别技术的阈值控制

二、非线性降维的图像识别技术

除了神经网络的图像识别技术外,非线性降维的图像识别技术也是当下AI时代较为常用的图像识别技术形式。对于传统应用计算机实现的图像识别技术来说,其本身属于较为高维的识别技术,这种高维特性使得计算机往往在图像识别的过程中承担着很多不必要的负担,这种负担自然会影响图像识别的速度与质量,非线性降维的图像识别技术就是能够较好实现图像识别降维的技术形式。

在非线性降维的图像识别技术出现前,业界最常采用的是线性降维的图像识别技术,这种技术本身具备着简单易于理解的优点,但在实际应用中人们发现,线性降维的图像识别技术存在着计算复杂度高且占用相对较多的时间和空间特性,也使得线性降维的图像识别技术不能够较好地满足各产品领域图像识别的需要。对于非线性降维的图像识别技术来说,其本身能够在不破坏图像结构的前提下实现其自身的降维这就使得图像识别技术的识别速度与精度能够实现较好的提升。

例如在人脸识别系统中,以往受图像维度较高的影响,人类识别系统往往需要耗费大量的时间,计算机系统也往往会受到较大的“摧残”,这主要是由于人脸在高纬度空间中存在的分布不均匀特性所致,而在应用非线性降维的图像识别技术后,人脸图形就能够较好地实现自身的紧凑,这就使得人脸识别系统的工作效率大大提升,总的来说非线性降维的图像识别技术能够较好地为图像识

别提供辅助,上文中LineLian提到的神经网络的图像识别技术,也能够在非线性降维的图像识别技术的支持下更好地完成自身工作。

图像识别技术的对产品领域的应用

随着智能网络中的AI技术不断发展,其本身将在产品数据安全、AI+医疗产品、AI+直播产品、AI+社交产品等垂直领域产生重要的产品应用。

之前人机围棋大战,最终人类顶尖棋手李世石以 1:4 不敌 Google 出品的人工智能 AlphaGo。其核心原理采用了多层神经网络对图像进行分析,同时运用深度学习算法总结规律,最终得出战胜人类高手的棋招。

图像鉴别,10000 个场控都干不来互联网的开放不仅带来了自由,同样也成为垃圾信息的温床。最为人熟知的一个职位叫做“鉴黄师”,代表人物自然是“唐马儒”,但实际上“唐马儒”再多也满足不了现在对于图像鉴别和挖掘的需求。最好的例子就是前不久爆出的“直播造人”,视频和直播类内容的兴起使得对内容的鉴定需求呈几何倍数增长。

直播对于审核的实时性要求太高,同时在线的直播数量大,一不小心违规的东西就上线了。传统的解决方案是通过人力完成,所需要的人数会与主播成一个比例。通常都是好几百人坐在屏幕前面持续对闪过的画面进行筛选,如果发现不符合规定就进行人工处理。而AI+时代的产品趣向是利用AI图像识别技术。

另外在公共安全领域中,人脸识别产品的应用就能够较好的提高市场社会的安全性与便利性;而在医学领域中,心电图与 B 超的识别将大大促进用户医疗事业的便捷;而在农业领域中,种子识别科技产品与食品品质检测科技产品的应用将大大提高农产品的生产质量,例如我家种了几十亩葡萄 葡萄需要剪枝 修果 摘叶需要很多的劳动力, 感觉很多环节可以通过图像识别的机器来处理,粒径不同的果粒,大小不一的叶片,高度不同的枝条,我总觉得可以通过图像对比来区分,筛选,这样的AI图像识别机器人才是刚性需求。

在日常生活中图像识别技术在冰箱中的运用将大大提高用户生活的便利性,这一应用能够实现自动冰箱食品列表生成、食品保鲜状态的显示、食物最佳储存温度的判断等功能,这些将大大提高用户的生活品质。在未来科学技术的不断发展中,AI的图像识别技术还将实现更为长足的发展,而这一发展也将能够更好地接受图像识别技术产品所带来的服务,最终大大提高用户的生活质量。

作为一门科技含量较高的新兴技术,AI的图像识别技术已经与用户的生活紧密结合在一起,而为了保证其能够更好的为用户提供服务,对于科技网络从业紧密相关的产品技术人员就必须大力推进AI图像识别技术产品的不断学习与创新,这对于我们产品经理未来创造的很多产品息息相关并将提高产品效率和切中用户对产品的刚性需求。

产品思维是抓住机遇,需求一旦过气了或者被竞争对手超越了产品想胜出是是十分困难的,只能跟随市场的步伐去追市场的需求而迭代。而AI+时代的产品经理应该有的思维模式是作品思维,不仅仅是追随需求,更多的是锤炼过滤并真金不怕火炼般的引领需求的潮流。

雷锋网(公众号:雷锋网)按:本文由 @连诗路 前阿里产品专家原创发布于人人都是产品经理。未经许可,禁止转载。


本文作者:人人都是产品经理
本文转自雷锋网禁止二次转载,原文链接

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/289676.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【亲身经验】如何在 6 个月内成为“微软 MVP”

前言很荣幸,在愚人节这天😁,收到了获得“微软 MVP”奖项的通知:由于该奖项评选标准只涉及 2021 年所做的贡献,而我的贡献主要是公众号文章。因此以我从 2021/06 开始运营个人公众号算起,可以说,…

3500个常用汉字表_小学常用560个汉字笔画笔顺表,打印下来,小学六年慢慢练...

温馨提示公众号改版后很多孩子及家长朋友找不到我们了为了方便大家更快地找到我们获取更多学习工具和资料您可以按照下面的方式 星标或置顶我们☟ ☟ ☟小学阶段,字写得好很重要,笔顺写对了也很重要。写对笔顺有利于把字写得美观,考试时碰到笔…

SVN安装和使用总结

SVN简介: 为什么要使用SVN? 程序员在编写程序的过程中,每个程序员都会生成很多不同的版本,这就需要程序员有效的管理代码,在需要的时候可以迅速,准确取出相应的版本。 Subversion是什么? 它是一…

从部署 httpd 入手,理清 k8s 配置中的 containerPort、port、nodePort、targetPort

注:文中各种内网、公网 IP 仅为示例,不保证所有 IP 都可以访问,且你的环境中 IP 可能不同。背景在上一篇文章 自己搭建一个k8s环境 中,我们一顿操作猛如虎,搭建出了由 1 个 master 和 1 个 worker 节点组成的 k8s 集群…

360文件粉碎机_中山三乡资料文件销毁粉碎销毁资料文件公司一览表

中山三乡资料文件销毁粉碎销毁资料文件公司一览表安排搬运工作人员及运输车辆上门收取销毁物品,将需销毁的物品装上运输车辆,并进行拍照、车箱粘贴封条等工作。第五步:客户可安排工作人员,跟我公司销毁运输车辆一同前往我公司销毁…

Sonnedix收购意大利11.2MW光伏电站产品组合

2016年9月5日, 太阳能独立发电商Sonnedix宣布已经在意大利获得Trading Emissions 的11.2MW太阳能光伏电站产品组合,此交易预计将在2016年第四季度关闭。 该产品组合包括三个地面安装光伏电站: 阿布鲁佐的Basciano和Cupello、以及西西里岛的Librandello。 Sonnedix在…

oracle中行数少于1000,oracle中in的个数超过1000的解决办法

oracle中in的个数要是超过1000就会报错,那么我们可以把它拆成一节一节的:in(1,2) or in (3,4)StringUtils.defaultIfEmpty的命名空间是:import org.apache.commons.lang.StringUtils;private String getOracleSQLIn(List> ids, int count,…

Xamarin效果第十七篇之AR GIS

在前面几篇文章中简单玩耍了一下在线、离线加载高德地图和添加Mark;今天在原来的基础上再去玩玩AR GIS;来看看最终效果:1、先通过NuGet引用:Install-Package Esri.ArcGISRuntime.ARToolkit.Forms -Version 100.13.02、在AndroidManifest.xml中配置:<application android:lab…

maven 多项目搭建

参考http://www.cnblogs.com/xdp-gacl/p/3498271.html 。 1.什么是maven maven是基于项目对象模型(POM)&#xff0c;是跨平台的管理工具&#xff0c;主要服务于java平台的项目构建&#xff0c;依赖管理和项目信息管理。 2.maven的好处 Maven中使用约定&#xff0c;约定java源代…

rog live service是什么_双11手机怎么买?ROG游戏手机3“独一份”体验,值得剁手...

对于追求极致的手游党来说&#xff0c;手机设备性能的强悍极为重要&#xff0c;毕竟时刻影响着流畅性与游戏体验。纵观当下手机厂商推出的游戏手机来看&#xff0c;ROG游戏手机3可以说是目前性能最强的游戏手机&#xff0c;在下半年发布的多款旗舰均没能领先过ROG。这也证明了我…

SQL Server 2005将某些数据库行为设置为与指定的 SQL Server 版本兼容

语法 sp_dbcmptlevel [ [ dbname ] name ] [ , [ new_cmptlevel ] version ]参数 [ dbname ] name要为其更改兼容级别的数据库的名称。数据库名称必须符合标识符的规则。name 的数据类型为 sysname&#xff0c;默认值为 NULL。 [ new_cmptlevel ] version数据库要与之兼容的…

oracle 优化分组 sql语句,Oracle SQL语句之常见优化方法 五

0、低效SQL语句查询:SELECT b.sql_text, --SQL內容a.sid,a.serial#,a.status,a.machine, --哪台机器運行的SQLa.username, --用戶a.module, --運行方式a.action, --Responsibilityc.opname,c.target,c.message,c.sofar totalwork * 100, --工作執行了百分之多少c.elapsed_secon…

我将 20 年前开发的操作系统迁移到 .NET 6,竟然成功了!

作者 | Scott Hanselman译者 | 弯月早在2001年&#xff0c;我用C#为学校的一门300系列的操作系统课程编写了一个微型虚拟操作系统&#xff0c;后来在2002年将其移植到了VB.NET。这些都是在.NET Core出现之前的代码&#xff0c;基于Windows早期的.NET 1.1或2.0。五年前&#xff…

bzoj2132: 圈地计划

要分成两坨对吧。。 所以显然最小割 但是不兹辞啊。。 最小割是最小的啊 求最大费用怎么玩啊 那咱们就把所有费用都加起来&#xff0c;减掉一个最小的呗 但是两个属于不同集合的点贡献的价值是负的啊 网络流怎么跑负的啊 那咱就交换一下呗 原图是二分图啊&#xff0c;把另一部分…

BEVFormerV2 论文阅读

论文链接 BEVFormer v2: Adapting Modern Image Backbones to Bird’s-Eye-View Recognition via Perspective Supervision 0. Abstract 提出了一种新颖的 BEV 检测器&#xff0c;具有透视监督&#xff0c;收敛速度更快&#xff0c;更适合现代图像基础架构优先考虑通过引入透…

光磁记录实现数据冷存储

通过一定强度的短脉冲可以在掺杂了钴离子的钇铁石榴石的磁性层上记录数据。据开发商介绍&#xff0c;这种新颖的光学存储机制有可能成为一种通用的、节能型数据存储技术&#xff0c;并替代现有的存储技术&#xff0c;这源于该技术能够完成超低热度的快速磁盘读写过程&#xff0…

aop在项目中的实际运用_【消防验收】防火玻璃在实际运用中的四大关键问题

扫码入群&#xff0c;与消防企业同行交流&#xff01;防火玻璃虽然开始在建筑中大量使用&#xff0c;但如何正确使用防火玻璃&#xff0c;使用哪种类型的防火玻璃&#xff0c;哪些部位可以使用防火玻璃等问题在实际运用中仍有很多盲区。同时&#xff0c;很多建设单位、设计单位…

CondenserDotNet - 使用 Kestrel 和 Consul 的 API 反向代理库!

简介CondenserDotNet - 使用 Kestrel 和 Consul 的 API 反向代理库&#xff01;特点•Consul 客户端库&#xff0c;包括服务注册、发现和配置•反向代理•交互式 UI&#xff0c;用于查看有关代理的统计信息配置示例配置遵循 LIFO 策略&#xff0c;以最后注册的配置为准var conf…

pdf转tiff

概述 基于Java&#xff0c;将pdf转成单一的tiff文件。 MAVEN依赖 <groupId>com.sun.media</groupId><artifactId>jai_codec</artifactId><version>1.1-mr</version> </dependency> <dependency><groupId>javax.media<…