AI+时代,谈谈产品经理对图像识别技术的阈值控制

AI+时代,谈谈产品经理对图像识别技术的阈值控制

产品满足用户的需求有一个阈值,产品值低于阈值用户会觉得了无生趣,即产品一般般,也即产品经理做了功能经理。产品值等于阈值产品功能基本满足了用户的需求,而只有产品经理驾驭了需求,把产品做成作品,产品值才有可能高于阈值,任何时候产品经理应该学习到高于需求阈值的产品方法论。AI+时代图片识别技术就是起点!

撰写本篇的目的:

当下每天看的到一个词:AI,满眼皆是AI的阶段,我们产品经理应该如何了解到AI的技术脉络和市场需求大势。AI不是新的概念,再次起来是因为有新的突破。

创新工场的李开复博士说现在是技术从业者创新的时代,那么我们产品经理究竟知道AI的哪些技术呢,本篇着重分析一下AI+时代的图像识别技术。

在AI领域之中,图像识别技术占据着极为重要的地位,而随着计算机技术与信息技术的不断发展,AI中的图像识别技术的应用范围不断扩展,如LineLian所见过的IBM的Watson医疗诊断、各种指纹识别、及常用的支付宝的面部识别以及百度地图中全景卫星云图识别等都属于这一应用的典型,AI这一技术已经应用于日常生活之中,图像识别技术将来定会有着较为广泛的运用,而为了保证AI中的图像识别技术能够较好地服务于AI+时代的几个重要产品领域,正是本篇就AI中的图像识别技术展开具体研讨的目的所在。

图像识别概况:

为了较好完成产品经理理解AI中的图像识别技术的本源,我们首先需要深入了解图像识别技术。作为智能领域的重要组成部分,图像识别的发展先后经历了文字识别、数字图像处理与识别、物体识别三个发展阶段,而在AI+时代的图像识别技术中,其本身所具备的功能早已超过了人类的极限,这也是AI的图像识别技术能够在各个垂直产品领域实现较好应用并几乎成为标配的原因所在。

最开始产品经理要明白图像识别技术本身的原理并不算太过复杂,信息的处理是这一技术的关键点所在,由于应用计算机实现的图像识别技术本身与人眼识别并不存在着本质的差别,这就使得图像识别技术同样需要根据自身对图像的记忆完成具体的识别工作。

在人类进行图像识别的过程中,人类的大脑会将图像的特征进行提取,并结合大脑中以往对各类图像的认知判断自身是否对图像存在过印象,这就是人们能够在观看一张图片后快速对其识别的原因所在。结合人类识别图像的原理,在计算机进行的图像识别中,计算机首先就能够完成图像分类并选出重要信息、排除冗余信息,根据这一分类计算机就能够结合自身记忆存储结合相关要求进行图像的识别,这一过程本身与人脑识别图像并不存在着本质差别。

对于图像识别技术来说,其本身提取出的图像特征直接关系着图像识别能否取得较为满意的结果。值得注意的是,由于计算机归根结底不同于人类的大脑,所以计算机提取出的图像特征存在着不稳定性,这种不稳定性往往会因为计算机提取图像特征的明显与普通影响图像识别的效率与准确性,由此可见图像特征对于AI中图像识别技术的重要意义。

图像识别分析:

对于当下AI+时代的图像识别技术来说,神经网络的图像识别技术与非线性降维的图像识别技术是最为常见的两种图像识别技术,LineLian将对两种常见的AI图像识别技术进行详细分析。

一、神经网络的图像识别技术

想要深入了解非线性降维的图像识别技术,我们就必须理解何为神经网络,这里的神经网络全称人工神经网络,其本身指的是在现代神经生物学研究基础上提出的模拟生物过程以反映人脑某些特性的计算结构,虽然我们使用了模拟这一名词,但事实上神经网络本身并没有完全模仿人类的神经网络,其本身只是通过对人类神经网络的抽象、简化和模拟实现相关计算结构效率的提升。

对于神经网络的图像识别技术来说,其能够实现图像的识别主要得益于神经网络学习算法的运用,而在应用神经网络进行的图像识别中,我们首先需要对相关图像进行预处理,这一预处理主要包括真彩色图像转换为灰度图、灰度图像的旋转与放大、灰度图像的归一化等内容。为了保证神经网络能够较好地实现图像识别,我们还需要针对图像识别的领域与对象完成具体的神经网络设计,这一设计主要包括以下五方面:

  • 输入层设计

  • 隐含层设计

  • 输出层设计

  • 初始权值的选取

  • 期望误差的选取

在输入层设计中,我们需要根据图像识别对象的需要确定求解的问题与数据表示方式,而在本篇进行的研究中,为了我们产品经理理解,LineLian将输入层统一设计为16×16图像样本尺寸缩放大小,256 维网络输入需要;而在隐含层的设计中,我们需要确定隐含层的数目与隐含层单元数的选择,当下业界已经确定了隐含层神经元数目的增加能够保证误差精度的降低,所以适当时候增加隐层数目就能够较好地完成神经网络的设计,而在隐含层单元数的选择中,我们可以参考经验公式 L=√M+N +a,L=log2N,这样就能够有效避免神经网络泛化能力较弱,对于训练外样本识别率降低的问题出现,公式中的 M 代表的是输出层神经元数目,而 N 则代表输入层神经元数目。

值得注意的是,通过删除那些影响较小的隐含层单元能够较好地提高神经网络的自身性能,但结构选定花费时间较长是这一方法的缺陷所在;在输出层的设计中,一般会选择多输出型作为神经网络的设计;而在初始权值的选取中,为了满足神经网络在学习过程中的较好收敛,初始权值一般选为(-1,1)之间的随机数;而在期望误差的选取中,其本身需要参考训练时间与预期误差值,这里LineLian选择 0.001 作为期望误差值。

在完成神经网络的设计后,我们还需要进行神经网络的训练才能够保证其较好的满足图像识别需求,为了保证这一设计的较好实现,LineLian选择在 MATLAB7.0 中使用函数 newff创建一个两层网络,这一网络包括 1 个输出神经元、16×16 个输入、26 个单元的隐含层,学习函数则选择了 learngdm,初始学习速率为 0.01 ~ 0.6、训练性能函数“mse”、训练指标 0.001、训练最大循环 2500。

在完成上述提到的神经网络设计与训练后,我们就可以着手对其进行应用实验,在这一实验中笔者应用这一神经网络对 26 个手写英文字母的图片进行了识别,下表 为这一识别的识别结果,结合该表我们能够发现,不同节点数目会直接影响神经网络图像识别的识别率,而 26 个隐含层节点数能够较好满足图像识别的需求,下图为隐含层为 26 时神经网络训练的误差性能曲线及训练时间。

结合这一结果我们可以断定,神经网络识别技术能够较好满足手写字母的识别,其本身在这一识别的过程中体现了准确、快速、较强抗干扰能力等特点,这些特点使得其本身能够凭借着学习算法较好地应用到更多复杂的图像识别中,更好地为我们垂直领域的产品提供服务。

AI+时代,谈谈产品经理对图像识别技术的阈值控制

AI+时代,谈谈产品经理对图像识别技术的阈值控制

二、非线性降维的图像识别技术

除了神经网络的图像识别技术外,非线性降维的图像识别技术也是当下AI时代较为常用的图像识别技术形式。对于传统应用计算机实现的图像识别技术来说,其本身属于较为高维的识别技术,这种高维特性使得计算机往往在图像识别的过程中承担着很多不必要的负担,这种负担自然会影响图像识别的速度与质量,非线性降维的图像识别技术就是能够较好实现图像识别降维的技术形式。

在非线性降维的图像识别技术出现前,业界最常采用的是线性降维的图像识别技术,这种技术本身具备着简单易于理解的优点,但在实际应用中人们发现,线性降维的图像识别技术存在着计算复杂度高且占用相对较多的时间和空间特性,也使得线性降维的图像识别技术不能够较好地满足各产品领域图像识别的需要。对于非线性降维的图像识别技术来说,其本身能够在不破坏图像结构的前提下实现其自身的降维这就使得图像识别技术的识别速度与精度能够实现较好的提升。

例如在人脸识别系统中,以往受图像维度较高的影响,人类识别系统往往需要耗费大量的时间,计算机系统也往往会受到较大的“摧残”,这主要是由于人脸在高纬度空间中存在的分布不均匀特性所致,而在应用非线性降维的图像识别技术后,人脸图形就能够较好地实现自身的紧凑,这就使得人脸识别系统的工作效率大大提升,总的来说非线性降维的图像识别技术能够较好地为图像识

别提供辅助,上文中LineLian提到的神经网络的图像识别技术,也能够在非线性降维的图像识别技术的支持下更好地完成自身工作。

图像识别技术的对产品领域的应用

随着智能网络中的AI技术不断发展,其本身将在产品数据安全、AI+医疗产品、AI+直播产品、AI+社交产品等垂直领域产生重要的产品应用。

之前人机围棋大战,最终人类顶尖棋手李世石以 1:4 不敌 Google 出品的人工智能 AlphaGo。其核心原理采用了多层神经网络对图像进行分析,同时运用深度学习算法总结规律,最终得出战胜人类高手的棋招。

图像鉴别,10000 个场控都干不来互联网的开放不仅带来了自由,同样也成为垃圾信息的温床。最为人熟知的一个职位叫做“鉴黄师”,代表人物自然是“唐马儒”,但实际上“唐马儒”再多也满足不了现在对于图像鉴别和挖掘的需求。最好的例子就是前不久爆出的“直播造人”,视频和直播类内容的兴起使得对内容的鉴定需求呈几何倍数增长。

直播对于审核的实时性要求太高,同时在线的直播数量大,一不小心违规的东西就上线了。传统的解决方案是通过人力完成,所需要的人数会与主播成一个比例。通常都是好几百人坐在屏幕前面持续对闪过的画面进行筛选,如果发现不符合规定就进行人工处理。而AI+时代的产品趣向是利用AI图像识别技术。

另外在公共安全领域中,人脸识别产品的应用就能够较好的提高市场社会的安全性与便利性;而在医学领域中,心电图与 B 超的识别将大大促进用户医疗事业的便捷;而在农业领域中,种子识别科技产品与食品品质检测科技产品的应用将大大提高农产品的生产质量,例如我家种了几十亩葡萄 葡萄需要剪枝 修果 摘叶需要很多的劳动力, 感觉很多环节可以通过图像识别的机器来处理,粒径不同的果粒,大小不一的叶片,高度不同的枝条,我总觉得可以通过图像对比来区分,筛选,这样的AI图像识别机器人才是刚性需求。

在日常生活中图像识别技术在冰箱中的运用将大大提高用户生活的便利性,这一应用能够实现自动冰箱食品列表生成、食品保鲜状态的显示、食物最佳储存温度的判断等功能,这些将大大提高用户的生活品质。在未来科学技术的不断发展中,AI的图像识别技术还将实现更为长足的发展,而这一发展也将能够更好地接受图像识别技术产品所带来的服务,最终大大提高用户的生活质量。

作为一门科技含量较高的新兴技术,AI的图像识别技术已经与用户的生活紧密结合在一起,而为了保证其能够更好的为用户提供服务,对于科技网络从业紧密相关的产品技术人员就必须大力推进AI图像识别技术产品的不断学习与创新,这对于我们产品经理未来创造的很多产品息息相关并将提高产品效率和切中用户对产品的刚性需求。

产品思维是抓住机遇,需求一旦过气了或者被竞争对手超越了产品想胜出是是十分困难的,只能跟随市场的步伐去追市场的需求而迭代。而AI+时代的产品经理应该有的思维模式是作品思维,不仅仅是追随需求,更多的是锤炼过滤并真金不怕火炼般的引领需求的潮流。

雷锋网(公众号:雷锋网)按:本文由 @连诗路 前阿里产品专家原创发布于人人都是产品经理。未经许可,禁止转载。


本文作者:人人都是产品经理
本文转自雷锋网禁止二次转载,原文链接

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/289676.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

利用html5看雪花飘落的效果

html5飘落的雪花堆积动画特效 <!DOCTYPE html> <html> <head> <meta http-equiv"Content-Type" content"text/html; charsetutf-8"/> <title>下雪了&#xff0c;我们去堆雪人好吗&#xff1f; </title><base targe…

【亲身经验】如何在 6 个月内成为“微软 MVP”

前言很荣幸&#xff0c;在愚人节这天&#x1f601;&#xff0c;收到了获得“微软 MVP”奖项的通知&#xff1a;由于该奖项评选标准只涉及 2021 年所做的贡献&#xff0c;而我的贡献主要是公众号文章。因此以我从 2021/06 开始运营个人公众号算起&#xff0c;可以说&#xff0c;…

从listView1中选择记录到listView2中

1.自定义Worker字段类 public class SelectWorker{public int WorkerID;public string WkName;} 2.定义全局变量 List<SelectWorker> wkList0 = new List<SelectWorker>();List<SelectWorker> wkList1 = new List<SelectWorker>();List<SelectWorke…

3500个常用汉字表_小学常用560个汉字笔画笔顺表,打印下来,小学六年慢慢练...

温馨提示公众号改版后很多孩子及家长朋友找不到我们了为了方便大家更快地找到我们获取更多学习工具和资料您可以按照下面的方式 星标或置顶我们☟ ☟ ☟小学阶段&#xff0c;字写得好很重要&#xff0c;笔顺写对了也很重要。写对笔顺有利于把字写得美观&#xff0c;考试时碰到笔…

java之wait()、notify()实现非阻塞的生产者和消费者

一、对于wait()和notify()的解释 void notify()Wakes up a single thread that is waiting on this object’s monitor.唤醒等待获取锁资源的单个线程void notifyAll()Wakes up all threads that are waiting on this object’s monitor.唤醒等待获取锁资源的所有线程void wait…

大数据先行 传统金融转型需从体制上创新

经过几年发展&#xff0c;互联网金融成为金融行业一股鲜活的力量。同时&#xff0c;行业也意识到&#xff0c;这条鲶鱼不会在大众市场对银行构成威胁。日前&#xff0c;德勤的一份报告也指出&#xff0c;P2P的市场价值高达1800亿美元&#xff0c;但并没有在成本、风险和速度上对…

oracle存档模式,Oracle的备份和存档模式

Oracle的备份和存档模式在做硬件升级前必须要将数据库做一次全备份&#xff0c;以便在出现不可预料的情况下进行恢复&#xff0c;全备份的方法有多种&#xff0c;以下列举两种简单高效的逻辑备份和冷备份&#xff0c;在数据库可以宕机的条件下&#xff0c;推荐使用冷备份&#…

SVN安装和使用总结

SVN简介&#xff1a; 为什么要使用SVN&#xff1f; 程序员在编写程序的过程中&#xff0c;每个程序员都会生成很多不同的版本&#xff0c;这就需要程序员有效的管理代码&#xff0c;在需要的时候可以迅速&#xff0c;准确取出相应的版本。 Subversion是什么&#xff1f; 它是一…

从部署 httpd 入手,理清 k8s 配置中的 containerPort、port、nodePort、targetPort

注&#xff1a;文中各种内网、公网 IP 仅为示例&#xff0c;不保证所有 IP 都可以访问&#xff0c;且你的环境中 IP 可能不同。背景在上一篇文章 自己搭建一个k8s环境 中&#xff0c;我们一顿操作猛如虎&#xff0c;搭建出了由 1 个 master 和 1 个 worker 节点组成的 k8s 集群…

C#正则表达式判断输入的是不是数字

1.函数 public static bool IsFloat(string str){string regextext "^(-?\d)(\.\d)?$";Regex regex new Regex(regextext, RegexOptions.None);return regex.IsMatch(str.Trim());} 2.调用if (!IsFloat(textBox11.Text)){MessageBox.Show("应该是一个数字&q…

分享几个拉钩网的前端页面

http://c.lagou.com/allMarch/warmup/index.html?fromsinglemessage&isappinstalled0 http://c.lagou.com/careerism/invitation.html?fromgroupmessage&amp;isappinstalled0&scene4转载于:https://blog.51cto.com/snaile/1616398

Andorid之用ConditionVariable实现线程同步

一、学习ConditionVariable之前的复习 如果你不懂wait()、notify()怎么使用&#xff0c;最好先复习下我之前的这篇博客&#xff0c;怎么使用wait()、notify()实现生产者和消费者的关系 java之wait()、notify()实现非阻塞的生产者和消费者 二、看下ConditionVariable源代码实现…

360文件粉碎机_中山三乡资料文件销毁粉碎销毁资料文件公司一览表

中山三乡资料文件销毁粉碎销毁资料文件公司一览表安排搬运工作人员及运输车辆上门收取销毁物品&#xff0c;将需销毁的物品装上运输车辆&#xff0c;并进行拍照、车箱粘贴封条等工作。第五步&#xff1a;客户可安排工作人员&#xff0c;跟我公司销毁运输车辆一同前往我公司销毁…

Sonnedix收购意大利11.2MW光伏电站产品组合

2016年9月5日, 太阳能独立发电商Sonnedix宣布已经在意大利获得Trading Emissions 的11.2MW太阳能光伏电站产品组合&#xff0c;此交易预计将在2016年第四季度关闭。 该产品组合包括三个地面安装光伏电站: 阿布鲁佐的Basciano和Cupello、以及西西里岛的Librandello。 Sonnedix在…

oracle中行数少于1000,oracle中in的个数超过1000的解决办法

oracle中in的个数要是超过1000就会报错&#xff0c;那么我们可以把它拆成一节一节的&#xff1a;in(1,2) or in (3,4)StringUtils.defaultIfEmpty的命名空间是&#xff1a;import org.apache.commons.lang.StringUtils;private String getOracleSQLIn(List> ids, int count,…

SQL Server 2005更改当前数据库的所有者

语法 sp_changedbowner [ @loginame = ] login[ , [ @map= ] remap_alias_flag ] 参数 [ @loginame = ] login 当前数据库的新所有者的登录 ID。login 的数据类型为 sysn

Xamarin效果第十七篇之AR GIS

在前面几篇文章中简单玩耍了一下在线、离线加载高德地图和添加Mark;今天在原来的基础上再去玩玩AR GIS;来看看最终效果:1、先通过NuGet引用:Install-Package Esri.ArcGISRuntime.ARToolkit.Forms -Version 100.13.02、在AndroidManifest.xml中配置:<application android:lab…

maven 多项目搭建

参考http://www.cnblogs.com/xdp-gacl/p/3498271.html 。 1.什么是maven maven是基于项目对象模型(POM)&#xff0c;是跨平台的管理工具&#xff0c;主要服务于java平台的项目构建&#xff0c;依赖管理和项目信息管理。 2.maven的好处 Maven中使用约定&#xff0c;约定java源代…

IOS之学习笔记四(类的实现和对象和id)

1、简单构建类和对象和id使用的测试代码如下 Person.h #ifndef Person_h #define Person_h#import <Foundation/Foundation.h> interface Person : NSObject {NSString* _name;int _age; } -(void)setName:(NSString *)name addAge:(int)age; -(void)say:(NSString *)c…