图像识别利用计算机对图像进行,图像识别方法

图像识别,是指利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对像的技术。图像识别是人工智能的一个重要领域。主要的图像识别方法有基于神经网络的图像识别方法、基于小波矩的图像识别方法等。

中文名

图像识别方法

外文名

image recognition method

学    科领    域

人工智能

模    型

模板匹配模型、原型匹配模型

主要方法

神经网络

图像识别方法基本概念

编辑

语音

图像识别,是指利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对像的技术。一般工业使用中,采用工业相机拍摄图片,然后再利用软件根据图片灰阶差做进一步识别处理,图像识别软件国外代表的有康耐视等,国内代表的有图智能等。另外在地理学中指将遥感图像进行分类的技术。

图形刺激作用于感觉器官,人们辨认出它是经验过的某一图形的过程,也叫图像再认。在图像识别中,既要有当时进入感官的信息,也要有记忆中存储的信息。只有通过存储的信息与当前的信息进行比较的加工过程,才能实现对图像的再认。

图像识别是人工智能的一个重要领域。为了编制模拟人类图像识别活动的计算机程序,人们提出了不同的图像识别模型。例如模板匹配模型、原型匹配模型。

图像识别方法识别基础

编辑

语音

图像识别可能是以图像的主要特征为基础的。每个图像都有它的特征,如字母A有个尖,P有个圈、而Y的中心有个锐角等。对图像识别时眼动的研究表明,视线总是集中在图像的主要特征上,也就是集中在图像轮廓曲度最大或轮廓方向突然改变的地方,这些地方的信息量最大。而且眼睛的扫描路线也总是依次从一个特征转到另一个特征上。由此可见,在图像识别过程中,知觉机制必须排除输入的多余信息,抽出关键的信息。同时,在大脑里必定有一个负责整合信息的机制,它能把分阶段获得的信息整理成一个完整的知觉映象。

在人类图像识别系统中,对复杂图像的识别往往要通过不同层次的信息加工才能实现。对于熟悉的图形,由于掌握了它的主要特征,就会把它当作一个单元来识别,而不再注意它的细节了。这种由孤立的单元材料组成的整体单位叫做组块,每一个组块是同时被感知的。在文字材料的识别中,人们不仅可以把一个汉字的笔划或偏旁等单元组成一个组块,而且能把经常在一起出现的字或词组成组块单位来加以识别。

在计算机视觉识别系统中,图像内容通常用图像特征进行描述。事实上,基于计算机视觉的图像检索也可以分为类似文本搜索引擎的三个步骤:提取特征、建索引build以及查询。

图像识别方法模型

编辑

语音

图像识别是人工智能的一个重要领域。为了编制模拟人类图像识别活动的计算机程序,人们提出了不同的图像识别模型。

(1)模板匹配模型

这种模型认为,识别某个图像,必须在过去的经验中有这个图像的记忆模式,又叫模板。当前的刺激如果能与大脑中的模板相匹配,这个图像也就被识别了。例如有一个字母A,如果在脑中有个A模板,字母A的大小、方位、形状都与这个A模板完全一致,字母A就被识别了。这个模型简单明了,也容易得到实际应用。但这种模型强调图像必须与脑中的模板完全符合才能加以识别,而事实上人不仅能识别与脑中的模板完全一致的图像,也能识别与模板不完全一致的图像。例如,人们不仅能识别某一个具体的字母A,也能识别印刷体的、手写体的、方向不正、大小不同的各种字母A。同时,人能识别的图像是大量的,如果所识别的每一个图像在脑中都有一个相应的模板,也是不可能的。

(2)原型匹配模型

为了解决模板匹配模型存在的问题,格式塔心理学家又提出了一个原型匹配模型。这种模型认为,在长时记忆中存储的并不是所要识别的无数个模板,而是图像的某些“相似性”。从图像中抽象出来的“相似性”就可作为原型,拿它来检验所要识别的图像。如果能找到一个相似的原型,这个图像也就被识别了。这种模型从神经上和记忆探寻的过程上来看,都比模板匹配模型更适宜,而且还能说明对一些不规则的,但某些方面与原型相似的图像的识别。但是,这种模型没有说明人是怎样对相似的刺激进行辨别和加工的,它也难以在计算机程序中得到实现。因此又有人提出了一个更复杂的模型,即“泛魔”识别模型。

一般工业使用中,采用工业相机拍摄图片,然后利用软件根据图片灰阶差做处理后识别出有用信息,图像识别软件国外代表的有康耐视等,国内代表的有图智能等。

图像识别方法研究现状

编辑

语音

图像识别的发展经历了三个阶段:文字识别、数字图像处理与识别、物体识别。文字识别的研究是从 1950年开始的,一般是识别字母、数字和符号,从印刷文字识别到手写文字识别, 应用非常广泛。

数字图像处理和识别的研究开始于1965年。数字图像与模拟图像相比具有存储,传输方便可压缩、传输过程中不易失真、处理方便等巨大优势,这些都为图像识别技术的发展提供了强大的动力。物体的识别主要指的是对三维世界的客体及环境的感知和认识,属于高级的计算机视觉范畴。它是以数字图像处理与识别为基础的结合人工智能、系统学等学科的研究方向,其研究成果被广泛应用在各种工业及探测机器人上。现代图像识别技术的一个不足就是自适应性能差,一旦目标图像被较强的噪声污染或是目标图像有较大残缺往往就得不出理想的结果。

图像识别问题的数学本质属于模式空间到类别空间的映射问题。在图像识别的发展中,主要有三种识别方法:统计模式识别、结构模式识别、模糊模式识别。图像分割是图像处理中的一项关键技术,自20世纪70年代,其研究已经有几十年的历史,一直都受到人们的高度重视,至今借助于各种理论提出了数以千计的分割算法,而且这方面的研究仍然在积极地进行着。

现有的图像分割的方法有许多种,有阈值分割方法,边缘检测方法,区域提取方法,结合特定理论工具的分割方法等。从图像的类型来分有:灰度图像分割、彩色图像分割和纹理图像分割等。早在1965年就有人提出了检测边缘算子,使得边缘检测产生了不少经典算法。但在近二十年间,随着基于直方图和小波变换的图像分割方法的研究计算技术、VLSI技术的迅速发展,有关图像处理方面的研究取得了很大的进展。图像分割方法结合了一些特定理论、 方法和工具,如基于数学形态学的图像分割、基于小波变换的分割、基于遗传算法的分割等。

图像识别方法主要方法

编辑

语音

图像识别方法基于神经网络

人工神经网络方法实现模式识别,可处理一些环境信息十分复杂,背景知识不清楚,推理规则不明确的问题,允许样品有较大的缺损、畸变,神经网络方法的缺点是其模型在不断丰富完善中,能识别的模式类还不够多,神经网络方法允许样品有较大的缺损和畸变,其运行速度快,自适应性能好,具有较高的分辨率。

神经网络的图像识别系统是神经网络模式识别系统的一种,原理是一致的。一般神经网络图像识别系统由预处理,特征提取和神经网络分类器组成。预处理就是将原始数据中的无用信息删除,平滑,二值化和进行幅度归一化等。神经网络图像识别系统中的特征提取部分不一定存在,这样就分为两大类:

①有特征提取部分的:这一类系统实际上是传统方法与神经网络方法技术的结合,这种方法可以充分利用人的经验来获取模式特征以及神经网络分类能力来识别目标图像。特征提取必须能反应整个图像的特征。但它的抗干扰能力不如第2类。

②无特征提取部分的:省去特征抽取,整副图像直接作为神经网络的输入,这种方式下,系统的神经网络结构的复杂度大大增加了,输入模式维数的增加导致了网络规模的庞大。此外,神经网络结构需要完全自己消除模式变形的影响。但是网络的抗干扰性能好,识别率高。

当BP网用于分类时,首先要选择各类的样本进行训练,每类样本的个数要近似相等。其原因在于一方面防止训练后网络对样本多的类别响应过于敏感,而对样本数少的类别不敏感。另一方面可以大幅度提高训练速度,避免网络陷入局部最小点[1]

图像识别方法基于小波矩

将输入二维二值图像的不变矩作为识别特征,运用BP网络进行识别,将输入图像经过归一化处理,极坐标化,旋转不变小波矩特征提取后,送入BP网络分类器进行识别,获得识别结果。

基于小波矩的图像识别方法的特点如下:

(1)小波矩特征对具有平移、缩放和旋转的样本具有良好的分辨能力,在未加噪声的情况下,小波矩特征都能正确分辨测试样本,识别率优于几何矩,差距达到30个百分点。

(2)随着添加随机噪声,两种矩特征的识别率都有所下降,但由于小波矩具有较好的提取图像局部特征能力,所以小波矩的识别率下降相对缓慢.最高正确识别率达到98%。

(3)小波矩特征较为稳定。几何矩的分辨能力有时不能随着特征数的增加而稳定,这样需要较多的分辨特征的情况下是不利的。而小波矩虽然也有一定波动,但波动幅度有限,其判别精度整体为稳定增加趋势[2]

图像识别方法基于分形特征

一般认为:自然纹理图像满足分形特性,可以提取其分形特征以供进一步的纹理分割、目标识别等,而人造目标图像是不满足分形特性的,不可以提取其分形特征。基于分形特征的红外图像识别方法步骤如下:

(1)红外图像预处理

由于探测器本身固有的特性,红外热图像普遍存在目标与背景对比度较差,图像边缘模糊,噪声较大等缺点,因此必须进行预处理,以增强其对比度。

(2)红外图像分形特征提取

分别提取提取基于分形维数的特征、基于Hurst指数的分形特征、基于缝隙(lacunarity)的分形特征。

(3)基于神经网络的红外图像识别

人工神经网络是进行目标识别(包括图像识别)的强有力工具。它通过对原始数据的训练,获得最佳的权系数,取得很好的识别结果[3]

词条图册

更多图册

参考资料

1.

彭淑敏, 王军宁. 基于神经网络的图像识别方法[J]. 电子科技, 2005(1):39-42.

2.

张虹, 陈文楷. 一种基于小波矩的图像识别方法[J]. 北京工业大学学报, 2004, 30(4):427-431.

3.

李宏贵, 李国桢. 基于分形特征的红外图像识别方法[J]. 红外与激光工程, 1999, 28(1):20-24.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/506504.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

linux将db2账户添加到组_超实用的shell脚本--Linux安全加固设置,值得收藏

概述近几年来Internet变得更加不安全了。网络的通信量日益加大,越来越多的重要交易正在通过网络完成,与此同时数据被损坏、截取和修改的风险也在增加。 只要有值得偷窃的东西就会有想办法窃取它的人。Internet的今天比过去任何时候都更真实地体现出这一点…

微型计算机指令系统例题,微机原理复习题(指令系统)

微机原理复习题(指令系统)《微机原理》复习题二一、选择题1、假设外部设备的状态字已经读入AL寄存器,其中最低位为"0",表示外部设备"忙", 为了判断外部设备是否"忙"而又不破坏其它状态位,应选用下列( )组指令。A. RCR AL, 01H JZ Label B. CMP A…

迷你世界无人驾驶地铁火车_出口伊斯坦布尔地铁列车“云下线”

轨道世界 RailWorld开放|共享|价值导读 ID:RailWorld出口伊斯坦布尔地铁列车“云下线”全自动无人驾驶,全寿命远程跟踪、诊断和维护,全车内循环感应系统,极具土耳其风情的外观及内饰……7月14日&#xff0c…

易安卓 html5,Developing a Multi Platforms Web Applications for Mobile Device Using HTML5

摘要:As the mobile phone has become more mature, the continuous development of both hardware and software has become increasingly popular. Nowadays the need to develop mobile application that can run over multi-platform is an essential problem b…

java: 程序包com.github.pagehelper不存在_Rust语言正在兴起,Java、Python、C的末日来临?...

您可能从未用Mozilla创建的开源,系统级编程语言Rust编写任何东西,但是您可能会在某个时候写。在Stack Overflow的2019年开发人员调查中,开发人员将Rust评为“最受欢迎的”语言,而Redmonk在半年的语言排名中,Rust 跻身前…

计算机应用与网络文化,计算机文化与应用基础

全国计算机等级考试一级(2013年版)教学用书。主要介绍了计算机基础概述、中文Windows 7 操作、计算机网络基础、中文Word 2010操作、中文Excel 2010操作、中文PowerPoint 2010操作等内容。书 名计算机文化基础(Windows 7Office 2010)作 者李淑华ISBN978-7-04-037945-7页 …

惠安七号机器人创意园_我是F518创意园,请为我投票!

春去秋来,一个轮回又一年。“ 你知道F518创意园开园多久了吗?对的,13年!”作为深圳实施“腾笼换鸟”首批项目和深圳申请联合国科教文组织“设计之都”重要组成部分,我们开园至今已经13年了!白驹过隙&#x…

好看的按钮html,html-好看的CSS按钮

该楼层疑似违规已被系统折叠 隐藏此楼查看此楼CSS实现的几个非常漂亮的按钮--建站学.btn {BORDER-RIGHT: #7b9ebd 1px solid; PADDING-RIGHT: 2px; BORDER-TOP: #7b9ebd1px solid; PADDING-LEFT: 2px; FONT-SIZE: 12px; FILTER:progid:DXImageTransform.Microsoft.Gradient(Gra…

开设计算机应用基础这门学科意义,计算机应用基础与专业课程整合思考.doc

计算机应用基础与专业课程整合思考计算机应用基础与专业课程整合思考[摘 要]在职业学校中,计算机应用基础作为一门公共必修课,其教学内容对很多专业课都具有极高的应用价值。做好计算机应用基础与专业课程的整合,可以有效地促进学生对专业知识…

c++ 获取文件夹创建时间_手把手教学免费创建个人网站

点击蓝字关注我们可以不成材 不能不成长!给大家分享一个非常有用的skill——在GitHub上免费创建个人网站。什么是GitHubGitHub是一个面向开源及私有软件项目的托管平台,因为只支持git 作为唯一的版本库格式进行托管,故名GitHub。在GitHub上…

能被计算机硬件理解的语言,(计算机原理综合练习一含答案.doc

(计算机原理综合练习一含答案计算机原理综合练习一一、填空题:1、计算机中的主机分为 和 。2、计算机软件系统分为 和 。3、计算机与其它计算工具最大的区别是 。4、(23.75)10( )8( )165、反码真值 和补码为 。6、一条完整的指令由 、 两部分组成。7、随机存储器又分…

centos7.4安装mysql5.7_centos7.4三种方式安装mysql5.7

三种方式安装 mysql二进制 rpm 安装 mysql5.7.21下载 yum repository[rootapenglinux-002 yum.repos.d]# yum -y install https://dev.mysql.com/get/mysql57-community-release-el7-11.noarch.rpm[rootapenglinux-002 yum.repos.d]# yum clean all[rootapenglinux-002 yum.rep…

量子计算机通用程序,基于拓扑量子纠错码的量子计算机,量子计算机程序具有通用性?...

不管量子计算机的内部是由什么组成,量子计算机的快速计算都可以归结为应用于量子比特的简单指令序列,即量子计算机内部的基本信息单位。无论这台计算机是由离子链、超导体结还是硅片组成,事实证明,一次只影响一个或两个量子比特的…

中兴f650是千兆的吗_装宽带送的光猫自带WiFi功能,我还需要买路由器吗?

想必很多家里装过宽带的朋友都想过一个问题,网线入户需要一个光猫,还需要一个路由器,可不可以将两个设备合二为一,或者只用光猫发射WiFi信号行吗?其实是可以的,但为了更好的体验教授建议还是不要这样做。设…

武大计算机几天出录取结果,录取大概要几天 多久录取结果出来

3-5天。有的投档次日就能出来,有的到该批次录取结束才出来。关键看录取人数和报名人数多少。工作量大的就慢,工作量小的就快。但是一定会在这个批次结束前出来。录取结果大概需要几天才能知道这个没有具体的时间,因为各省市填报志愿的时间和批…

github 私有化部署_2019,GitHub 宣布私有代码仓库从此免费!

微软收购 GitHub 后,官方宣布了一项重大更新:免费开放私有代码库,即 GitHub 用户现在可以免费创建无限量的私有存储库。同时还有另一项更新——GitHub Enterprise,结合了企业云(原GitHub Business Cloud)和企业服务器(原GitHub En…

计算机内部运算的部件是什么意思,运算器是执行什么和什么运算的部件

大家好,我是时间财富网智能客服时间君,上述问题将由我为大家进行解答。运算器是各种算术和逻辑运算操作的部件。运算器(arithmetic unit)是计算机中执行各种算术和逻辑运算操作的部件。运算器的处理对象是数据,所以数据长度和计算机数据表示方…

平移刚体上各点的加速度和速度_物理-力学|第七讲|刚体力学

刚体运动学刚体模型刚体是一个特殊的质点系, 刚体上任意两质点间距离保持不变。刚体模型可以看成是现实中劲度系数极大的物体的抽象化,这类物体本身的形变对其运动的影响可以忽略,比如一个篮球,当其与地面碰撞时必然会产生形变&am…

浙江大学计算机专业介绍,浙江大学计算机科学与技术专业课程设置

匿名用户1级2014-11-15 回答你好我是浙江大学大四的学生我帮你查询了下最新的2009年的培养计划*培养目标培养基础宽厚,知识、能力、素质俱佳,富有创新精神和创新能力,具有全球化视野,在计算机科学与技术专业及其相关领域具有国际竞…

改变定时器获取传感器频度_称重传感器在高速定量分装系统的应用

高速定量分装系统由微机控制称重传感器的称重和比较,并输出控制信号,执行定值称量,控制外部给料系统的运转,实行自动称量和快速分装的任务。  系统采用MCS-51单片机和V/F电压频率变换器等电子器件,其硬件电路框图如图…