卷积、卷积图像操作和卷积神经网络

好多内容直接看书确实很难坚持,就比如这个卷积,书上的一大堆公式和图表直接把人劝退,我觉得一般的学习流程应该是自顶向下,先整体后局部,先把握大概再推敲细节的,上来就事无巨细地展示对初学者来说很痛苦。
所以我先把我学习的结果通俗总结一下,卷积是将输入结合其他的节点进行一定处理,从而得到想要的结果,卷积操作多用于图像中,可以实现图像的平滑,特征的提取等。

卷积

数学上表达为积分公式(积分号)f(x)g(n-x)dx
其中f表示为输入,g表示为输出,可以结合问题理解该式的物理意义:
一个人一直进食,其进食数量的曲线就可以表示为f,与此同时也在一直消化食物,且消化速度只按比例,表示为g;问任意时间t胃部食物数量。
一个时刻进食剩余为f(x)g(n-x)//x时刻的进食量乘经过n-x时间的消化率,故在t时刻胃部食物剩余量为上式的积分,f与g的对应关系如下图:
f(x)与g(x)对应关系
卷积的卷应该体现在g的反转上
卷积体现
即,卷积可以用于一个输入不稳定但输出稳定的系统求任意时刻的存量。

图像卷积操作

卷积在实践中的应用主要是用于识别图像内容,在识别之前需要先对图像进行卷积操作,但该操作步骤与上面提到的不同;图像卷积操作是用3×3矩阵与图像进行先乘再加,图像经过处理会缩小一圈,外部直接赋0,过程展示如下:
图像卷积操作
该矩阵称为卷积核,该步骤的作用是将一个像素点与其他的像素点通过卷积核关联起来。
比如每个元素均为1/9也就是平滑卷积核,使用平滑卷积核卷积后的图像会使图像整体更平滑,因为他缩小了像素直接的差距,用平均数来代替。

卷积的另一个作用

通过这个例子我们看出卷积不知用于系统的求存量,在图像中也能通过卷积核时相邻像素点产生关联,此时的f是像素点,卷积核是g,即周围的像素点共同影响当前像素点,而g决定具体如何影响。

图像识别

本来这部分应该叫卷积神经网络的,但是一想神经网络没讲到,只是单单写了最前的一步,还是该叫图像识别吧。
现在的图像验证码们人眼看来识别很简单,但是为什么能防住计算机呢?就是因为他们难以从图像中识别出物体,但随着人工智能的发展,图像识别对计算机来说也是洒洒水了。

图像识别原理

计算机不能像人一样感性推断出图像内容,它们识别物体主要是依赖特征值,比如A上的“尖或者三角”、Z的两个大折线、老虎头上的“王”字等等,甚至目前的人脸识别也是如此,计算机通过特征识别出我们的五官后,对我们的眼距,鼻梁等特征再进行对比从而判断身份。
说着很简单,但每次判断都不简单,不同的字符和事物可能有不同的和相同的特征,这时又该如何是好呢?我看过一篇论文,里面说到每个特征对应一个“特征鬼”,当特征被满足时,该“特征鬼”就会尖叫,又有最上层的决策系统看哪个事物的“鬼”叫的最响来作出判断。

卷积操作提取特征

说白了还是利用卷积核进行操作,只是卷积核的取值发生了变化,比如:

1	  1   1
0	  0	0
-1 -1 -1

作为卷积核,就只提取水平上的特征值,此时卷积核称为水平/垂直过滤器,起到过滤图片保存特征的作用,同理

1  -1  -1
-1  1  -1 
-1  -1  1

可以判断图像是否为一条对角线,等等,从而生成特征矩阵交由后续算法判断。

图像识别卷积总结

实质还是卷积和也就是g的选取,如果g选的合适,就可以把对我们有用的特征保存下来。

总结

归根到底就是f×g,通过对g不同形式不同值的选取,在多角度多维度上筛选f,得到我们想要角度的特征值,再加上求和加权平均消除误差。也难怪人工智能喜欢用,这一个方法就能提取出一个特征值发一篇文章,基于人工智能的······研究,其实就是用个CNN跑出一组数据处理一下,找找关系,下个结论。
讲到这我又要喷人工智能了,在我目前来看,我们对自己意识的研究和脑科学尚不充足完备的情况下,所谓人工智能根本名不副实,现在已有的这些模型不过是基于大数据的统计分类的机器而已。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/154111.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

MAX/MSP SDK学习03:Atoms and Messages的使用

今天终于把Message消息选择器看得有点头绪了,主要是这个官方英文文档理解起来有点抽象。 编写IsMatchABC自定义Object,要求: ①若左入口(入口0)收到 "int" 型消息,则从出口发送数值 "888&q…

51单片机/STM32F103/STM32F407学习1_点亮LED灯

目录: 基础知识单片机从0实现单片机GPIO介绍 参考连接: 野火霸天虎教程 https://doc.embedfire.com/products/link/zh/latest/mcu/stm32/ebf_stm32f407_batianhu_v1_v2/download/stm32f407_batianhu_v1_v2.html x.1 基础知识 x.1.1 指针中的取地址&a…

数据标注:猫目标检测数据集label标签制作

对于猫十二分类数据标注部分,可以使用官方制作的标注软件 下载地址:精灵标注助手-人工智能数据集标注工具 (jinglingbiaozhu.com) 标注图片为150张猫的图片 如下:

qt的信号阻塞与断开

Qt的信号阻塞与断开 场景 临时停止事件处理:一个实时图形界面中,当进行复杂的操作时,你可能需要暂时停止一些实时更新的信号,以避免过多的 Ui 刷新。优化性能:在一个实时数据处理应用中,当数据处理压力大…

Camera2的使用【详细】

目录 1.获取权限 2. 获取指定相机ID (1)获取相机管理者CameraManager (2)获取相机ID列表 (3)获取相机特征CameraCharacteristics (4)获取相机朝向 3.获取相机输出尺寸 (1)根据相机ID获取相机特征 (2)获取输出流配置StreamConfigurationMap (3)获取输出尺寸数组(参数为…

java智慧校园信息管理系统源码带微信小程序

一、智慧校园的定义 智慧校园指的是以云计算和物联网为基础的智慧化的校园工作、学习和生活一体化环境。以各种应用服务系统为载体,将教学、科研、管理和校园生活进行充分融合,让校园实现无处不在的网络学习、融合创新的网络科研、透明高效的校务治理、…

如何保护PayPal账户安全:防止多个PayPal账号关联?

PayPal是一家全球领先的在线支付平台,已经成为全球最受欢迎的在线支付工具之一,广泛应用于电子商务、跨境交易和个人之间的付款,很多跨境卖家的支付平台都会选择PayPal。PayPal支持全球多个国家和20多种货币在线支付,并且能即时收…

适合学校或高校老师、学生学习用的网盘推荐

现代教育中,数字化的教学资源和家长的参与度越来越重要。然而文件传输的问题一直是学校和家长面临的一个挑战,网络限制、U盘病毒和文件管理不便等问题,都对教学质量和家校沟通造成了影响。Zoho WorkDrive企业网盘为学校还有教辅机构提供了一个…

基于单片机智能液位水位监测控制系统设计

**单片机设计介绍, 基于单片机智能液位水位监测控制系统设计 文章目录 一 概要二、功能设计设计思路 三、 软件设计原理图 五、 程序六、 文章目录 一 概要 基于单片机的智能液位水位监测控制系统可以用来检测和控制液位的高低,并可以用于水泵的控制和自…

拼多多商品详情api接口

pdd的反爬虫机制十分严,而很多时候,没办法高效的拿到数据内容响应终端需求,而依赖爬虫就会造成动不动就出现滑块验证,让人很无解,正好,公司有这样的需求,让我负责解决这个问题,刚开始…

键鼠自动化2.0展示

软件介绍:桌面键鼠自动化工具 Qtc 编写: 本软件采用Qt C编写,旨在提供高效、跨平台的桌面键鼠自动化解决方案。Qt C框架的选择确保了软件的稳定性、可靠性,并通过其图形用户界面实现了用户友好的操作体验。 鼠标移动与点击&#…

亚马逊车灯外贸出口CE认证标准办理解析

车灯是车辆夜间行驶在道路照明的工具,也是发出各种车辆行驶信号的提示工具。车灯一般分为前照灯、尾灯、转向灯等。车灯出口欧盟需要办理CE认证。 CE认证是欧盟对进入欧洲市场的产品强制性的认证标志,是指符合欧盟安全、健康、环境保护等标准和要求的产…

中国城镇化时空分异及影响因素数据集(2010-2020)

基于《中国统计年鉴》、各省份统计年鉴及EPS全球统计数据库等相关统计数据,从人居生活、人文环境、人城关系等维度界定了城镇化内涵框架与指标体系,利用改进的熵值法计算综合评价指数,并运用泰尔指数、方差分解及地理探测器等方法&#xff0c…

java参数传递

1、传递方式 参数传递有两种方式:值传递和引用传递。 值传递:这是 Java 中默认的参数传递方式。当参数以基本数据类型(如 int、char、boolean 等))或不可变对象(如String、整数数组等)的形式传…

【Android Jetpack】理解ViewModel

文章目录 ViewModel实现ViewModelViewModel的生命周期在Fragments间分享数据ViewModel和SavedInstanceState对比ViewModel原理ViewModel与AndroidViewModel ViewModel Android系统提供控件,比如Activity和Fragment,这些控件都是具有生命周期方法&#x…

Playcanvas后处理-辉光bloom

(一)Bloom介绍 Bloom(辉光、光晕、泛光)是一种常见的摄像机后处理(PostProcessing)效果,用于再现真实世界相机的成像伪影。这种效果会产生从图像中明亮区域边界延伸的光条纹(或羽毛…

flink1.10袋鼠云 迁移 flink1.15原生环境 事项汇总

表DDL(平台自动生成)修改适配 1 DDL语法不通用 (袋鼠云DDL中支持给别名 DDL采用数据中台生成的模板,并把老版本DDL中的配置通过到相应参数中) 2 袋鼠云DDL支持给别名 sql中字段和DDL中字段不一致. 两种解决方案: 1 FlinkSQL别名语法和袋鼠云略不同 袋鼠云DDL: parseJson(parseJ…

Altium Designer学习笔记2

原理图的绘制 需要掌握的是系统自带原理图库元件的添加。

SQL Server - 使用 Merge 语句实现表数据之间的对比同步

在SQL server (2008以上版本)中当需要将一个表(可能另一个库)中数据同步到另一个表中时,可以考虑使用merge语句。 只需要提供: 1.目标表 (target table) 2.数据源表 (source table) …

[WUSTCTF 2020]level2 脱壳

这里我们发现ida打开后是有报错的 所以猜测是否有壳 所以我们去看看是否有壳 发现去壳了 然后再放到IDA中看即可