生命在于学习——Python人工智能原理(3.4)

在这里插入图片描述

三、深度学习

7、过拟合与欠拟合

过拟合和欠拟合是所有机器学习算法都要考虑的问题。

(1)基本定义

a、欠拟合

欠拟合是指机器学习模型无法完全捕获数据集中的复杂模式,导致模型在新数据上的表现不佳,这通常是由于模型过于简单或不够复杂,无法充分利用数据集中的特征进行训练。
欠拟合的原因可能有:

  1. 模型复杂度不足
  2. 特征选择不当
  3. 数据预处理不当
  4. 数据量不足
  5. 训练不足

b、过拟合

过拟合是机器学习中的一个常见问题,它发生在模型过于复杂,以至于在训练数据上表现的非常好,但在新的、未见过的数据上表现不佳时,过拟合的模型对训练数据中的细节和噪声非常敏感,并可能将这些细节和噪声作为一般规则来学习,导致在测试数据上的泛化能力下降。
过拟合的原因可能包括:
1.模型复杂度过高
2.训练数据不足
3.数据分布不均或存在噪声
4.训练时间过长

c、平衡

在机器学习中,平衡是指找到一个合适的模型复杂度,既能避免欠拟合,又能防止过拟合,从而实现模型在训练数据和测试数据上的良好表现。
为了平衡模型的性能,可以考虑以下几个方面:
1.选择合适的模型
2.调整模型复杂度
3.正则化
4.早停法
5.数据增强与选择
6.交叉验证
7.集成学习
8.监控性能指标

(2)处理方法

a、欠拟合解决办法

1.增加特征数量
2.增加模型复杂度
3.减少正则化参数
4.增加训练数据
5.改进特征工程
6.使用更复杂的算法
7.使用集成学习

b、过拟合解决办法

1.权值衰减
2.提前停止训练
3.正则化
4.减少模型参数
5.Dropout
6.数据增强
7.决策树剪枝
8.交叉验证

8、卷积神经网络

卷积神经网络是一类包含卷积计算且具有深度结果的前馈神经网络,是深度学习的代表算法之一。卷积神经网络具有表征学习能力,能够按照其阶层结构对输入信息进行平移不变分类,因此也被成为平移不变人工神经网络。
卷积神经网络仿照生物的视知觉机制创建,可以进行监督学习与非监督学习,其卷积核参数共享和层间连接的稀疏性使得卷积神经网络能够以较小的计算量对格点化特征,如像素和音频进行学习,效果较好且没有额外的特征工程要求。

(1)卷积神经网络的结构

主要分为输入层、卷积层、池化层、全连接层、分类层等。

a、输入层

输入层是整个神经网络的输入,在处理图像的卷积神经网络中,它一般代表了一张图片的像素矩阵。其中三维矩阵的长和宽代表了图像的大小,深度代表了图像的色彩通道,从输入层开始,卷积神经网络通过不同的神经网络架构将上一层的三维矩阵转换为下一层的三维矩阵,直到最后的全连接层。

b、卷积层

卷积层是一个网络最重要的部分,卷积层试图将神经网络中的每小块进行更加深入的分析从而获得抽象度更高的特征。

c、池化层

池化层神经网络不会改变三维矩阵的深度,但是它可以缩小矩阵的大小,通过池化层可以进一步缩小最后全连接层中节点的个数,从而达到减小整个神经网络参数的目的。

d、全连接层

在经过多轮卷积和池化之后,在卷积神经网络的最后一班有1-2个全连接层给出最后的分类结果,经过几轮卷积和池化之后,可以认定图像中的信息已经被抽象成信息含量更高的特征。

e、Softmax层

Softmac层主要用于分类问题,通过Softmax层可以得到当前输出属于不同种类的概率分布情况。该层主要采用Softmax函数,又称归一化指数函数,是对数概率回归在C个不同值上的推广,公式如下:
在这里插入图片描述

其中,C表示神经网络输出层的输出数量,i表示输出层第i个输出,oi表示第i个输出值,e表示自然常数,∑c j=1 e-oj表示所有神经元输出值的对数概率函数之和。
Python实现代码如下:
def softmax(x):
exp_x = np.exp(x)
return exp_x/np.sum(exp_x)

(2)卷积的相关计算

a、重要参数介绍

卷积核大小
卷积核一班宽和高都比较小,如果输入是图片,宽高一般相同。
卷积核数量
卷积核数量即卷积产生的通道数,不同卷积核在输入数据中寻找不相同的特征,一般卷积核数量大于输入通道数,并且随着卷积的进行卷积核数量越来越多。
步长
在滑动卷积核时,必须制定步长,步长为1,是指卷积核每次移动1个像素,步长为2,是指每次移动2个像素。
零填充
有时候将输入数据用0在边缘处进行填充是很方便的。零填充的尺寸是一个超参数,零填充有一个良好性质,即可以控制输出数据的空间尺寸。

b、参数量及特征图计算

假设输入数据维度为WxHxCin,卷积核尺寸KxK,步长S,卷积核数量Cout,零填充数量为P,则特征图的宽W2,高H2,深D2,计算公式分别为:
W2=H2=(W-K+2P)/S+1
D2=Cout

c、池化层计算

池化层可以有效缩小矩阵尺寸,从而减小全连接层的参数数量,加快计算速度的同事有效防止过拟合问题。
最常用的池化方式是最大池化和平均池化,池化操作只减小矩阵的宽和高,不减少矩阵的深度。

d、全连接层计算

全连接层不保存分类信息,在整个卷积神经网络中起到分类器的作用。
下面为全连接层的计算过程,设x1,x2,x3为全连接层的输入,a1,a2,a3为输出,则有:
在这里插入图片描述

假设全连接层的输入维度是800,输出维度是500,则:
1、Loss对全连接的输入求导,如下:
在这里插入图片描述

2、Loss对权重系数求导:
在这里插入图片描述

3、对偏置系数b求导:

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/26820.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C++进阶,一文带你彻底搞懂左右值引用以及移动语义和完美转发!

目录 一、左值引用1.左值2.左值引用3.左值引用的用途(1)修改实参(2)减少拷贝(3)使用左值引用可以在外部修改对象内的成员变量的值 二、右值引用1.右值(1)纯右值(2&#x…

一文解答 | 代码签名证书怎么选

在当代软件开发中,代码签名证书对于确保软件的完整性、安全性及其可信度至关重要。它通过数字签名验证代码的来源和未被篡改的状态,向最终用户确保软件的可靠性。选择合适的代码签名证书既有利于保护软件开发商的声誉,也有助于建立用户对软件…

虚拟化 之三 详解 jailhouse(ARM 平台)的构建过程、配置及使用

嵌入式平台下,由于资源的限制,通常不具备通用性的 Linux 发行版,各大主流厂商都会提供自己的 Linux 发行版。这个发行版通常是基于某个 Linux 发行版构建系统来构建的,而不是全部手动构建,目前主流的 Linux 发行版构建系统是 Linux 基金会开发的 Yocto 构建系统。 基本环…

ChatGPT:自然语言处理的新纪元与OpenAI的深度融合

随着人工智能技术的蓬勃发展,自然语言处理(NLP)领域取得了显著的进步。OpenAI作为这一领域的领军者,以其卓越的技术实力和创新能力,不断推动着NLP领域向前发展。其中ChatGPT作为OpenAI的重要成果更是在全球范围内引起了…

go interface

package mainimport "fmt"// 接口 interface func main() {c : Chinese{} //创建一个中国人实例u : American{} //创建一个美国人实例greet(c) //中国人打招呼greet(u) //美国人打招呼 }// 接收具备SayHello接口能力的变量 func greet(s SayHello) {…

Vertical Layout 、Horizontal Layout 实验窗体自适应布局

实验目的 学习实验使用布局实现如下自适应界面 窗体邮件,布局设置为垂直布局 用同样的方法,添加groupbox,并右键设置为水平布局 拖入一个Horizontal Layout,然后拖入button,拖入 Horizontal Spacer 遇到一个问题&#…

如何将ai集成到radsystems项目中,在项目中引入ai

AI可以自动化重复性和低价值的任务,例如数据输入、文档处理、信息检索等,让员工能够专注于更具战略性和创造性的工作。通过引入AI驱动的聊天机器人或虚拟助手,可以提供24/7的客户支持,快速响应用户的问题,提高客户满意…

卡塔尔.巴林:海外媒体投放-宣发.发稿效果显著提高

引言 卡塔尔和巴林两国积极采取措施,通过海外媒体投放和宣发,将本国的商业新闻和相关信息传达给更广泛的受众。在这一过程中,卡塔尔新闻网、巴林商业新闻和摩纳哥新闻网等媒体起到了关键作用。通过投放新闻稿,这些国际化的媒体平…

CBoard开源数据可视化工具

CBoard开源数据可视化工具 文章目录 CBoard开源数据可视化工具介绍资源列表基础环境一、安装JDK二、安装Maven2.1、安装Maven2.2、配置Maven 三、安装Tomcat8四、安装MySQL5版本4.1、安装相关依赖4.2、二进制安装4.3、设定配置文件4.4、配置systemcatl方式启动4.5、访问MySQL数…

VMware安装ubuntu22.4虚拟机超详细图文教程

一 、下载镜像 下载地址:Index of /ubuntu-releases/22.04.4/ | 清华大学开源软件镜像站 | Tsinghua Open Source Mirror 二、创建虚拟机 打开VMware点击左上角文件,创建新的虚拟机,打开后如下图: 下一步,镜像文件就是…

超市陈列艺术:不仅仅是货品摆放,更是营销策略的体现

品类管理在门店落地的最直观表现就是单品的空间陈列管理,通过陈列细节的差异体现出门店的商品定位与策略。此文分析入木三分,值得学习。 在商品陈列的空间管理领域,不仅要考虑整体的空间陈列,也要对每个商品的空间陈列位置&#…

做了2年前端,盘点前端技术栈!大佬轻喷~

前言 自己写了快两年前端,但是大致总结一下哈哈哈哈我觉得这个话题蛮有意思的,可以看看大家的技术广度,可以进行分享和学习以及讨论所以这里说一下我对我的前端技术,做一下盘点和总结因为我的开发年限有限,所以我觉得…

焦化行业排放平台简介

在当今社会,环保事业日益受到人们的关注。焦化行业作为重要的工业领域之一,其排放问题一直是环保工作的重点。为了有效控制焦化行业的排放,实施焦化行业排放平台成为了必不可少的措施。朗观视觉小编将详细探讨焦化行业排放平台的实施范围&…

【复旦邱锡鹏教授《神经网络与深度学习公开课》笔记】线性分类模型损失函数对比

本节均以二分类问题为例进行展开&#xff0c;统一定义类别标签 y ∈ { 1 , − 1 } y\in\{1,-1\} y∈{1,−1}&#xff0c;则分类正确时 y f ( x ; w ) > 0 yf(x;w)>0 yf(x;w)>0&#xff0c;且值越大越正确&#xff1b;错误时 y f ( x ; w ) < 0 yf(x;w)<0 yf(x;…

ubtun虚拟机安装

选择镜像后启动 选择第一个回车 加载完成后 &#xff0c;进入Ubuntu安装界面&#xff0c;安装语言选择English&#xff0c;完成后按一下回车&#xff1a; 此时弹出安装器可更新提示&#xff0c;下方选项选择第二个Continue without updating&#xff08;不更新&#xff0c;继续…

升级和维护老旧LabVIEW程序

在升级老旧LabVIEW程序至64位环境时&#xff0c;需要解决兼容性、性能和稳定性等问题。本文从软件升级、硬件兼容性、程序优化、故障修复等多个角度详细分析。具体包括64位迁移注意事项、修复页面跳转崩溃、解决关闭程序后残留进程的问题&#xff0c;确保程序在新环境中的平稳运…

k8s中的pod域名解析失败定位案例

问题描述 我在k8s中启动了一个Host网络模式的pod&#xff0c;这个pod的域名解析失败了。 定位步骤 敲kubectl exec -it [pod_name] -- bash进入pod后台&#xff0c;查看/etc/resolv.conf&#xff0c;发现nameserver配的有问题。这里我预期的nameserver应该使用宿主机的&…

亚马逊跟卖选品不再迷茫,适合跟卖卖家得一款选品软件工具!

对于刚开始做跟卖的卖家而言&#xff0c;刚开始最头疼的应该就是选品了吧&#xff0c;不知道跟卖什么产品&#xff0c;不是知道怎么有效的选择跟卖产品&#xff0c;所以很多卖家都会借助&#xff0c;选品软件来进行选品&#xff0c;这样不仅能提高选品的效率&#xff0c;还能帮…

人工智能的社会应用:深刻变革的新浪潮

人工智能的社会应用&#xff08;语言文本方面&#xff09; 人工智能在社会应用中的广泛运用体现在多个领域&#xff0c;特别是在语音和文本处理方面。以下是这些技术的一些扩展&#xff1a; 1. 文本翻译&#xff1a; 谷歌翻译&#xff1a;利用深度学习模型&#xff0c;支持100多…

pom学习笔记:kimi的自动化操作

1.先看结构&#xff1a; 声明&#xff1a;我是初学&#xff0c;可能有不合理的地方。 2.Base层。 我是把原来一个kimi的自动问答的代码改过来。 分析&#xff1a;其实我是新手&#xff0c;因为我用的浏览器是固定的&#xff0c;也没有打算和别人用。所以浏览器层面年的全部写…