八、神经网络

一、为啥要有神经网络?

在前面的几篇博客中,很容易知道我们处理的都是线性的数据,例如:线性回归和逻辑回归,都是线性的算法
但是,实际上日常生活中所遇到的数据或者问题绝大多数还是非线性的
一般面对非线性数据,我们可以采用多项式回归进行处理,详细内容可以参考博文:五、线性回归和多项式回归实现
说白了就是改变横纵坐标,是得数据线性化。例如:工资和年龄呈抛物线关系,但是工资和年龄的平方则呈线性关系,此时就可以将年龄的平方作为变量进行线性处理。

神经网络是非线性的算法!!!
为啥捏?
在这里插入图片描述
举个栗子:
当你传入x1,x2,x3三个数据时,对应三个权重参数,代入求和,即得到Σ,这一步是线性的,得到z
关键点来了!!!f为激活函数,这个函数很关键,因为它不是线性函数!!!
常用的激活函数有很多,这里假设使用的激活函数为sigmoid函数,将求和的值代入sigmoid函数中得y,由于激活函数是非线性的,z是线性的,代入得到的最终的结果y肯定是非线性的!!!
故称神经网络是非线性的算法。

神经网络是非线性的算法可以解决实际生活中的非线性数据所带来的一系列问题,故有需求才会有存在。

想当年Google的alphago大战李世石,就是用的神经网络。程序员搬了14台服务器组成一个集群,前三局alphago赢了,但是第四局的时候输了,这时候程序员喊暂停,说要调整参数,调整参数,这么多权重你知道调啥?神经网络里面的隐藏层都是黑盒子,闹呢?实际上他们应该是初始化参数,用一开始的模型参数,alphago为啥第四局会输?主要是学习过拟合了。alphago一边和李世石下棋一边会去学习,重新更新权重参数。此时程序员初始化模型,后几局alphago取得胜利。

二、常见的激活函数

1,Sigmoid激活函数

在这里插入图片描述
在这里插入图片描述

2,Tanh / 双曲正切激活函数

在这里插入图片描述
在这里插入图片描述

3,ReLU 激活函数

在这里插入图片描述
在这里插入图片描述

4,ELU激活函数

在这里插入图片描述在这里插入图片描述

5,PReLU(Parametric ReLU)激活函数

在这里插入图片描述
在这里插入图片描述

6,Softmax激活函数

在这里插入图片描述

在这里插入图片描述

四、隐藏层的含义

大年初一,你去上别人家房顶感叹人生,最后房顶塌了,伤到人了,你看你老妈会不会打你就完事了
大年初一,你去上自家房顶摘菜帮老妈做家务,你再看看你会不会挨打

大年初二,你闲着没事玩火,还口嗨,我饮酒点孤灯,最后造成火灾伤到其他人了,你看你老妈会不会打你就完事了
大年初二,你玩火去帮老妈做饭,你再看看你会不会挨打

大年初三,你又闲了,拿起家里面的菜刀跑出去,来寻找你的青春,最后脑子抽筋伤到人了,你觉得你妈会不会揍你
大年初三,你动刀帮老妈做饭,再看看你会不会挨打
在这里插入图片描述
这里的隐藏层的作用就起到了推理演绎的作用,让机器更加容易的进行判断。
隐藏层越多,模型的推理演绎越多,也就是模型想的越多,预测结果也就会越准。

五、神经网络相关概念

机器学习–拟人

有监督的机器学习:
多元线性回归===回归/预测
逻辑回归===分类

神经网络(仿生)===预测
神经网络是非线性的算法,非线性的算法可以来解决更加复杂的问题
神经网络算法也是后面深度学习的时候的基础,例如:
ANN artificial neural network
MLP multiple layer percepton
CNN 卷积神经网络
RNN 循环神经网络
… …

Ⅰ,神经网络需要考虑的基本要素有哪些?

答:1,激活函数的选择。对应神经元里面的逻辑,包括两部分,相乘相加(Σ)和非线性的变化(f激活函数),相乘相加是固定不变的;非线性的变化(f激活函数)可以有很多选择,根据效果来
2,网络拓扑结构。处理更加复杂的问题,就需要更多的网络层,就需要每层上面设置更多的人工神经元
3,在去求解神经网络模型(w0,w1,w2…wn)的时候,选择什么样优化算法,SGD一样适用!

Ⅱ,激活函数有哪些?

答:1,Sigmoid函数,0到1之间 2,Tangent函数,-1到1之间 3,Relu函数,max(0,x)

Ⅲ,神经网络算法的隐藏层意义何在?

答:1,如果有隐藏层的话,就多了推理有演绎的能力
2,每多一个隐藏层,推理和演绎的过程更多,考虑的更深入
3,隐藏层的隐藏节点如果比之前的层上面的节点数要多,相当于进行了升维,考虑的因素更多,考虑的更全面
4,隐藏层的隐藏节点如果比之前的层上面的节点数要少,相当于进行了降维,去前面进行了归纳总结

六、项目实战

训练一个两次隐藏层(5个、2个),来进行训练,最后判断输入的结果是0还是1

from sklearn.neural_network import MLPClassifier#训练集参数
X = [[0., 0.], [1., 1.]]#输入层有两个输入节点
y = [0, 1]#输出层只有一个输出节点
"""
solver='sgd'                优化算法,这里使用的是随机梯度下降法
alpha=1e-5                  梯度下降那个系数,表示步长
activation='logistic'       激活函数,这里使用的是sigmoid函数
hidden_layer_sizes=(5, 2)   两层隐藏层,分别是5个和2个
max_iter=2000               最大迭代次数
tol=1e-4                    阈值,迭代终止条件
"""
clf = MLPClassifier(solver='sgd', alpha=1e-5, activation='logistic', hidden_layer_sizes=(5, 2), max_iter=2000, tol=1e-4)
clf.fit(X, y)#测试集参数
predicted_value = clf.predict([[2., 2.], [-1., -2.]])
print(predicted_value)
predicted_proba = clf.predict_proba([[2., 2.], [-1., -2.]])
print(predicted_proba)print([coef.shape for coef in clf.coefs_])
print([coef for coef in clf.coefs_])

输出结果:

"""
[1 1]
[[0.42020492 0.57979508][0.41408929 0.58591071]]
[(2, 5), (5, 2), (2, 1)]
[array([[ 0.08530062, -0.52124089, -0.29367687,  0.07361264,  0.02156327],[ 0.46945464,  0.22892193,  0.15913923, -0.52165397,  0.44346639]]), array([[-0.02538695,  0.02746434],[-0.12493617,  0.2892428 ],[-0.34109646,  0.05022483],[ 0.02789934, -0.49890685],[ 0.35519161,  0.46174166]]), array([[ 0.31453746],[-0.4271511 ]])]"""

网络模型如下:
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/377770.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

leetcode 46. 全排列 思考分析

目录1、题目2、思考3、优化1、题目 给定一个 没有重复 数字的序列,返回其所有可能的全排列。 2、思考 老规矩,先画出给出的例子的解空间树: 观察我们可以发现: 1、深度向下一层深入时,出现过的元素不能再出现&…

Arduino UNO R3开发板+MQ-2烟雾浓度传感器+火焰传感器+舵机+无源蜂鸣器+风扇+步进电机+WIFI模块+RGB三色LED灯+SIM900A所构成的室内安全报警模块

该系统模块主要由Arduino UNO R3开发板MQ-2烟雾浓度传感器火焰传感器舵机无源蜂鸣器风扇步进电机WIFI模块RGB三色LED灯SIM900A所组成,MQ-2烟雾浓度传感器达到不同的阈值的时候,LED灯会通过不同的颜色来进行警示。烟雾浓度增大,LED灯依次显示绿…

可编程ic卡 通用吗_8255可编程IC

可编程ic卡 通用吗Introduction 介绍 An 8255 programmable integrated circuit (IC) is an IC used for interfacing the microprocessor with the peripheral devices. It is a 40 pin IC which was introduced by INTEL to use with its 8085 and 8086 microprocessors. 82…

九、逻辑回归多分类和softmax多分类

一、逻辑回归多分类 假设激活函数使用的是sigmoid函数 逻辑回归多分类其实是多个二分类而已,若求三分类问题需要对训练的数据样本进行适当的修改调整即可,如何修改样本数据可以参考逻辑回归二分类和多分类本质区别,内容都一样&#xff0c…

十、评估指标

我看过很多课程,不过内容都大差不差,也可以参考这篇模型评估方法 一、K折交叉验证 一般情况,我们得到一份数据集,会分为两类,一类是trainset训练集,另一类十testset测试集。通俗一点也就是训练集相当于平…

leetcode 47. 全排列 II 思考分析

题目 给定一个可包含重复数字的序列 nums ,按任意顺序 返回所有不重复的全排列。 思考分析以及代码 这一题和前面的做过的两个题目有所关联: leetcode 46. 全排列 思考分析 再加上leetcode 491. 递增子序列 思考分析类似的去重操作。 先画出解空间树…

hdu 4472 Count(递推即dp)

题目链接&#xff1a;http://acm.hdu.edu.cn/showproblem.php?pid4472 代码&#xff1a; #include <cstdio> #include <cstring> #include <iostream> #include <cmath> #include <algorithm> #include <queue> #include <vector> …

十一、决策树和随机森林

这门课和另一门课内容都差不多&#xff0c;可以参考七、决策树算法和集成算法该篇博文。 一、决策树相关概念 逻辑回归本质 逻辑回归&#xff1a;线性有监督分类模型。常用求解二分类问题&#xff0c;要么是A类别要么是B类别&#xff0c;一般会以0.5作为划分阈值&#xff0c…

【C++grammar】继承与构造

目录1.继承1、Inheritance (继承)2、避免一个类被继承&#xff08; C11 &#xff09;3、继承实例4、完整代码5、继承的优缺点是什么?2.继承中的构造函数1、 派生类继承的成员2、调用基类构造函数3.继承中的默认构造函数1、基类的无参构造函数2、由编译器自动生成的基类构造函数…

(转)将cocos2dx项目从VS移植到Eclipse

本文转自:http://www.cnblogs.com/Z-XML/p/3349518.html 引言&#xff1a;我们使用cocos2d-x引擎制作了一款飞行射击游戏&#xff0c;其中创新性地融入了手势识别功能。但是我们在移植过程中遇到了很多的问题&#xff0c;同时也发现网上的资料少而不全。所以在项目行将结束的时…

十二、聚类算法——相似度测量

两套学习资料都类似&#xff0c;可参考聚类算法实战 一、聚类 聚类&#xff1a;物以类聚&#xff0c;人以群分&#xff0c;是无监督学习中的一种。 没有y&#xff0c;只有x&#xff0c;把不同的x根据相似度自动的聚成好多堆儿 本质上&#xff0c;N个样本&#xff0c;映射到K个…

leetcode 344. 反转字符串 541. 反转字符串 II 双指针解

目录leetcode 344.反转字符串1、题目2、思考leetcode 541. 反转字符串 II1、题目2、思考leetcode 344.反转字符串 1、题目 2、思考 典型的双指针解法&#xff1a; 一个从前往后&#xff0c;一个从后往前&#xff0c;指针对应的交换即可。 class Solution { public:void reve…

十三、聚类算法

六、聚类算法实战 一、聚类 聚类是一种无监督的机器学习任务&#xff0c;可以自动将数据划分为类cluster&#xff0c;因此聚类分组不需要提前被告知所划分的组应该是什么样子的。因为我们甚至可能都不知道我们在寻找什么&#xff0c;所以聚类是用于知识发现而不是预测。 聚类…

pl/sql中的赋值运算符_如何在SQL中使用AND / OR运算符?

pl/sql中的赋值运算符Basically, AND / OR operator is used to retrieving the record from the database. If we give more than one conditions by using AND Operator, then it retrieves the data from the database when both the conditions are true. And if we use OR…

【C++grammar】名字隐藏与重定义

目录1、继承中的名字隐藏1.基类同名函数被隐藏的现象描述2.问题理解3.避免现象2、重定义1.现象描述2.重定义与重载的区别3.能否使用 using 将基类成员引入到派生类定义中1、继承中的名字隐藏 1.基类同名函数被隐藏的现象描述 在学习变量作用域的时候知道&#xff0c;全局变量…

十四、聚类实战——图片压缩

对同一像素点值的像素点归为一类&#xff0c;通过平均值进行取代&#xff0c;从而将图像进行压缩并且保证图像尽可能不失真&#xff0c;关键信息仍保留。 from PIL import Image import numpy as np from sklearn.cluster import KMeans import matplotlib import matplotlib.…

步骤菜单使用css3实现

代码库&#xff1a;http://thecodeplayer.com/walkthrough/css3-breadcrumb-navigation 有兴趣的可以看一下&#xff0c;看完绝对让你大饱眼福。首先截图&#xff0c;看效果看着很酷吧&#xff0c;其实实现起来也不是很难&#xff0c;里边需要用的技术有:box-shadow,计数器&…

【嵌入式系统】STM32串口通信的四种方法(基于RTOS)

目录1、串行通信的基本参数2、轮询方式代码效果3、中断方式代码效果4、中断加上时间戳方式代码及效果5、DMA空闲中断方式接收数据1、串行通信的基本参数 串行端口的通信方式是将字节拆分成一个接一个的位再传输出去&#xff0c;接收方再将此一个一个的位组合成原来的字符&…

十五、聚类的评估

一、Given Label 均一性homogeneity&#xff1a;一个簇中只包含一个类别样本&#xff0c;Precision 完整性completeness&#xff1a;同类别样本被归到同一个簇中&#xff0c;Recall 将均一性h和完整性c进行结合(二者加权平均)得到V-Measure&#xff0c;&#xff0c;β为权重 …

SQL SERVER作业的Schedules浅析

SQL SERVER作业的计划&#xff08;Schedules&#xff09;&#xff0c;如果你没仔细研究过或没有应用一些复杂的计划&#xff08;Schedules&#xff09;&#xff0c;那么你觉得SQL SERVER作业的计划(Schedules)非常好用&#xff0c;也没啥问题&#xff0c;但是我要告诉你一个“残…