目录
前言
粉丝及官方意见说明
第二十章一些学习笔记
第二十章一些操作方法
神经网络与支持向量机
人工神经网络(artificial neural network,ANN)
假设数据
具体操作
结果解释
对案例的进一步分析
结果解释
编辑
尝试将模型复杂化
结果解释
纳入更多候选自变量
结果解释
径向基神经网络
结束语
前言
#一起加油
#本期内容:神经网络与支持向量机
#由于导师最近布置了学习SPSS这款软件的任务,因此想来平台和大家一起交流下学习经验,这期推送内容接上一次高级教程第十九章的学习笔记,希望能得到一些指正和帮助~
粉丝及官方意见说明
#针对官方爸爸的意见说的推送缺乏操作过程的数据案例文件澄清如下:1、操作演示的数据全部由我本人随意假设输进去的,重在演示操作;2、本人也只是在学习阶段,希望友友们能谅解哈,手里有数据的宝子当然更好啦,没有咱就自己假设数据练习一下也没多大关系的哈;3、我也会在后续教程中尽量增加一些数据的必要性说明;4、大家有什么好的意见也可以在评论区一起交流吖~
第二十章一些学习笔记
- SPSS中人工神经网络的结构可以划分为:1、输入层【每个节点对应各预测变量,相当于自变量向量】;2、输出层【节点对应目标变量,可以有多个,相当于因变量的预测结果】;3、隐含层【一般不可见,该层的层数和每层节点的个数决定了神经网络的复杂度,相当于所采用的统计模型】。神经网络不可缺少的两个过程是学习【训练神经网络】和执行【通过训练好的神经网络识别有关信息模式或特征】,反向传输神经网络(back propagation,BP)就是一个典型的例子。神经网络的优点:最大的优势就是训练完之后,就能够迅速得到同类复杂预测问题的预测结果。--统计分析高级教程(第三版)P394-395
- SPSS中神经网络使用的注意事项:1、人工神经网络的可解释性很差;2、数据准备不可少;3、训练过度问题无法解决【由于其无法区分有效信息和噪声信息,因此学习的越充分,噪声信息就会纳入的越多】;4、样本量有要求【样本量过少,模型预测效果会不稳定,外推效率非常低,样本量至少为纳入模型变量数的10倍以上】;5、训练效率不高。--统计分析高级教程(第三版)P396-397
- SPSS中支持向量机(support vector machine,SVM)方法,是一种二分类模型,其基本定义为特征空间上间隔最大的线性分类器,期望达到的目标则是根据有限的样本信息在模型复杂性(即对特定训练样本的学习精度)和学习能力(即无错误地识别任意样本的能力)之间寻求最佳折中,以获得最好的外推能力,实际应用中特别适合用于分析预测变量字段非常多(如数千个)的数据,最典型的场景就是文本分类,限制超平面取值范围的点被称为支持向量(support vector),利用支持向量的信息,即可确定超平面的取值范围,一般选取径向基核函数作为首选核函数。--统计分析高级教程(第三版)P410-411
第二十章一些操作方法
神经网络与支持向量机
人工神经网络(artificial neural network,ANN)
由大量处理单元(神经元)互相连接组成的大规模、非线性、自适应动力学系统,具有自组织、自适应、自学习的能力。
假设数据
具体操作
结果解释
说明:本来最后还有一个预测的表格的,但由于数据问题,这里无法计算,故最后那个预测的表格也无法展示。
对案例的进一步分析
模型效果的图形观察
结果解释
预测-实测图
模型ROC曲线
累计增益图
提升图(SPSS中的效益图)
尝试将模型复杂化
结果解释
双隐含层模型结构示意图
模型的汇总表格和分类表格
纳入更多候选自变量
一般而言,贸然纳入无关变量实际上只会使模型的预测效果变差,若希望直接纳入所有的候选自变量,只需分别将其选入多层神经网络中“因子”和“协变量”框即可,这里为了演示操作,随机将一些可能相关的变量纳入协变量中。
结果解释
径向基神经网络
局部逼近网络,对于每个训练样本,他只需对少量的权值和阈值进行修正,因而大大加快了训练速度,克服了BP神经网络(全局逼近神经网络)学习速度慢的缺点。
这里由于数据原因,可能无法计算网络,操作是没问题的,后续的结果表格的读法也是类似的。
支持向量机(support vector machine,SVM)
SPSS中并无直接的命令实现,后续可以考虑编程来实现。
结束语
#好啦~,以上就是我SPSS第三十八期学习笔记——高级教程第二十章的学习情况啦~,希望能与大家交流学习经验,共同进步吖~
#也非常感谢大家对我的一路陪伴,宝子们的关注、支持和打赏就是up儿不断更新滴动力,我近期也会坚持学习SPSS,更新相应的学习内容及笔记到平台上,咱们下期高级教程不见不散~