matlab标准化和反标准化——zscore

先说一下一个小疑问:

目前所了解的归一化概念有点模棱两可,目前可能有三种理解

假设矩阵A大小n*m,n代表样本数,m代表每一个样本的维度

①单独对每一列(全部样本的同一个属性)进行归一化

②单独对每一行(一个样本的所有的属性)进行归一化

③对整个矩阵A进行归一化

这三个理解都能达到所有数据变换到[0,1]的效果。

然后,正确的答案是:归一化是针对相同维度进行的,即①的理解。但是对于③,我认为也是可取的,也可以作为正确答案

举个例子,比如人的属性是颜色,身高,年龄。如果你对每一个人进行归一化,很可能把颜色归一化成一样的了,毕竟每一个人自己的几个属性的方差是不相同的,不排除存在这种可能,使得某种属性在归一化以后几乎相等,此时这种属性几乎就会失去作用了。但是对所有人的同一种属性进行归一化,即使也可能与其它维度是值相等了,但是这个属性并不会失去其作用

先来看自带函数zscore的使用

>> A=[1 2 3;4 5 6];
>> [B,A_mean,A_std]=zscore(A)B =-0.7071   -0.7071   -0.70710.7071    0.7071    0.7071A_mean =2.5000    3.5000    4.5000A_std =2.1213    2.1213    2.1213>> 

其中A_mean代表A按列求均值,A_std代表每一个列向量的标准差。

接下来看看如何逐步求:

>> A=[ 1 2 3;4 5 6];
>> A_mean=mean(A,1);
>> A_std=std(A);
>> B=(A-repmat(A_mean,size(A,1),1))./repmat(A_std,size(A,1),1);
>> A_meanA_mean =2.5000    3.5000    4.5000>> A_stdA_std =2.1213    2.1213    2.1213>> BB =-0.7071   -0.7071   -0.70710.7071    0.7071    0.7071

反标准化用到的是前面求到的两个参数:均值和标准差

B.*repmat(A_std,size(A,1),1)+repmat(A_mean,size(A,1),1)ans =1     2     34     5     6
所以在进行标准化和反标准化的时候,一定要记住均值和方差。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/246717.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Sublime优美设置(待续)

快捷键熟悉练习请查看 http://www.cnblogs.com/figure9/p/sublime-text-complete-guide.html 1.基础用户设置 工具栏 – Preferences – Settings – User {“theme”: “Soda Dark.sublime-theme”,“tab_size”: 4,“font_size”: 10.0,“font_face”: “Microsoft YaHei…

人工神经网络——笔记摘抄1

一、人工神经网络简介 人工神经网络(Artificial Neural Networks,ANN)基本组成成分是:输入(感知)器、加权求和(信息汇聚)、传递(信息传输)器、输出(响应)器组成。 决定神经网络信息处理性能的三大要素:激励函数、学习算法、拓扑结构。 二、人…

Recall(召回率) Precision(准确率) F-Measure E值 sensitivity(灵敏性) specificity(特异性)漏诊率 误诊率 ROC AUC

Berkeley Computer Vision page Performance Evaluation 机器学习之分类性能度量指标 : ROC曲线、AUC值、正确率、召回率 True Positives, TP:预测为正样本,实际也为正样本的特征数 False Positives,FP:预测为正样本,实际为负…

人工神经网络——笔记摘抄2

一、模式识别系统的主要目标 模式识别系统的主要目标是在特征空间和解释空间之间找个一种映射关系。 二、模式识别系统的构成 ①数据获取:将对象属性转换为计算机可以接受的数值或者符号串集合。数值或者符号串组成的空间称为模式空间。 ②预处理:为…

防止过拟合以及解决过拟合

本文转载:http://blog.sina.com.cn/s/blog_53c47a2f0102vjyf.html 过拟合:为了得到一致假设而使假设变得过度复杂称为过拟合。“一个过拟合的模型试图连误差(噪音)都去解释(而实际上噪音又是不需要解释的)&…

关于协方差矩阵需要注意的一个事项

协方差矩阵是衡量样本的属性(即维度)之间的关系,而不是样本与样本之间的关系。 比如有100个样本,每个样本10个属性,那么计算得到的协方差矩阵一定是10*10的,而不是100*100的,这个一定要注意。 协方差矩阵主要是为了分…

多GPU运行Deep Learning 和 并行Deep Learning(待续)

本文论述了 Deep learning运行所需的硬件配置,多GPU运行Deep Learning,设置Deep Learning的数据并行和 模型并行。详情请参考下文 http://timdettmers.com/category/hardware/ http://blog.csdn.net/jiandanjinxin/article/details/74938468

牛人主页(主页有很多论文代码)【真的好强大】

转自:http://blog.sina.com.cn/s/blog_6833a4df01012bcf.html 牛人主页(主页有很多论文代码) Serge Belongie at UC San DiegoAntonio Torralba at MITAlexei Ffros at CMUCe Liu at Microsoft Research New EnglandVittorio Ferrari at Univ…

Linux的常用经典命令(持续更新)

找工作笔试面试那些事儿(16)—linux相关知识点(1) 找工作笔试面试那些事儿(17)—linux测试题 vim编辑器操作命令大全-绝对全 - CSDN博客 Linux进阶资源 Command line one-liners the-art-of-command-line Linux工具快速教程 快乐的 Linux 命令行 Linux Tutorial UNIX Tutoria…

[C语言]为什么要有include?——从Hello World说起

本文转自:http://mp.weixin.qq.com/s?__bizMzAwOTgzNzQyMw&mid433613487&idx1&sn803995d612faadce6e4418789a6a65a8&scene2&srcid0312ElIT9UmR0ZygPGHxDxs2&fromtimeline&isappinstalled0#wechat_redirect 大家都会写的Hello World程序…

【caffe-Windows】cifar实例编译之model的使用

本文讲解如何对网上下载的一个图片利用训练好的cifar模型进行分类 第一步 上一篇文章训练好以后会得到两个文件 从网上查阅资料解释来看,第一个caffemodel是训练完毕得到的模型参数文件,第二个solverstate是训练中断以后,可以用此文件从中断…

Python 命令汇总

python 库windows安装 兵种:python程序员。 等级:二级。 攻击:较高。 防御:普通。 价格:低。 天赋:胶水,我方有c程序员时,速度可达到c程序员的80%。 天赋:成熟&…

spectral hashing--谱哈希源码解析

论文里面看到了谱哈希用来找子集的用处,不管有没有用,先转再说 原文地址:http://blog.sina.com.cn/s/blog_67914f290101d2xp.html 最近看了有关谱哈希的一些东西,记录一下备忘。理解十分粗浅,敬请各位大牛指导。 一、…

【PTVS+Theano+CPU/GPU】在windows下使用VS安装theano深度学习工具

唉。好不容易折腾完毕caffe,突然发现caffe比较适合搭建卷积神经网络,而对于DBN和LSTM的搭建好像比较麻烦,相关教程没有找到,手头上又有一个theano的代码想调试看看,所以入坑了。 准备工具: VS2013:链接&a…

人工神经网络——【BP】反向传播算法证明

第一步:前向传播 【注】此BP算法的证明仅限sigmoid激活函数情况。本博文讲道理是没错的,毕竟最后还利用代码还核对了一次理论证明结果。 关于更为严谨的BP证明,即严格通过上下标证明BP的博客请戳这里 简单的三层网络结构如下 参数定义&…

参数模型和非参数模型的区别

原文地址:http://blog.csdn.net/gao1440156051/article/details/44003051 参数与非参数模型  用代数方程、微分方程、微分方程组以及传递函数等描述的模型都是参数模型。建立参数模型就在于确定已知模型结构中的各个参数。通过理论分析总是得出参数模型。非参数模…

【matlab函数】——str2func函数的使用

官方点的叫法,在网上被称为函数句柄 用途在于,比如你定义了两个函数:strupper()用于寻找字符串的大写字母数目;strlower()用于寻找字符串的小写字母数目 现在使用str在这里面调换使用如下: funcstr;%统一前缀 myfuncstr2func(fu…

什么是NP完全问题?

本文转自:http://blog.csdn.net/xueyong4712816/article/details/6509592 NP完全问题,是世界七大数学难题之一,排在百万美元大奖的首位,够诱惑力吧!咋不求得奖只需要了解了解它是什么就可以了。 什么是NP完全问题,NPN…

【caffe-Windows】微软官方caffe之 matlab接口配置

前言 按照微软的官方地址配置可能会出现一个问题caffe_.mexw64找不到引用模块问题,或者在matlab里面压根找不到caffe_这个函数,下面会提到这两个问题。还是按照步骤来吧 【PS1】有GPU同样按照下述步骤,进行即可 【PS2】文章在matlab2013a、…

【混淆矩阵】matlab画混淆矩阵

主要借鉴此博客代码:http://blog.csdn.net/sherry_gp/article/details/50560003 但是这个博主的代码达不到我想要的效果,所以修改了一下 我想要实现的效果是:给定一列的预测标签,以及这一列标签的哪一部分理应属于哪一部分标签。…