降维的技术

   有时候机器学习所使用的特征太多了,几百上千个,这个时候计算量很大,可能需要减少对一些特征进行降维。当然,对特征进行降维不意味着对特征进行筛选,我曾经以为,所谓的降维,就是选择一些更加重要的特征,但实际上并不是,这个降维其实就是对原本的矩阵进行变换,然后让原矩阵变小了,特征还是那些特征,只是它们融合到了新矩阵,这种融合的手段,实际上改变了原来特征的性质,所以一定要小心使用。

    降维有好几种方法,其中常见的降维手段有主成分分析(PCA),线性判别分析(LDA),局部线性嵌入(LLE)。文章末尾会讲几个其他的手段当作科普。

1.奇异值分解

学过线性代数的同学都应该理解特征值和特征向量的关系。特征向量其实就是坐标系的一个维度,特征向量组成的矩阵就是对应的坐标系。为什么叫他们坐标系呢,因为空间中的任意一点,都可以用基坐标系线性组合。

坐标系就是这么一个东西,以二维空间为例,它的坐标系是:j,k不为0

a = [0, j]

b = [k, 0]

那么这个二维坐标的任意一点就可以用下面这个式子表示,k和l为任意常数

k*a+l*b

没问题吧.

那么,我们任意矩阵A可以表示为

A = Q\Sigma Q^-1

其中Q是A的左特征矩阵,Q-1是它的右特征矩阵,Segama是对角矩阵,对角线上的值是右特征矩阵对应的特征值开方。

计算过程我就不多说了,很简单

(1).求A^T*A得特征矩阵和特征值得到Q

(2).求A*A^T的特征矩阵和特征向量值得到QT

(3).\Sigma等于A*A^T对应的特征值开方,然后形成对角矩阵

有些矩阵没办法求特征矩阵和特征向量,所以我们一般是采用协方差矩阵

2.PCA降维

  PCA降维使用的一般是奇异值分解,最后得到特征矩阵和特征值。特征向量组成特征矩阵的时候,需要按照特征值的大小进行排列,特征值的大小就代表了特征的贡献率,因此我们一般选择前面几个特征值对应的特征向量组成特征矩阵W,降维之后的特征矩阵为WT*X

  PCA降维的方法是让数据投影到低维度上,让数据尽可能的分来。

  PCA也有核技巧,先让数据进行一次非线性映射,也就是通过核函数计算一次,得到新的矩阵,然后来求特征值和特征向量。

3.LDA线性判别分析

这个方法其实和PCA的思想差不多,也是在降维的时候,使得组间差异最大,组间差异最小,不同的是,它是一种和有监督的学习,而不是PCA那种无监督的计算。LDA降维之后的特征维度必然减少,而PCA可以不减少维度。LDA可以用作二分类。它的计算过程其实和PCA差不多。

4.LLE局部线性嵌入

LLE降维是保持局部线性关系的一种降维方式。

一般要选取k个临近值,然后求每个样本的k个临近样本,这k个样本可以线性组合大致可以表示这个样本,然后要求系数组合等于1,那么就有了约束条件。最后求解这个条件就行了。

简单来讲,就是降维要求保持数据的原本相对关系,这种要求是尽量,而不是绝对。

它的优点在于

(1).可以学习任意维度的局部线性的地位流形。

(2).算法可归结为稀疏矩阵特征分解,计算复杂度相对较小

缺点在于

(1).算法学习的流形只能是不闭合的,且样本是稠密均匀。

(2).对K值的选择很敏感。

5.其他降维技术

(1).随机投影,顾名思义,就是把高维数据随机投影到一个低纬度,这种方法居然是科学的,因为有研究指出,降维的质量取决于实例的数量和目标维度,和初始维度无关。

(2).多维缩放:尽量保持样本之间的距离

(3).Isomap:将实例与周围最近的邻居连接创建一个图,保持实例之间的测地距离

(4)t分布随机临近嵌入:降维的同时使得相似的实例靠近,不一样的实例尽可能分开

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/524391.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

IOS OpenGL ES GPUImage 图像叠加 GPUImageOverlayBlendFilter

目录 一.简介二.效果演示三.源码下载四.猜你喜欢 零基础 OpenGL (ES) 学习路线推荐 : OpenGL (ES) 学习目录 >> OpenGL ES 基础 零基础 OpenGL (ES) 学习路线推荐 : OpenGL (ES) 学习目录 >> OpenGL ES 转场 零基础 OpenGL (ES) 学习路线推荐 : OpenGL (ES) 学习目…

要闻君说:印度公司要在京沪建立数据中心;超 10 万个 GitHub 仓库可泄漏 API 令牌及密钥...

关注并标星星CSDN云计算每周三次,打卡即read更快、更全了解泛云圈精彩newsgo go go 再次中国行,库克参观故宫(图片来源网络)【3月25日 星期一】云の声音未来5G对于庞大的IPv6业务,对于整个物联网、产业互联网可以提供更…

IOS OpenGL ES GPUImage 图像加深混合 GPUImageDarkenBlendFilter

目录 一.简介二.效果演示三.源码下载四.猜你喜欢 零基础 OpenGL (ES) 学习路线推荐 : OpenGL (ES) 学习目录 >> OpenGL ES 基础 零基础 OpenGL (ES) 学习路线推荐 : OpenGL (ES) 学习目录 >> OpenGL ES 转场 零基础 OpenGL (ES) 学习路线推荐 : OpenGL (ES) 学习目…

Redis 工具类_慕课版本

缓存RedisRedis 连接池RedisPoolUtil.javaRedis 集群 连接RedisShardedPoolUtil.java通用部分RedisPool.java通用部分RedisShardedPool.java通用部分RedissonManager.java 在这里插入代码片RedisPoolUtil.java package com.mmall.util;import com.mmall.common.RedisPool; imp…

云有约 | 在去O的道路上,AWS表示:经验可复制,惊喜并非只属于我们!

戳蓝字“CSDN云计算”关注我们哦!作者:刘晶晶一直以来,在云计算领域,AWS虽然遥遥领先,但是后有追兵无数,前方却从未有人带带路,想要“偷懒”借鉴学习一下,绝对不能够。一直以来&…

IOS OpenGL ES GPUImage 图像减淡混合 GPUImageLightenBlendFilter

目录 一.简介二.效果演示三.源码下载四.猜你喜欢 零基础 OpenGL (ES) 学习路线推荐 : OpenGL (ES) 学习目录 >> OpenGL ES 基础 零基础 OpenGL (ES) 学习路线推荐 : OpenGL (ES) 学习目录 >> OpenGL ES 转场 零基础 OpenGL (ES) 学习路线推荐 : OpenGL (ES) 学习目…

IOS OpenGL ES GPUImage 图像源混合 GPUImageSourceOverBlendFilter

目录 一.简介二.效果演示三.源码下载四.猜你喜欢 零基础 OpenGL (ES) 学习路线推荐 : OpenGL (ES) 学习目录 >> OpenGL ES 基础 零基础 OpenGL (ES) 学习路线推荐 : OpenGL (ES) 学习目录 >> OpenGL ES 转场 零基础 OpenGL (ES) 学习路线推荐 : OpenGL (ES) 学习目…

微服务与单体架构:IT变革中企业及个体如何自处?

戳蓝字“CSDN云计算”关注我们哦!作者:DAN KUSNETZKY转自:RancherLabs当下,企业越来越多地受到竞争对手和他们自己的客户的压力,既需要让应用程序更快地在线运行,同时又要最大限度地降低开发成本。这些不同…

玩转微服务日志框架Logback

一、Logback的配置形式2种: 方案一: application.yml 配置相对简单(需求简单可以使用) 1、可以配置控制台输出的日志格式 例如: 2、可以指定输出到某个路径下面,文件名默认是spring.log 3、如果想可以自定义log日志的文件名…

边缘计算精华问答 | 边缘计算有哪些应用场景?

物联网对物联网技术的快速发展和云服务的推动使得云计算模型已经不能很好的解决现在的问题,于是,这里给出一种新型的计算模型,边缘计算。1Q:什么是边缘计算?A:一般来讲,边缘计算侧重在更为靠近用…

IOS OpenGL ES GPUImage 图像平移 GPUImageTransformFilter

目录 一.简介二.效果演示三.源码下载四.猜你喜欢 零基础 OpenGL (ES) 学习路线推荐 : OpenGL (ES) 学习目录 >> OpenGL ES 基础 零基础 OpenGL (ES) 学习路线推荐 : OpenGL (ES) 学习目录 >> OpenGL ES 转场 零基础 OpenGL (ES) 学习路线推荐 : OpenGL (ES) 学习目…

Windows搭建SonarQube_Mysql

一、环境参数: softwareversionJDKjdk-8u144-windows-x64.tarSonarQubesonarqube-7.6sonar-runnersonar-runner-dist-2.4汉化插件sonar-l10n-zh-plugin-1.26.jarmysqlmysql-5.7.26-winx64sonar有三部分组成: 1、服务端:显示分析结果和sonar相…

IOS OpenGL ES GPUImage 图像缩放 GPUImageTransformFilter

目录 一.简介二.效果演示三.源码下载四.猜你喜欢 零基础 OpenGL (ES) 学习路线推荐 : OpenGL (ES) 学习目录 >> OpenGL ES 基础 零基础 OpenGL (ES) 学习路线推荐 : OpenGL (ES) 学习目录 >> OpenGL ES 转场 零基础 OpenGL (ES) 学习路线推荐 : OpenGL (ES) 学习目…

window下远程监控linux下tomcat的jvm

简要介绍: 理论上来讲,任何一个运行的java程序都可以监控当前正在运行的java虚拟机的内存,堆空间,栈空间等信息.tomcat本质也是运行在linux上的java程序,通过一定的配置也可以实现监控tomcat对应程序的jvm的空间。 配置方法: 1.停止linux上的tomcat2.编辑bin路径下…

云有约 | 精华汇总

出品 | CSDN云计算 云有约,面对面采访,用最细腻的方式,撰写出最专业的深度文章。 云有约 | 在去O的道路上,AWS表示:经验可复制,惊喜并非只属于我们! 一直以来,挑战数据库霸主Oracl…

Tomcat闪退的解决办法

第一步:在startup.bat文件最后添加pause,启动查看问题原因: 第二步:在startup.bat文件开头添加,如图所示: set TITLE"tomcat-8091" set CATALINA_BASE"F:\NOT MODIFIED\tomcat-8091"…

IOS OpenGL ES GPUImage 图像镜像 GPUImageTransformFilter

目录 一.简介二.效果演示三.源码下载四.猜你喜欢 零基础 OpenGL (ES) 学习路线推荐 : OpenGL (ES) 学习目录 >> OpenGL ES 基础 零基础 OpenGL (ES) 学习路线推荐 : OpenGL (ES) 学习目录 >> OpenGL ES 转场 零基础 OpenGL (ES) 学习路线推荐 : OpenGL (ES) 学习目…

云重磅 | 没有硬件,苹果发布多款“云服务”;阿里云发布基于公共云的虚拟GPU服务;中国移动首发5G套餐...

戳蓝字“CSDN云计算”关注我们哦!嗨,大家好,重磅君带来的【云重磅】特别栏目,如期而至,每周二第一时间为大家带来重磅新闻。把握技术风向标,了解行业应用与实践,就交给我重磅君吧!重…

Errors while executing git --version. exitCode=128 errors: fatal: open /dev/null or dup failed: No s

Errors while executing git --version. exitCode128 errors: fatal: open /dev/null or dup failed: No such file or directory 1、找到开发文档null.sys文件,复制到下面路径,覆盖此文件即可,解决 链接:https://pan.baidu.com…

IOS OpenGL ES GPUImage 图像旋转 GPUImageTransformFilter

目录 一.简介二.效果演示三.源码下载四.猜你喜欢 零基础 OpenGL (ES) 学习路线推荐 : OpenGL (ES) 学习目录 >> OpenGL ES 基础 零基础 OpenGL (ES) 学习路线推荐 : OpenGL (ES) 学习目录 >> OpenGL ES 转场 零基础 OpenGL (ES) 学习路线推荐 : OpenGL (ES) 学习目…