专栏介绍
1.专栏面向零基础或基础较差的机器学习入门的读者朋友,旨在利用实际代码案例和通俗化文字说明,使读者朋友快速上手机器学习及其相关知识体系。
2.专栏内容上包括数据采集、数据读写、数据预处理、分类\回归\聚类算法、可视化等技术。
3.需要强调的是,专栏仅介绍主流、初阶知识,每一技术模块都是AI研究的细分领域,同更多技术有所交叠,此处不进行讨论和分享。
- 数据采集技术:selenium/正则匹配/xpath/beautifulsoup爬虫实例
- 面向txt/json/xlsx/csv的文件读写及编码问题
- 数据预处理:统计关联性分析/数据清洗/数据增强/特征工程实例
- 一文带你入门机器学习回归算法
- 一文带你入门机器学习分类算法
- 一文带你入门机器学习聚类算法
- 一文带你入门机器学习降维算法
——————————————————————————————————————————
文章目录
- 专栏介绍
- 概述
- 线性降维方法
- 主成分分析(PCA)
- 线性判别分析(LDA)
- 独立成分分析(ICA)
- 非线性降维方法
- t-分布邻域嵌入(t-SNE)
- 自编码器(Autoencoder)
- 局部线性嵌入(LLE)
——————————————————————————————————————————
概述
降维算法在机器学习中扮演着非常重要的角色,主要用于处理高维数据,以便更好地理解和分析数据。
在对项目进行数据工程后,获取指定特征,特征若维数太多,则可应用此类算法降维,之后可以将降维后的特征作为特征数据对机器学习算法进行训练。
线性降维方法
主成分分析(PCA)
一种常用的线性降维技术,通过寻找数据中方差最大的方向&