Python28-7.5 降维算法之t-分布邻域嵌入t-SNE

t-分布邻域嵌入(t-distributed Stochastic Neighbor Embedding,t-SNE)是一种用于数据降维和可视化的机器学习算法,尤其适用于高维数据的降维。t-SNE通过将高维数据嵌入到低维空间(通常是二维或三维)中,使得在高维空间中相似的点在低维空间中仍然保持相似,而不相似的点被分离开来。

t-SNE的基本原理

t-SNE通过两步将高维数据降维:

  1. 计算高维空间中的相似性:在高维空间中,t-SNE使用高斯分布来计算数据点之间的相似性。给定数据点x_i和 x_j,其相似性 p_ij定义为:

    这里,sigma_i 是根据Perplexity参数自动确定的。

  2. 计算低维空间中的相似性:在低维空间中,t-SNE使用t分布来计算数据点之间的相似性。给定低维数据点 y_i和 y_j,其相似性 q_ij定义为:

  3. 最小化KL散度:t-SNE通过最小化高维相似性分布 (P) 和低维相似性分布 (Q) 之间的Kullback-Leibler (KL) 散度来优化低维嵌入:

t-SNE的特点
  • 保持局部结构:t-SNE在保持数据局部结构(局部相似性)方面表现非常好,能够揭示数据中的细节模式。

  • 非线性降维:t-SNE是非线性降维方法,适合处理具有复杂非线性结构的数据。

  • 高计算量:t-SNE计算量较大,尤其是在处理大规模数据集时。

t-SNE的应用

t-SNE广泛应用于数据可视化,特别是以下领域:

  • 图像处理:用于高维图像特征的可视化。

  • 自然语言处理:用于文本和词嵌入的可视化。

  • 生物信息学:用于基因表达数据的可视化。

  • 聚类分析:用于聚类结果的可视化。

示例代码

以下是使用Python库scikit-learn实现t-SNE的示例代码:

import numpy as np
import matplotlib.pyplot as plt
from sklearn.manifold import TSNE
from sklearn.datasets import load_digits# 加载数据
digits = load_digits()
X = digits.data
y = digits.target# 使用t-SNE降维
tsne = TSNE(n_components=2, perplexity=30, n_iter=300)
X_embedded = tsne.fit_transform(X)# 可视化结果
plt.figure(figsize=(10, 8))
scatter = plt.scatter(X_embedded[:, 0], X_embedded[:, 1], c=y, cmap='viridis')
plt.colorbar(scatter)
plt.title("t-SNE visualization of the digits dataset")
plt.xlabel("t-SNE component 1")
plt.ylabel("t-SNE component 2")
plt.show()

图片

t-SNE的参数调整
  • Perplexity:影响高斯分布的方差,通常介于5到50之间,反映了考虑邻居数量的平衡。

  • 学习率(learning_rate):影响梯度下降的步长,通常设置在10到1000之间。

  • 迭代次数(n_iter):t-SNE优化过程的迭代次数,通常需要至少250次迭代,建议300次以上。

t-SNE是一种强大的非线性降维方法,特别适用于高维数据的可视化。通过保持高维数据的局部结构,它能够揭示数据中的复杂模式。然而,t-SNE的计算复杂度较高,需要合理选择参数来平衡性能和效果。

以上内容总结自网络,如有帮助欢迎转发,我们下次再见!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/868097.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

git github gitee 三者关系

Git: Git 是一个分布式版本控制系统,用于跟踪源代码的更改。它由 Linus Torvalds 于 2005 年开发,目的是更好地管理 Linux 内核开发。Git 是一个命令行工具,具有以下特点: 分布式:每个开发者的工作目录都是…

【深度学习】什么是交叉注意力机制?

文章目录 区别传统的自注意力机制交叉注意力机制区别总结应用实例自注意力机制的应用:交叉注意力机制的应用: 代码自注意力机制的实现交叉注意力机制的实现说明 交叉注意力机制的发展趋势 区别 交叉注意力机制(Cross-Attention Mechanism&am…

【Git】入门到专家,Git手动配置Config脚本

为什么要手动配置脚本 手动配置脚本,好比是一个专家模式,它能加深你对Git的理解 如果纯粹复制粘贴网上的指令,不懂得其中原理,项目一多,仓库一多,发生冲突时自己就没法解决 Git的脚本非常简单&#xff0…

【php相关总结】

php相关总结 一、分库分表 垂直拆分和水平拆分 垂直拆分: 1.大表拆小表,常用的字段单独拆分出来,直接访问小表 2.每个库表不一样,但是有一个相同的外键关联 水平拆分: 1.hash取模拆分。 2.每个库表结构都一样&#xf…

Edge浏览器油猴插件的安装与使用

油猴 (又称篡改猴或Tampermonkey) 是最流行的浏览器扩展之一。它允许用户自定义并增强网页的功能。用户脚本是小型 JavaScript 程序,可用于向网页添加新功能或修改现有功能。使用油猴,您可以轻松在任何网站上创建、管理和运行这些用户脚本。 1.插件的安…

【数据结构与算法】希尔排序

💓 博客主页:倔强的石头的CSDN主页 📝Gitee主页:倔强的石头的gitee主页 ⏩ 文章专栏:《数据结构与算法》 期待您的关注 ​

Vue的学习之模板语法(指令)

一、指令 <!DOCTYPE html> <html><head><meta charset"utf-8"><title>Vue的学习</title><script src"vue.js" type"text/javascript" charset"utf-8"></script></head><bo…

KIVY Camera¶

Camera — Kivy 2.3.0 documentation Camera 相机 Jump to API ⇓ Module: kivy.uix.camera Added in 1.0.0 The Camera widget is used to capture and display video from a camera. Once the widget is created, the texture inside the widget will be automatically u…

关于新装Centos7无法使用yum下载的解决办法

起因 之前也写了一篇类似的文章&#xff0c;但感觉有漏洞&#xff0c;这次想直接把漏洞补齐。 问题描述 在我们新装的Centos7中&#xff0c;如果想要用C编程&#xff0c;那就必须要用到yum下载&#xff0c;但是&#xff0c;很多新手&#xff0c;包括我使用yum下载就会遇到一…

mupdf加载PDF显示中文乱码

现象 加载PDF显示乱码,提示非嵌入字体 non-embedded font using identity encoding调式 在pdf-font.c中加载字体 调试源码发现pdf文档的字体名字居然是GBK&#xff0c;估计又是哪个windows下写的pdf生成工具生成pdf 字体方法&#xff1a; static pdf_font_desc * load_cid…

用QFramework重构飞机大战(Siki Andy的)(下01)(06-0? 游戏界面及之后的所有面板)

GitHub // 官网的 全民飞机大战&#xff08;第一季&#xff09;-----框架设计篇&#xff08;Unity 2017.3&#xff09; 全民飞机大战&#xff08;第二季&#xff09;-----游戏逻辑篇&#xff08;Unity 2017.3&#xff09; 全民飞机大战&#xff08;第三季&#xff09;-----完善…

解锁高效软件测试:虚拟机助力提升测试流程的秘诀

众所周知&#xff0c;软件测试在软件开发生命周期中至关重要。它确保软件符合要求&#xff0c;没有漏洞&#xff0c;并帮助开发人员优化性能&#xff0c;验证项目功能。 然而&#xff0c;测试可能既耗时又耗费资源&#xff0c;特别是当需要在不同操作系统和配置上测试软件组件…

Nginx七层(应用层)反向代理:HTTP反向代理proxy_pass篇

Nginx七层&#xff08;应用层&#xff09;反向代理 HTTP反向代理proxy_pass篇 - 文章信息 - Author: 李俊才 (jcLee95) Visit me at CSDN: https://jclee95.blog.csdn.netMy WebSite&#xff1a;http://thispage.tech/Email: 291148484163.com. Shenzhen ChinaAddress of thi…

Python3极简教程(一小时学完)中

异常 在这个实验我们学习 Python 的异常以及如何在你的代码中处理它们。 知识点 NameErrorTypeError异常处理&#xff08;try..except&#xff09;异常抛出&#xff08;raise&#xff09;finally 子句 异常 在程序执行过程中发生的任何错误都是异常。每个异常显示一些相关…

07-7.2.1 顺序查找

&#x1f44b; Hi, I’m Beast Cheng &#x1f440; I’m interested in photography, hiking, landscape… &#x1f331; I’m currently learning python, javascript, kotlin… &#x1f4eb; How to reach me --> 458290771qq.com 喜欢《数据结构》部分笔记的小伙伴可以…

Word使用中的一些烦人的小问题

文章目录 前言一、表格满一页后再插入行无法显示二、文字显示半截 前言 使用word的时候有一些莫名其妙的情况出现&#xff0c;想问度娘还很难用文字来描述问题&#xff0c;随时记录一下方便以后看 一、表格满一页后再插入行无法显示 点击表格左上方的全选按钮&#xff0c;下一…

fasttext工具介绍

fastText是由Facebook Research团队于2016年开源的一个词向量计算和文本分类工具。尽管在学术上并未带来巨大创新&#xff0c;但其在实际应用中的表现却非常出色&#xff0c;特别是在文本分类任务中&#xff0c;fastText往往能以浅层网络结构取得与深度网络相媲美的精度&#x…

长沙理工大学本科毕业论文(Latex模板)补充

&#x1f388;&#x1f388;&#x1f388;本模板不是原创&#xff0c;来自于github公开的项目。 具体链接是https://github.com/csust-latex-sig/CSUSTBachelorThesis 某大佬开源的&#xff0c;我用了之后做了点补充说明。&#xff08;&#x1f61d;&#xff09; 一、Latex的安…

用GPT做足球预测案例分享

自从GPT出来后&#xff0c;一直想利用GPT的能力做点什么&#xff0c;想了很多项目&#xff0c;比如用GPT写小说&#xff0c;用GPT做股票分析&#xff0c;用GPT写营销文章&#xff0c;最终我选了一个比较有意思的方向&#xff1a;GPT足球预测。因为每天都有足球比赛&#xff0c;…

Maven一键配置阿里云远程仓库,让你的项目依赖飞起来!

文章目录 引言一、为什么选择阿里云Maven仓库&#xff1f;二、如何设置Maven阿里云远程仓库&#xff1f;三、使用阿里云Maven仓库的注意事项总结 引言 在软件开发的世界里&#xff0c;Maven无疑是一个强大的项目管理工具&#xff0c;它能够帮助我们自动化构建、依赖管理和项目…