【AI原理解析】—胶囊神经网络(GNN)原理

目录

一、基本原理

1. 胶囊结构

2. 层级结构

二、动态路由算法

1. 加权输入向量

2. 路由过程

三、非线性激活函数

四、优势与局限性

优势

局限性

五、应用前景


一、基本原理

1. 胶囊结构
  • 定义:胶囊网络的核心在于将神经元组织成不同级别的“胶囊”结构,每个胶囊由一组神经元组成,用于表示特定类型的实体(如对象或对象部分)的实例化参数(如可能性、方向、大小等)。
  • 向量输出:每个胶囊的输出是一个向量,而非传统神经网络中的标量。向量的长度(模)表示实体存在的概率,向量的方向表示除了概率以外的其他实例化参数,如位置、角度、大小等。
2. 层级结构
  • 胶囊网络具有层级结构,每一层胶囊代表了不同层次的特征。低层次的胶囊可能代表眼睛、鼻子等局部特征,而高层次的胶囊则可能代表人脸等整体特征。

二、动态路由算法

1. 加权输入向量
  • 底层胶囊的输出向量通过权重矩阵与高层胶囊相连接。权重矩阵编码了底层特征和高层特征之间的空间关系和其他重要关系。
  • 加权输入向量是底层胶囊的输出向量与相应的权重矩阵相乘的结果,它决定了当前胶囊将其输出传递到哪个更高级的胶囊。
2. 路由过程
  • 初始化:所有连接权重的值都初始化为相同的值(如0.5),表示不确定性最大。
  • 迭代更新
    • 在每次迭代中,计算底层胶囊的输出向量与高层胶囊的预测向量之间的相似度(通常通过点积来衡量)。
    • 根据相似度更新连接权重。相似度越高,权重越大,表示该底层胶囊的输出更有可能对高层胶囊的预测有贡献。
    • 重复该过程多次,直到达到预设的迭代次数或收敛条件。
  • 结果:经过多次迭代后,底层胶囊的输出将更准确地传递到与其最相关的高层胶囊,从而实现特征的层次化表示。

三、非线性激活函数

  • 胶囊网络使用squash函数作为非线性激活函数。squash函数将向量的长度压缩到0到1之间,同时保持向量的方向不变。这有助于保持胶囊输出向量的稳定性和一致性。

四、优势与局限性

优势
  1. 对姿态和视角的变化更加鲁棒:通过动态路由算法,胶囊网络能够自适应地计算物体之间的关系,从而更好地适应形状、姿态和视角上的变化。
  2. 更好地利用上下文信息:由于胶囊之间的关系被显式地表示为向量,胶囊网络能够更好地利用上下文信息来识别和分类复杂的图像和物体。
  3. 对欺骗性样本更加鲁棒:动态路由机制可以在训练过程中自适应地排除欺骗性样本的干扰因素。
局限性
  1. 训练时间较长:由于需要更多的计算资源和更长的训练时间,胶囊网络在实际应用中的成本较高。
  2. 模型复杂性:胶囊网络的结构较为复杂,使得模型的可解释性不够强,同时在实际应用中难以实现。

五、应用前景

图像分类、目标识别、自然语言处理等领域

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/865110.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2.3 主程序和外部IO交互 (文件映射方式)----IO Server实现

2.3 主程序和外部IO交互 (文件映射方式)----IO Server C实现 效果显示 1 内存共享概念 基本原理:以页面为单位,将一个普通文件映射到内存中,达到共享内存和节约内存的目的,通常在需要对文件进行频繁读写时…

基于Spring Boot接入腾讯云RocketMQ

操作场景 本文以调用 Spring Boot Starter SDK 为例介绍通过开源 SDK 实现消息收发的操作过程,帮助您更好地理解消息收发的完整过程。 前提条件 完成资源创建与准备 安装1.8或以上版本 JDK 安装2.5或以上版本 Maven 下载 Demo或者前往GitHub 项目 操作步骤 步骤1:添加…

手写一个类似@RequestParam的注解(用来接收请求体的参数)

一、本文解决的痛点 按照大众认为的开发规范,一般post类型的请求参数应该传在请求body里面。但是我们有些post接口只需要传入一个字段,我们接受这种参数就得像下面这样单独创建一个类,类中再添加要传入的基本类型字段,配合Reques…

HHKB记录

识别键盘 ● 1,在“系统偏好设置” - “键盘” - “更改键盘类型” ● 2,按照要求分别按左右Shift的按键 ● 3,键盘类型选择“ANSI” 快捷键 基本功能键 ● 切换输入法:Control 空格 ● 降低、提升、静音:Fn A、…

LLM指令微调Prompt的最佳实践(二):Prompt迭代优化

文章目录 1. 前言2. Prompt定义3. 迭代优化——以产品说明书举例3.1 产品说明书3.2 初始Prompt3.3 优化1: 添加长度限制3.4 优化2: 细节纠错3.5 优化3: 添加表格 4. 总结5. 参考 1. 前言 前情提要: 《LLM指令微调Prompt的最佳实践(一)&#…

nexus未开启匿名访问Anonymous Access,访问maven元数据maven-metadata,报401未授权Unauthorized错误

一、背景 下午在调试nexus的时候,其他同事不小心把匿名访问停用了,导致客户端android打包的时候,报错: Received status code 401 from server: Unauthorized。 访问http://192.168.xx.xx:8081/repository/public/com/xxx/xxxcor…

【软件测试】单元测试、系统测试、集成测试详解

🍅 视频学习:文末有免费的配套视频可观看 🍅 点击文末小卡片,免费获取软件测试全套资料,资料在手,涨薪更快 一、单元测试的概念 单元测试是对软件基本组成单元进行的测试,如函数或一个类的方法…

PCL 点云最小图割(前景、背景点云提取)

点云最小图割 一、概述1.1 概念1.2 算法原理二、代码示例三、运行结果🙋 结果预览 一、概述 1.1 概念 最小图割算法(pcl::MinCutSegmentation):是一种基于图论的对象分割方法,主要用于点云数据的处理和分析。该算法将点云数据表示为一个图结构,其中点云中的点作为图的节…

Linux主分区被格式化导致不能被系统识别出来

解决方法:sudo fdisk /dev/sdX重新创建主分区 在 Linux 中格式化 SSD 磁盘主要包括几个步骤:确认设备、创建分区(如果需要)、格式化分区以及挂载分区。以下是一个简单的指南: 第一步:确认 SSD 设备 首先&…

【Java】微博系统设计:怎么应对热点事件的突发访问压力?

一、问题解析 微博(microblog)是一种允许用户即时更新简短文本(比如140个字符),并可以公开发布的微型博客形式。今天我们就来开发一个面向全球用户、可以支持10亿级用户体量的微博系统,系统名称为“Weitte…

不同系统间数据交换要通过 api 不能直接数据库访问

很多大数据开发提供数据给外部系统直接给表结构,这是不好的方式。在不同系统间进行数据交换时,通过API(应用程序编程接口)而非直接访问数据库是现代系统集成的一种最佳实践。 目录 为什么要通过API进行数据交换如何通过API进行数据…

UG NX二次开发(C#)-根据草图创建拉伸特征(UFun+NXOpen)

文章目录 1、前言2、在UG NX中创建草图,然后创建拉伸特征3、基于UFun函数的实现4、基于NXOpen的实现代码1、前言 UG NX是基于特征的三维建模软件,其中拉伸特征是一个很重要的特征,有读者问如何根据草图创建拉伸特征,我在这篇博客中讲述一下草图创建拉伸特征的UG NX二次开发…

分布式链路追踪Micrometer Tracing和ZipKin基础入门与实践

【1】概述 在分布式与微服务场景下,我们需要解决如下问题: 在大规模分布式与微服务集群下,如何实时观测系统的整体调用链路情况。 在大规模分布式与微服务集群下,如何快速发现并定位到问题。 在大规模分布式与微服务集群下&…

AI网络爬虫006:从当当网批量获取图书信息

文章目录 一、目标二、输入内容三、输出内容一、目标 用户输入一个图书名称,然后程序自动从当当网批量获取图书信息 查看相关元素在源代码中的位置: 二、输入内容 第一步:在deepseek中输入提示词: 你是一个Python爬虫专家,一步步的思考,完成以下网页爬取的Python脚本任…

法制史学习笔记(个人向) Part.3

5. 三国两晋南北朝法律制度 以下为三国魏晋南北朝直到唐代的历史发展脉络图: #mermaid-svg-6AVVMjllKTBaBbRO {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-6AVVMjllKTBaBbRO .error-icon{fill:#55222…

【Python实战因果推断】14_线性回归的不合理效果4

目录 Debiasing Step Denoising Step Standard Error of the Regression Estimator Debiasing Step 回想一下,最初由于混杂偏差,您的数据看起来是这样的、 随着信贷额度的增加,违约率呈下降趋势: 根据 FWL 定理,您可…

c文件读写

格式输入输出 文件指针 FILE *pf 文件打开 fopen("文件名",打开方式)  文件名:普通字符串 打开方式:读、写、文本文件、二进制文件 rt、wt、at、rb、wb、ab、rt、wt、at、rb、wb、ab (r 为读,w 为写, 为读写&…

解锁机器学习潜力的钥匙:深度剖析交叉验证集的应用与魅力

一、为何需要交叉验证集 在构建机器学习模型时,我们通常会面临一个关键问题:如何确保模型在新数据上的表现与在训练数据上一样出色?这涉及到模型的泛化能力——即模型对未见过的数据做出准确预测的能力。传统的训练集/测试集划分方法虽然简单…

亿纬锂能社招入职通用职业能力测评大易题库及薪资待遇

一、亿纬锂能薪资待遇 1. **平均工资**:根据职朋职业圈的数据,惠州亿纬锂能股份有限公司的平均工资为10924元/月。网易新闻的报道则提到,亿纬锂能的月收入平均值为16598元。 2. **工资区间**:在亿纬锂能,工资收入有多…