动手学深度学习：手语视频在VGG模型中的测试

动手学深度学习：手语视频在VGG模型中的测试

pingmian/2025/4/29 9:29:48/文章来源:https://blog.csdn.net/2301_79591615/article/details/147199631

前言

其他所有部分同上一篇AlexNet一样，所以就不再赘诉，直接看VGG搭建部分。

模型

VGG是第一个采取块进行模块化搭建的模型。

def vgg_block(num_convs,in_channels,out_channels):layers=[]for _ in range(num_convs):layers.append(nn.Conv2d(in_channels,out_channels,kernel_size=3,padding=1))layers.append(nn.ReLU())in_channels=out_channelslayers.append(nn.MaxPool2d(kernel_size=2,stride=2))return nn.Sequential(*layers)

可选择几个卷积之后再做池化，将这个做为一个块，在模型中多次使用。

conv_arch=((1,64),(1,128),(2,256),(2,512),(2,512))
def vgg(conv_arch):conv_blks=[]in_channels=len(frames_len)for (num_convs,out_channels) in conv_arch:conv_blks.append(vgg_block(num_convs,in_channels,out_channels))in_channels=out_channelsreturn nn.Sequential(*conv_blks,nn.Flatten(),nn.Linear(out_channels*7*7,4096),nn.ReLU(),nn.Dropout(0.5),nn.Linear(4096,4096),nn.ReLU(),nn.Dropout(0.5),nn.Linear(4096,len(labels))
net=vgg(conv_arch).to_device(device)#cuda

直接跟AlexNet模型替换就能使用。

简单来看一下这个模型，先做两次一个卷积外加一个池化，再做两次两个卷积外加一个池化，将整个网络的深度提升了很多。

结果

刚跑完，todesk就连接不上电脑了，所以就口述一下结果吧。

在上一次的10分类下，test的acc提高了20%左右，并且在增大frames_len的情况下，train的acc为100%，test的acc提升至90%，似乎是有捕获到视频的分类。

在100分类下的效果也还可以，train达到99.75%，test达到71%。

整体来看，VGG对于手语视频的分类是具有一定的效果的，对于其中的特征确实学习到了东西。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/pingmian/76592.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

信息学奥赛一本通 1498：Roadblocks | 洛谷 P2865 [USACO06NOV] Roadblocks G

信息学奥赛一本通 1498：Roadblocks | 洛谷 P2865 [USACO06NOV] Roadblocks G

【题目链接】 ybt 1498：Roadblocks 洛谷 P2865 [USACO06NOV] Roadblocks G 【题目考点】 1. 图论：严格次短路径严格次短路的路径长度必须大于最短路的路径长度。非严格次短路的路径长度大于等于最短路的路径长度。【解题思路】每个交叉路口是一…

阅读更多...

Arm CPU安全通告：基于TrustZone的Cortex-M系统面临多重故障注入攻击

Arm CPU安全通告：基于TrustZone的Cortex-M系统面临多重故障注入攻击

安全之安全(security)博客目录导读目录一、概述二、致谢三、参考文献Black Hat USA 2022 | Briefings Schedule 四、版本历史一、概述 Arm注意到BlackHat 2022大会官网发布的演讲摘要《糟糕..！我又一次故障注入成功了！——如何突…

阅读更多...

【频域分析】包络分析

【频域分析】包络分析

【频域分析】包络分析算法配置页面可以一键导出结果数据报表自定义绘制获取和下载【PHM学习软件PHM源码】的方式获取方式：Docshttps://jcn362s9p4t8.feishu.cn/wiki/A0NXwPxY3ie1cGkOy08cru6vnvc

阅读更多...

ElMessage

ElMessage

以下是关于 ElMessage 的详细说明和使用方法： 什么是 ElMessage ElMessage 是 Element Plus 提供的一个全局消息提示组件，用于在页面上显示短暂的消息提示。它可以用于显示成功、警告、错误等不同类型的消息。基本用法 1. 引入 ElMessage 在使用 E…

阅读更多...

全面解析 KaiwuDB 数据库的数据类型

全面解析 KaiwuDB 数据库的数据类型

在现代数据库管理系统中，数据类型的选择至关重要。它不仅决定了数据存储的效率，还影响到查询的速度和数据的一致性。KaiwuDB，作为一款开源的分布式数据库，提供了多种数据类型，以适应不同的业务需求和存储要求。本文将全…

阅读更多...

【计网】网络交换技术之分组交换（复习自用，重要1）

【计网】网络交换技术之分组交换（复习自用，重要1）

复习自用的，处理得比较草率，复习的同学或者想看基础的同学可以看看，大佬的话可以不用浪费时间在我的水文上了另外两种交换技术可以直接点击链接访问相关笔记： 电路交换报文交换一、分组交换的定义 1.定义分组交换&#x…

阅读更多...

C++ STL及Python中等效实现

C++ STL及Python中等效实现

一. STL 概述 STL 包含以下核心组件： 容器（Containers）：存储数据的结构，如数组、链表、集合等。迭代器（Iterators）：用于遍历容器的接口，类似指针。算法（Alg…

阅读更多...

python-63-前后端分离之图书管理系统的Flask后端

python-63-前后端分离之图书管理系统的Flask后端

文章目录 1 flask后端1.1 数据库实例extension.py1.2 数据模型models.py1.3 .flaskenv1.4 app.py1.5 运行1.6 测试链接2 关键函数和文件2.1 请求视图类MethodView2.2 .flaskenv文件3 参考附录基于flask形成了图书管理系统的后端，同时对其中使用到的关键文件.flaskenv和函数类M…

阅读更多...

蓝桥杯真题——好数、R格式

蓝桥杯真题——好数、R格式

目录蓝桥杯2024年第十五届省赛真题-好数【模拟题】题目描述输入格式输出格式样例输入样例输出提示代码1：有两个案例过不了，超时蓝桥杯2024年第十五届省赛真题-R 格式【vector容器的使用】题目描述输入格式输出格式样例输入…

阅读更多...

Python中NumPy的索引和切片

Python中NumPy的索引和切片

在数据科学和科学计算领域，NumPy是一个功能强大且广泛使用的Python库。它提供了高效的多维数组对象以及丰富的数组操作函数，其中索引和切片是NumPy的核心功能之一。通过灵活运用索引和切片操作，我们可以轻松访问和操作数组中的元素&#xff0…

阅读更多...

设计模式：策略模式 - 消除复杂条件判断的利器

设计模式：策略模式 - 消除复杂条件判断的利器

一、什么是策略模式？ 策略模式（Strategy Pattern）是一种行为型设计模式，它将一组算法或业务逻辑封装为独立的策略类，使这些策略可以互换使用，并通过上下文类动态选择合适的策略。核心思想 • 将不同的行…

阅读更多...

LeetCode hot 100—不同路径

LeetCode hot 100—不同路径

题目一个机器人位于一个 m x n 网格的左上角 （起始点在下图中标记为 “Start” ）。机器人每次只能向下或者向右移动一步。机器人试图达到网格的右下角（在下图中标记为 “Finish” ）。问总共有多少条不同的路径？ …

阅读更多...

pytorch查询字典、列表维度

pytorch查询字典、列表维度

输出tensor变量维度 print(a.shape)输出字典维度 for key, value in output_dict.items():if isinstance(value, torch.Tensor):print(f"{key} shape:", value.shape)输出列表维度 def get_list_dimensions(lst):# 基线条件：如果lst不是列表&#xff0…

阅读更多...

多坐标系变换全解析：从相机到WGS-84的空间坐标系详解

多坐标系变换全解析：从相机到WGS-84的空间坐标系详解

多坐标系变换全解析：从相机到WGS-84的空间坐标系详解一、常见坐标系简介二、各坐标系的功能和使用场景1. WGS-84 大地坐标系（经纬高）2. 地心直角坐标系（ECEF）3. 本地 ENU / NED 坐标系4. 平台坐标系（Body）5. 相机坐标系三、坐标变换流程图四、如何选用合适的坐标系？五…

阅读更多...

【NumPy科学计算：高性能数组操作核心指南】

【NumPy科学计算：高性能数组操作核心指南】

目录前言：技术背景与价值当前技术痛点解决方案概述目标读者说明一、技术原理剖析核心概念图解关键技术模块技术选型对比二、实战演示环境配置要求核心代码实现运行结果验证三、性能对比测试方法论量化数据对比结果分析四、最佳实践推荐方案 ✅常见错误 ❌调试技…

阅读更多...

【特权FPGA】之PS/2键盘解码

【特权FPGA】之PS/2键盘解码

0 故事背景见过这种接口的朋友们，大概都已经成家立业了吧。不过今天我们不讨论这种接口的历史，只讲讲这种接口的设计。（如果还没有成家的朋友也别生气，做自己想做的事情就对了！） 1 时序分析数据帧格式如图…

阅读更多...

DAPP实战篇：使用web3.js实现前端输入钱包地址查询该地址的USDT余额—操作篇

DAPP实战篇：使用web3.js实现前端输入钱包地址查询该地址的USDT余额—操作篇

专栏：区块链入门到放弃查看目录-CSDN博客文章浏览阅读396次。为了方便查看将本专栏的所有内容列出目录，按照顺序查看即可。后续也会在此规划一下后续内容，因此如果遇到不能点击的，代表还没有更新。声明：文中所出观点大多数源于笔者多年开发经验所总结，如果你想要知道区块…

阅读更多...

高中生学习数据隐私保护的“技术-制度-文化”协同机制研究

高中生学习数据隐私保护的“技术-制度-文化”协同机制研究

一、引言 1.1 研究背景与意义在数字化时代的浪潮下，教育领域正经历着深刻的变革，智能教育平台如雨后春笋般涌现，为高中教育带来了新的活力与机遇。这些平台借助先进的信息技术，能够实时收集、分析大量的高中生学习数据&#xf…

阅读更多...

【Java多线程】告别线程混乱！深度解析Java多线程4大实现方式（附实战案例）

【Java多线程】告别线程混乱！深度解析Java多线程4大实现方式（附实战案例）

一、继承Thread类实现步骤： 1.继承Thread类 2.重写run()方法 3.创建线程对象并调用start()方法示例： class MyThread extends Thread {Overridepublic void run() {for (int i 0; i < 5; i) {System.out.println(Thread.currentThread().getNam…

阅读更多...

全国产V7-690T核心板/算法验证板/FPGA开发板

全国产V7-690T核心板/算法验证板/FPGA开发板

UD SOM-404全国产化信号处理模块既可以作为核心板使用，也可以单独使用。FPGA对外有80组GTY通过两个FMC连接器全部引出，多个模块可以级联使用，扩展信号处理能力。FMC连接器也满足标准规范，可以插入标准的FMC或FMC子板。模块为100%国…

阅读更多...

最新文章