AlexNet 阅读笔记

“ImageNet Classification with Deep Convolutional Neural Networks” (Krizhevsky 等, 2012, p. 1)

使用深度卷积神经网络进行 ImageNet 分类

3公式,26个引用,4张图片,2个简单表格

Abstract

我们训练了一个大型深度卷积神经网络,将 ImageNet LSVRC-2010 竞赛中的 120 万张高分辨率图像分类为 1000 个不同的类别。

在测试数据上,我们实现了 37.5% 和 17.0% 的 top-1 和 top-5 错误率,这比之前的最先进水平要好得多。

该神经网络拥有 6000 万个参数和 650,000 个神经元,由五个卷积层(其中一些后面是最大池层)和三个全连接层(最终为 1000 路 softmax)组成。

为了加快训练速度,我们使用非饱和神经元和非常高效的 GPU 实现卷积运算。为了减少全连接层中的过度拟合,我们采用了最近开发的称为“dropout”的正则化方法,事实证明该方法非常有效。

我们还在 ILSVRC-2012 竞赛中输入了该模型的一个变体,并取得了 15.3% 的获胜前 5 名测试错误率,而第二名的测试错误率为 26.2%。

1. Introduction

1.当前物体识别充分使用机器学习的方法,为了提高性能需要更大、质量更高的数据集从而学习更强大的模型。(列举最近的数据集)。

2.模型需要先验知识——引出CNN卷积神经网络。

3.然而训练是昂贵的,好在现在有GPU和足够的有标签高质量数据。

4.本文的具体贡献

5.最后,神经网络大小受限于GPU内存和时间,当前是在两个GTX580 GPU上训练了5-6天的实验结果,只要GPU更快数据集更大,实验结果就会改善!

2. The Dataset

介绍 ImageNet,介绍大规模视觉挑战赛ILSVRC

作者在ILSVRC-2010上执行了大部分实验,在ImageNet上通常使用top-1和top-5两个错误率。

ImageNet的数据图像分辨率不一样,作者将它剪裁成256*256的固定大小,除此之外没有使用任何其他处理方式。

3. The Architecture

我们的网络架构如图 2 所示。它包含八个学习层,五个卷积层和三个全连接层。下面,我们描述了我们网络架构的一些新颖或不寻常的特征。第 3.1-3.4 节根据我们对其重要性的估计进行排序,最重要的排在最前面。

3.1 ReLU Nonlinearity

3.2 Training on Multiple GPUs

3.3 3.4

3.5 Overall Architecture

4. Reducing Overfitting

我们的神经网络架构有 6000 万个参数。尽管 ILSVRC 的 1000 个类别使每个训练示例对从图像到标签的映射施加 10 位约束,但事实证明,这不足以在不出现严重过拟合的情况下学习如此多的参数。下面,我们描述了对抗过度拟合的两种主要方法。

4.1 数据增强

“4.2 Dropout” 辍学

5. Details of learning

一些细节:两个GTX 580训练5-6天,120万张图片90个周期训练,批量大小128,随机梯度下降,动量0.9,权重衰减0.0005,标准差0.01,用0初始化。学习率初始化为0.01。

我们发现少量权重衰减对于模型学习很重要!

(这话跟我说的一样!)

6. Results

表1总结了我们在ILSVRC-2010上的结果。

我们还在ILSVRC-2012竞赛中使用了我们的模型,具体结果在表2给出。

最后,我们还报告了ImageNet2009年秋季版本的错误率。

6.1定性评价

7. Discussion

大型深度神经网络用于监督学习能够取得破纪录的结果。如果删除单个卷积层top-1性能会损失大约2%。深度很重要!

我们未使用无监督与训练,我们希望未来在视频上使用深度卷积网络,因为时间也能提供很多信息。(吹牛,预测未来)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/208956.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Leetcode刷题详解——环绕字符串中唯一的子字符串

1. 题目链接:467. 环绕字符串中唯一的子字符串 2. 题目描述: 定义字符串 base 为一个 "abcdefghijklmnopqrstuvwxyz" 无限环绕的字符串,所以 base 看起来是这样的: "...zabcdefghijklmnopqrstuvwxyzabcdefghijklm…

卷积之后通道数为什么变了

通道数增多与卷积之后得到的图像特征数量有关 卷积层的作用本来就是把输入中的特征分离出来变成新的 feature map,每一个输出通道就是一个卷积操作提取出来的一种特征。在此过程中ReLU激活起到过滤的作用,把负相关的特征点去掉,把正相关的留…

C++:vector增删查改模拟实现

C:vector增删查改模拟实现 前言一、迭代器1.1 非const迭代器:begin()、end()1.2 const迭代器:begin()、end() 二、构造函数、拷贝构造函数、赋值重载、析构函数模拟实现2.1 构造函数2.1.1 无参构造2.1.2 迭代器区间构造2.1.3 n个值构造 2.2 拷贝构造2.3 …

vue路由导航守卫(全局守卫、路由独享守卫、组件内守卫)

目录 一、什么是Vue路由导航守卫? 二、全局守卫 1、beforeEach 下面是一个beforeEach的示例代码: 2、beforeResolve 下面是一个beforeResolve的示例代码: 3、afterEach 下面是一个afterEach的示例代码: 三、路由独享守卫…

Shell - 学习笔记 - 1.14 - 如何编写自己的Shell配置文件(配置脚本)?

第1章 Shell基础(开胃菜) 14 - 如何编写自己的Shell配置文件(配置脚本)? 学习了《Shell配置文件的加载》一节,读者应该知道 Shell 在登录和非登录时都会加载哪些配置文件了。对于普通用户来说,也许 ~/.bashrc 才是最重要的文件,因为不管是否登录都会加载该文件。 我们…

【数据处理】NumPy数组的合并操作,如何将numpy数组进行合并?

,NumPy中的合并操作是指将两个或多个数组合并成一个数组的操作。这种操作可以通过不同的函数来实现。 一、横向合并(水平合并) 横向合并是指将两个具有相同行数的数组按列方向合并成一个数组的操作。在NumPy中,可以使用hstack()…

044:vue中引用json数据的方法

第044个 查看专栏目录: VUE ------ element UI 专栏目标 在vue和element UI联合技术栈的操控下,本专栏提供行之有效的源代码示例和信息点介绍,做到灵活运用。 (1)提供vue2的一些基本操作:安装、引用,模板使…

多相Buck的工作原理

什么是多相Buck电源? 多相电源控制器是一种通过同时控制多个电源相位的设备,以提供稳定的电力供应。相位是指电源中的电流和电压波形。多相控制器的设计旨在最大程度地减小电力转换系统的纹波,并提高整体能效。它通常包含一系列的功率级联&a…

我的创作纪念日1024天纪念

机缘 经历的1024天,突然有一种惊奇,日子一天天过,有种恍惚的感觉 收获 从最开始的随笔,慢慢向着笔记总结转变,不经意间积累了好多 憧憬 虽不知最终会怎样发展,但坚持与向前是一定的,未来一…

结构化布线系统

满足下列需求: 1.标准化:国际、国家标准。 2.实用性:针对实际应用的需要和特点来建设系统。 3.先进性:采用国际最新技术。5-10年内技术不落后。 4.开放性:整个系统的开放性。 5.结构化、层次化:易于管理和维…

Matplotlib数据可视化

绘图基础语法 1 创建画布并且创建子图 首先创建一个空白的画布,并且可以将画布分为几个部分,这样就可以在同一附图上绘制多个图像。 plt.figure 创建一个空白画布,可以指定画布大小、像素 figure.add_subplot 创建并且选中子…

docker镜像、容器管理与迁移

镜像管理 搜索镜像: 这种方法只能用于官方镜像库 搜索基于 centos 操作系统的镜像 # docker search centos 按星级搜索镜像: 查找 star 数至少为 100 的镜像,默认不加 s 选项找出所有相关 ubuntu 镜像: …

【web安全】文件读取与下载漏洞

前言 菜某整理仅供学习,有误请赐教。 概念 个人理解:就是我们下载一个文件会传入一个参数,但是我们可以修改参数,让他下载其他的文件。因为是下载文件,所以我们可以看到文件里面的源码,内容。 文件读取…

Python嗅探和解析网络数据包

网络工具解释 Scapy是Python2和Python3都支持的库。 它用于与网络上的数据包进行交互。 它具有多种功能,通过这些功能我们可以轻松伪造和操纵数据包。 通过 scapy 模块,我们可以创建不同的网络工具,如 ARP Spoofer、网络扫描仪、数据包转储器…

swiftUi——颜色

在SwiftUI中,您可以使用Color结构来表示颜色。Color可以直接使用预定义的颜色,例如.red、.blue、.green等,也可以使用自定义的RGB值、十六进制颜色代码或者系统提供的颜色。 1. 预定义颜色 Text("预定义颜色").foregroundColor(.…

Swing程序设计(9)复选框,下拉框

文章目录 前言一、复选框二、下拉框总结 前言 该篇文章简单介绍了Java中Swing组件里的复选框组件、列表框组件、下拉框组件,这些在系统中都是常用的组件。 一、复选框 复选框(JCheckBox)在Swing组件中的使用也非常广泛,一个方形方…

Albumentations(Augmentation Transformations)

Albumentations(Augmentation Transformations) Albumentations(Augmentation Transformations)是一个用于图像数据增强(数据增广)的Python包。它提供了丰富的图像增强技术,用于训练机器学习模…

hadoop安装与配置-shell脚本一键安装配置(集群版)

文章目录 前言一、安装准备1. 搭建集群 二、使用shell脚本一键安装1. 复制脚本2. 增加执行权限3. 分发脚本4. 执行脚本5. 加载用户环境变量 三、启动与停止1. 启动/停止hadoop集群(1) 复制hadoop集群启动脚本(2) 增加执行权限(3) 启动hadoop集群(4) 停止hadoop集群(5) 重启hado…

智慧社区前景无限,科技引领未来发展

社区是城镇化发展的标志,作为人类现代社会的生活的基本圈子,是人类生活离不开的地方,社区人口密度大、车辆多,管理无序,社区的膨胀式发展多多少少带来一定的管理上的缺失。社区作为智慧城市建设的重要一环,…

编译基于LIO-SAM的liorf“Large velocity, reset IMU-preintegration!“

使用LIO-SAM修改的代码liorf(因自己使用的IMU传感器是 6-axis ouster): LIO-SAM代码连接: https://github.com/TixiaoShan/LIO-SAM liorf代码连接: https://github.com/YJZLuckyBoy/liorf 编译运行出现错误&#…