Deep learning

论文:doi:10.1038/nature14539

论文意义和主要内容

三巨头从机器学习谈起,指出传统机器学习的不足,总览深度学习理论、模型,给出了深度学习的发展历史,以及DL中最重要的算法和理论。
概念:
原理:DL的整个过程参数相当多,调整内部参数的方法就是backpropagation算法。
应用:CNN主要在图像,视频,语言和音频处理方面带来突破,RNN对文本和语音等时序数据带来突破。

论文结构


1引言

Deep-learning methods are representation-learning methods with multiple levels of representation,obtained by composing simple but non-linear modules that each transform the representation at one level (starting with the raw input) into a representation at a higher, slightly more abstract level. With the composition of enough such transformations, very complex functions can be learned.
深度学习方法是多级学习方法,由多个简单非线性模块(可以用层表示)组合而成,每一层就是一个级别,原始数据通过深度学习可以进行特征的变化和提取,只要这些模块足够多,即使是非常复杂的模型也可以用深度学习方法进行表示。
理解:深度学习是机器学习的一种,它也可以使用三板斧(详见李宏毅学习笔记),就是要在定义的function set里面(这里的function set会比较复杂),找到一个最好的function(机器学习的过程),用于模型的表示或预测(最后的应用)
这里还提到一个很重要的概念:representation learning/表示学习,:


DL的应用领域

It has turned out to be very good at discovering intricate structures in high-dimensional data and is therefore applicable to many domains of science, business and government.
计算机视觉CV
        无人驾驶:车辆识别、路径规划
        图片识别:图片表示、语义分割
自然语言处理NLP
        智能搜索、人机对话、文本摘要、机器翻译
其他:医学图像分析、制药、人脸识别、游戏、安全、异常检测等

2监督学习Supervised learning

We compute an objective function that measures the error (or distance) between the output scores and the desired pattern of scores. The machine then modifies its internal adjustable parameters to reduce this error. These adjustable parameters, often called weights, are real numbers that can be seen as ‘knobs’ that define the input–output function of the machine. In a typical deep-learning system, there may be hundreds of millions of these adjustable weights, and hundreds of millions of labelled examples with which to train the machine.
这里面的用词和ng的课里用的loss function以及cost不太一样,不过李飞飞的cs231n里面用的是score的说法。
我们通过计算目标函数,该函数用来衡量输出score和真实score的差异(其实是距离)。计算机通过BP调整模型的参数(通常叫权重)使得这个差异最小化。进行这样的调整需要大量的带标签数据。调节过程就像调节旋钮。


With multiple non-linear layers, say a depth of 5 to 20, a system can implement extremely intricate functionsof its inputs that are simultaneously sensitive to minute details — distinguishing Samoyeds from white wolves — and insensitive to large irrelevant variations such as the
background, pose, lighting and surrounding objects.
里面还以和狼很像的薩摩耶犬(英语:Samoyed)为例,说明了传统的机器学习算法不能很好的进行分类,如果需要人为干预要加入很多的domain knowledge,就失去了机器学习的意义,而深度学习就很好的解决了这个问题,使用5-20个隐藏层就能很好的分辨两个物种,而且在分辨物种的同时可以忽略背景、姿势等因素,也就是说深度学习能很好的提取出两个物种的特征并进行分类。
这节里面给出了图1,包含了4个小内容:
1、两个输入,一个隐藏层,一个输出层的神经网络示例
2、链式法则
3、前向传播,是一个计算的过程
4、反向传播,是一个误差传递的过程


这节还提到了SGD随机梯度下降算法

3反向传播算法BP

一开始先说了BP算法的目的是用于替代原来在模式识别中的手工特征提取,给出了BP算法提出,发展的历史介绍。
指出了目前最常用的组成神经网络的神经元的非线性函数是ReLU(以前是sigmoid或者tanh(z)),提到了ReLU的优点。
关于局部最小值的知识在李宏毅的笔记中有写过,就是在复杂模型中不常见。
提到了Canadian Institute for Advanced Research (CIFAR).数据集,写CS231n的作业1就是这个数据集。
提到了pre-training方法,并举例其在语音识别上的应用。

4卷积神经网络CNN

这节直接看李宏毅的学习笔记,CNN
从三个方面讲解了CNN比全连接网络需要的参数要少,并且用固定参数求输入的方式,尝试去理解CNN的各个Filter提取的特征是什么样子的。

5基于深度卷积神经网络的图片理解(Image Understanding)

图三:看图说话CNN+RNN
这个工作在CS231n的2017年的课程里面还有提到,说的是还在做,不知道现在做的怎么样了,不过听讲解神经网络就是玩积木,如果图片识别或分类的CNN和语义生成RNN都训练好了,可以接起来用就ok。
里面还提到了2012年的ImageNet大赛,也是CNN获得冠军的一次比赛,在231n里面的导论有讲。用到的新技术包括:GPU并行、ReLU、抓爆。
提到了硬件的发展大大缩短了CNN复杂模型的训练时间,各大公司都采用了基于CNN视觉系统。一些硬件厂商还开发了专门基于CNN优化的硬件芯片。

6分布表示和语言处理(Language processing)


基于NN的词向量、词嵌入(word embedding),历史上还出现过:基于矩阵的分布表示和基于聚类的分布表示。
首先明确了对于没有使用分布式表示的处理方法而言,分布式表示语言处理有两个优势:
1、可以在训练过程中产生组合特征
2、Vector representations of words learned from text are now very widely used in natural language applications.

One-hot Representation


NLP 中还有一种表示方法称为 One-hot Representation,这种表示方法把每个词表示为一个很长的向量。向量的维度是词表大小,其中绝大多数元素为 0,只有一个维度的值为 1,这个值就代表了当前的词。例如:
“豆浆”=[0,1,0,0,0,0,0,…]
“油条”=[0,0,1,0,0,0,0,…]
采用稀疏方式存储,非常的简单,相当于给每个词分配一个 ID。上例中,豆浆记为 1,油条记为 2(从 0 开始算)。
这种方式的缺点非常明显:
1、向量的维度会随着句子的词的数量增大而增大(10万个词就10维);
2、任意两个词之间都是孤立的,只记录词的位置,无法表示出在语义层面上词语词之间的相关信息。

理解embedding

可以进行词的向量空间的映射,可以表示词的(上下文)含义。

 可以通过一些组合方式对 n 个词进行组合,参数个数仅以线性速度增长。
论文中的图4给出了词和句子embedding的例子


Word2Vec算法

这个算法虽然不了解,但是网上的资料应该很多,NLP还没入坑,先留空,贴个总结帖
https://zhuanlan.zhihu.com/p/26306795

7循环神经网络RNN

RNN也是NN,其特点如下:

 

主要用于时间序列预测,可以理解为带有存储功能的神经网络,每次都会存储之前隐藏层的输出(中间结果)。


LSTM

Long Short-term Memory,是一种特殊的RNN,主要用于解决长序列数据在训练过程中梯度爆炸和梯度消失的问题,比RNN有更好的表现,能处理更长的序列,嫩存储更多的中间结果。

8深度学习的未来

15年的文章,里面写的未来基本就是现在。
非监督学习是深度学习的方向;
强化学习
GAN
2019最新发布,杨立坤提出的自监督学习

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/469778.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

第一周:深度学习引言(Introduction to Deep Learning)

1.1 欢迎(Welcome) 深度学习改变了传统互联网业务,例如如网络搜索和广告。但是深度学习同时也使得许多新产品和企业以很多方式帮助人们,从获得更好的健康关注。 深度学习做的非常好的一个方面就是读取X光图像,到生活中的个性化教育&#xf…

无忧计算机二级试题题库,全国计算机二级MS Office试题

考无忧小编为各位考生搜集整理了的二级MS Office试题,希望可以为各位的备考锦上添花,雪中送炭!记得刷计算机等级考试题库哟!1、被选中要筛选的数据单元格的下拉箭头中有哪几种筛选方式( ABD)A、全部B、前十个C、后十个D、自定义2、…

第二周:神经网络的编程基础之Python与向量化

本节课我们将来探讨Python和向量化的相关知识。 1. Vectorization 深度学习算法中,数据量很大,在程序中应该尽量减少使用循环语句,而可以使用向量运算来提高程序运行速度。 向量化(Vectorization)就是利用矩阵运算的…

U-boot移槙

1、我是照着这里去移植的 http://blog.chinaunix.net/uid-26306203-id-3716785.html 2、然后make 出现问题,到这里去有解决办法:http://blog.csdn.net/zjt289198457/article/details/6854177 : http://blog.csdn.net/zjt289198457/article/details/68…

第三周:浅层神经网络

1. 神经网络综述 首先,我们从整体结构上来大致看一下神经网络模型。 前面的课程中,我们已经使用计算图的方式介绍了逻辑回归梯度下降算法的正向传播和反向传播两个过程。如下图所示。神经网络的结构与逻辑回归类似,只是神经网络的层数比逻辑…

智慧交通day00-项目简介

汽车的日益普及在给人们带来极大便利的同时,也导致了拥堵的交通路况,以及更为频发的交通事故。智能交通技术已成为推动现代技术交通技术发展的重要力量,智能交通不仅能够提供实时的交通路况信息,帮助交通管理者规划管理策略&#…

智慧交通day01-算法库01:numba

1 numba介绍 numba是一个用于编译Python数组和数值计算函数的编译器,这个编译器能够大幅提高直接使用Python编写的函数的运算速度。 numba使用LLVM编译器架构将纯Python代码生成优化过的机器码,通过一些添加简单的注解,将面向数组和使用大量…

计算机语言恢复,win10系统找回消失不见语言栏的恢复方法

win10系统使用久了,好多网友反馈说关于对win10系统找回消失不见语言栏设置的方法,在使用win10系统的过程中经常不知道如何去对win10系统找回消失不见语言栏进行设置,有什么好的办法去设置win10系统找回消失不见语言栏呢?在这里小编…

智慧交通day01-算法库02:imutils

1.imutils功能简介 imutils是在OPenCV基础上的一个封装,达到更为简结的调用OPenCV接口的目的,它可以轻松的实现图像的平移,旋转,缩放,骨架化等一系列的操作。 安装方法: pip install imutils在安装前应确…

智慧交通day01-算法库03:cv.dnn

1.DNN模块 1.1. 模块简介 OpenCV中的深度学习模块(DNN)只提供了推理功能,不涉及模型的训练,支持多种深度学习框架,比如TensorFlow,Caffe,Torch和Darknet。 OpenCV那为什么要实现深度学习模块?…

高标清硬盘播出服务器,高标清4通道SDI硬盘播出服务器 XUAPX4000HD

原标题:高标清4通道SDI硬盘播出服务器 XUAPX4000HDXUAP多通道硬盘自动播出系全系统设计 IP/TS/SDI多种播出模式XUAP系统采用先进硬件译码技术的自动播出系统,可依设定时间自动化切换影片与触发连动外围设备,如 矩阵、录像机、切换器 等&#…

智慧交通day02-车流量检测实现01:总览

随着城市交通量的迅猛增加,车流量统计已成为智能交通系统中一项关键技术和热门研究方向。高效而精确的车流量检测可以交通管理者和决策者,以及驾驶员提供数据支撑,从而为交通调度,降低拥堵情况的发生,提高道路利用率有…

从qq服务器删除误收邮件,如何恢复从qq邮箱删除的电子邮件

Qq邮箱恢复意外删除的邮件方法第1步: 如果您删除邮件,则无论是普通删除还是完整删除,都可以选择在几秒钟内撤消,以便恢复以前意外删除的邮件. 也就是说,在删除消息后,请在删除上述提示后单击“撤消”. 如果提示消息消失…

智慧交通day02-车流量检测实现02:多目标追踪

1.多目标跟踪分类 多目标跟踪,即MOT(Multi-Object Tracking),也就是在一段视频中同时跟踪多个目标。MOT主要应用在安防监控和自动驾驶等领域中。 1.1 初始化方法 多目标跟踪,即MOT(Multi-Object Trackin…

GIT非常好的整理

初始化配置 C代码 #配置使用git仓库的人员姓名 git config --global user.name "Your Name Comes Here" #配置使用git仓库的人员email git config --global user.email youyourdomain.example.com #配置到缓存 默认15分钟 git config --global cred…

centos虚拟机wifi设置代理服务器,vmware虚拟机centos在宿主机连WIF..._网络编辑_帮考网...

caotongjiang新兵答主12-13TA获得超过6747个赞资料:netmask ip地址 broadcast 子网掩码 gateway 网关 dns DNS服务器vmware三种网络连接上网设置:1.桥接方式(bridge) :默认使用vmnet0将虚拟机的ip设置与主机同网段未使用ip,其余与主机相同:ip地址与主机同段相异,子网…

ValueError: check_hostname requires server_hostname的解决办法

在用pip安装scikit-image库时报错:ValueError: check_hostname requires server_hostname 报错ValueError: check_hostname requires server_hostname通常是因为版本冲突等原因,查遍网上众多大佬总结的经验后,最终发现是由网络代理导致的问题…

salesforce 零基础学习(五十四)常见异常友好消息提示

异常或者error code汇总:https://developer.salesforce.com/docs/atlas.en-us.api.meta/api/sforce_api_calls_concepts_core_data_objects.htm 做项目的时候有很多异常是我们经常遇到的: 1.空指针异常; 2.死锁或者超时; 3.级联删…

★Anaconda中创建、切换、删除虚拟环境(指定仓库)

指定仓库安装源文件 pip install 包名 -i http://pypi.douban.com/simple 可以换源列表: 阿里云 https://mirrors.aliyun.com/pypi/simple/ 中国科技大学 https://pypi.mirrors.ustc.edu.cn/simple/ #常用 豆瓣(douban) http://pypi.douban.com/simple/ 清华…

怎样修改t3服务器地址,怎样修改t3服务器地址

怎样修改t3服务器地址 内容精选换一换华为云帮助中心,为用户提供产品简介、价格说明、购买指南、用户指南、API参考、最佳实践、常见问题、视频帮助等技术文档,帮助您快速上手使用华为云服务。Atlas 200 DK开发者板支持通过USB端口或者网线与Ubuntu服务器…