当代人工智能三教父——深度学习三巨头

文章目录

引言

人物介绍

突出贡献 

专业名词解释


引言

今天下午闲来无事翻阅了一下csdn首页的头条文章——《27 岁天才创始人 Joel Hellermark 分享了自己和“AI 教父” Geoffery Hinton 的最新采访》

感觉挺有意思,就从头到尾的看了一遍,里面有很多自己以前从未涉及到的知识,就浅显的整理了一下:

人物介绍

杨立昆(Yann LeCun)、杰弗里·欣顿(Geoffrey Hinton)和约书亚·本希奥(Yoshua Bengio)

被业内称为“当代人工智能三教父”

 杨立昆(Yann LeCun),在法国皮埃尔和玛丽·居里大学获得计算机科学博士学位。现任纽约大学柯朗数学科学研究所Silver冠名教授、Facebook公司人工智能首席科学家、副总裁。他获得了包括美国工程院院士、IEEE神经网络先锋奖(IEEE Neural Network Pioneer Award)等一系列荣誉。他还是纽约大学数据科学中心的创始人,与约书亚·本希奥一起担任加拿大先进研究院机器与大脑学习项目的主管。

杰弗里·欣顿(Geoffery Hinton),在爱丁堡大学获得人工智能博士学位。现任谷歌公司副总裁、工程研究员,多伦多人工智能矢量研究所首席科学顾问、多伦多大学名誉教授。他是加拿大先进研究院神经计算和自适应项目(Neural Computation and Adaptive Perception Program)的创始人,还获得了加拿大最高荣誉勋章(Companion of the Order of Canada)、英国皇家学会成员、美国工程院外籍院士、人工智能国际联合会(IJCAI)杰出研究奖等一系列荣誉。2017年被彭博社(Bloomberg)评为改变全球商业格局的50人之一。

约书亚·本希奥(Yoshua Bengio),在加拿大麦吉尔大学取得计算机博士学位。现为加拿大蒙特利尔大学教授、加拿大数据定价中心主任(IVADO)、蒙特利尔学习算法研究中心(Mila)科学主任、加拿大先进研究院主任。他还与杨立昆一起担任加拿大先进研究院机器与大脑学习项目的主管。他创建了目前世界上最大的深度学习研究中心——蒙特利尔学习算法研究中心,使蒙特利尔成为世界上人工智能研究最为活跃的地区之一,引来大批公司和研究室入驻。

突出贡献 

三位科学家发明了深度学习的基本概念,在实验中发现了惊人的结果,也在工程领域做出了重要突破,帮助深度神经网络获得实际应用。

Hinton 最重要的贡献来自他1986年发明反向传播的论文 “Learning Internal Representations by Error Propagation”;1983年发明的玻尔兹曼机(Boltzmann Machines),以及2012年对卷积神经网络的改进

Hinton 和他的学生 Alex Krizhevsky 以及 Ilya Sutskever 通过 Rectified Linear Neurons 和 Dropout Regularization 改进了卷积神经网络,并在著名的 ImageNet 评测中取得了很好的成绩,在计算机视觉领域掀起一场革命。

Bengio 的贡献主要在1990年代发明的 Probabilistic models of sequences。他把神经网络和概率模型(例如隐马尔可夫模型)结合在一起,并和 AT&T 公司合作,用新技术识别手写的支票。现代深度学习技术中的语音识别也是这些概念的扩展。

此外 Bengio 还于2000年还发表了划时代的论文“A Neural Probabilistic Language Model”,使用高维词向量来表征自然语言。他的团队还引入了注意力机制,让机器翻译获得突破,也成为了让深度学习处理序列的重要技术。

Yann LeCun 的代表贡献之一是卷积神经网络。1980年代,LeCun 发明了卷积神经网络,现在已经成为了机器学习领域的基础技术之一,也让深度学习效率更高。1980年代末期,Yan LeCun 在多伦多大学和贝尔实验室工作期间,首次将卷积神经网络用于手写数字识别。

今天,卷积神经网络已经成为了业界标准技术,广泛用于计算机视觉、语音识别、语音合成、图片合成,以及自然语言处理等学术方向,以及自动驾驶、医学图片识别、语音助手、信息过滤等工业应用方向。

LeCun 的第二个重要贡献是改进了反向传播算法。他提出了一个早期的反向传播算法 backprop,也根据变分原理给出了一个简洁的推导。他的工作让反向传播算法更快,比如描述了两个简单的方法可以减少学习时间。

LeCun 第三个贡献是拓展了神经网络的应用范围。他把神经网络变成了一个可以完成大量不同任务的计算模型。他早期引进的一些工作现在已经成为了人工智能的基础概念。

例如,在图片识别领域,他研究了如何让神经网络学习层次特征,这一方法现在已经用于很多日常的识别任务。他们还提出了可以操作结构数据的深度学习架构。

Geoffrey Hinton

反向传播:在 1986 年与 David Rumelhart 和 Ronald Williams 共同撰写的 “Learning Internal Representations by Error Propagation” 一文中,Hinton 证明了反向传播算法允许神经网络发现自己的数据内部表示,这使得使用神经网络成为可能网络解决以前被认为超出其范围的问题。如今,反向传播算法是大多数神经网络的标准。

玻尔兹曼机(Boltzmann Machines):1983 年,Hinton 与 Terrence Sejnowski 一起发明了玻尔兹曼机,这是第一个能够学习不属于输入或输出的神经元内部表示的神经网络之一。

卷积神经网络的改进:2012 年,Hinton 和他的学生 Alex Krizhevsky 以及 Ilya Sutskever 通过 Rectified Linear Neurons 和 Dropout Regularization 改进了卷积神经网络,并在著名的 ImageNet 评测中将对象识别的错误率减半,在计算机视觉领域掀起一场革命。

Yoshua Bengio

序列的概率模型:在 20 世纪 90 年代,Bengio 将神经网络与序列的概率模型相结合,例如隐马尔可夫模型。这些想法被纳入 AT&T / NCR 用于阅读手写支票中,被认为是 20 世纪 90 年代神经网络研究的巅峰之作。现代深度学习语音识别系统也是这些概念的扩展。

高维词汇嵌入和关注:2000 年,Bengio 撰写了具有里程碑意义的论文“A Neural Probabilistic Language Model”,它引入了高维词向量作为词义的表示。Bengio 的见解对自然语言处理任务产生了巨大而持久的影响,包括语言翻译、问答和视觉问答。他的团队还引入了注意力机制,这种机制促使了机器翻译的突破,并构成了深度学习的序列处理的关键组成部分。

生成性对抗网络:自 2010 年以来,Bengio 关于生成性深度学习的论文,特别是与 Ian Goodfellow 共同开发的生成性对抗网络(GAN),引发了计算机视觉和计算机图形学的革命。

Yann LeCun

卷积神经网络:在 20 世纪 80 年代,LeCun 研发了卷积神经网络,现已成为该领域的基本理论基础。其让深度学习更有效。在 20 世纪 80 年代后期,多伦多大学和贝尔实验室工作期间,LeCun 是第一个在手写数字图像上训练卷积神经网络系统的人。如今,卷积神经网络是计算机视觉以及语音识别、语音合成、图像合成和自然语言处理的行业标准。它们用于各种应用,包括自动驾驶、医学图像分析、语音激活助手和信息过滤。

改进反向传播算法:LeCun 提出了一个早期的反向传播算法 backprop,并根据变分原理对其进行了简洁的推导。他的工作让加快了反向传播算,包括描述两种加速学习时间的简单方法。

拓宽神经网络的视野:LeCun 还将神经网络作为可以完成更为广泛任务的计算模型,其早期工作现已成为 AI 的基础概念。例如,在图像识别领域,他研究了如何在神经网络中学习分层特征表示,这个理念现在通常用于许多识别任务中。与 LéonBottou 一起,他还提出了学习系统可以构建为复杂的模块网络,其中通过自动区分来执行反向传播,目前在每个现代深度学习软件中得到使用。他们还提出了可以操作结构化数据的深度学习架构,例如图形。

专业名词解释

人工智能 (AI) 是一组技术,使计算机能够执行各种高级功能,包括查看、理解和翻译口语和书面语言、分析数据、提出建议等各种能力。

卷积神经网络(Convolutional Neural Network, CNN)是一种深度学习模型,通常用于图像、视频、语音等信号数据的分类和识别任务。

计算机视觉(Computer Vision)是一种利用计算机和数学方法对图像和视频进行分析和处理的技术。

机器翻译(Tencent Machine Translation,TMT)结合了神经机器翻译和统计机器翻译的优点,从大规模双语语料库自动学习翻译知识,实现从源语言文本到目标语言文本的自动翻译,目前可支持十余种语言的互译。

机器学习是一种人工智能的分支,它是指让计算机通过学习数据和模式,从而自动改进和优化算法的能力。简单来说,机器学习是一种让计算机从数据中学习的方法,而不是通过手动编程来实现特定的任务。

自动驾驶是指通过计算机视觉、传感器、机器学习等技术,使汽车、无人机等车辆实现自主驾驶、导航和避障等功能,不需要人类驾驶员进行干预或者只需要有限的干预。

语音合成(Text To Speech,TTS)满足将文本转化成拟人化语音的需求,打通人机交互闭环。提供多场景、多语言的音色选择,支持 SSML 标记语言,支持自定义音量、语速等参数,让发音更专业、更符合场景需求。语音合成广泛适用于智能客服、有声阅读、新闻播报、人机交互等业务场景。

语音助手是一种基于人工智能技术的智能语音交互系统,能够通过语音和人类用户进行沟通,帮助用户完成各种操作或提供各种服务。

结构化数据是指具有固定格式和规则的数据,通常以表格、树状结构或关系模型的形式呈现。结构化数据通常具有明确的数据类型和字段,可以进行数据建模和数据分析等操作。结构化数据的常见形式包括关系型数据库中的表格、XML文档、CSV文件、JSON数据等。

蒙特卡洛树搜索(Monte Carlo Tree Search, MCTS)是一种基于统计学习的启发式搜索算法,用于解决决策问题或增强学习问题。它是以蒙特卡洛方法为基础,通过模拟大量的随机游戏来评估每个节点的价值,从而选择最优的决策路径。

MCTS主要分为四个步骤:选择(Selection)、扩展(Expansion)、模拟(Simulation)和回溯(Backpropagation)。在每一步中,算法会根据当前节点的信息,通过模拟多次随机游戏来评估不同决策路径的优劣,并选择一个最具有潜在价值的节点进行扩展和模拟,最终通过回溯来更新每个节点的价值估计,以辅助做出最佳决策。

蒙特卡洛树搜索在围棋、象棋等棋类游戏中取得了很好的效果,并在人工智能领域得到广泛应用。它的优势在于可以应对状态空间庞大、不确定性高的决策问题,并且可以在搜索的过程中动态调整策略,以适应不同情况下的决策需求。

反向传播(Backpropagation)是一种在神经网络中用于计算梯度并更新模型参数的算法。在训练一个神经网络时,我们需要通过最小化损失函数来调整网络参数,以使得模型能够更好地拟合训练数据。而反向传播就是一种通过计算损失函数关于每个参数的梯度,然后根据这些梯度来更新参数的方法。

通常包含以下步骤:

  1. 前向传播:通过输入数据以及当前的参数设定,计算得到模型的预测输出。

  2. 计算损失:将模型的输出与真实标签进行比较,计算出模型的损失函数值。

  3. 反向传播梯度计算:从输出层开始,通过链式法则计算损失函数对于每个参数的偏导数,即梯度。这一过程将梯度从输出层传播回到输入层。

  4. 参数更新:利用梯度下降等优化算法,根据计算得到的梯度信息更新神经网络中的参数。这一步骤会使得损失函数的值逐渐减小,使得模型表现得更好。

通过反向传播算法,神经网络可以在训练过程中不断调整参数,以使得模型表现更好地拟合训练数据,提高其泛化能力。反向传播算法是深度学习中非常重要的一部分,它使得训练深层神经网络变得可能,并且被广泛应用于各种神经网络结构中。

大语言模型(Large Language Model)是指具有大量参数和大规模数据训练得到的语言模型。语言模型是一种用来估计自然语言文本序列概率的模型,可以用来预测下一个单词或者生成连续的文本。

大语言模型通常基于神经网络架构,例如循环神经网络(RNN)或者变换器(Transformer)等。这些模型在训练时需要大规模的文本数据集,以及大量的计算资源和时间。通过在大规模数据集上进行训练,大语言模型可以学习到更复杂的语言结构和规律,从而在生成文本、翻译、文本分类等自然语言处理任务中表现更好。

一些著名的大语言模型包括GPT-3(Generative Pre-trained Transformer-3)和BERT(Bidirectional Encoder Representations from Transformers)。这些模型在各种自然语言处理任务中取得了令人瞩目的成绩,使得自然语言处理领域取得了重大的进展和突破。

多模态输入指的是包含多种不同类型数据的输入,例如文本、图像、音频、视频等多种形式的数据。在自然语言处理和计算机视觉领域,多模态输入成为了一个研究热点,因为实际应用场景中往往需要同时处理多种类型的数据来完成任务。

例如,在图像描述生成任务中,输入包含图像和文本描述,模型需要通过处理图像和文本数据来生成描述图片内容的文本。在视频理解任务中,输入可能包含视频、音频和文本,模型需要结合这些不同类型的数据来理解视频内容。在智能对话系统中,输入可能包含文本和声音等多种形式的数据,模型需要综合考虑多种数据类型来进行回答和交互。

多模态输入的处理通常需要结合多种不同类型数据的特征表示和融合方法,以便模型可以有效地利用不同数据类型之间的相关性和信息。

知识蒸馏(Knowledge Distillation)是一种模型压缩技术,旨在通过在一个较大复杂模型(教师模型)和一个较小简单模型(学生模型)之间进行知识迁移,从而提高小模型的性能。知识蒸馏的基本思想是利用教师模型的知识(soft labels、logits和attention weights等)来指导学生模型,以便学生模型学习到更深层次、更丰富的特征表示,从而达到提升性能的目的。

在知识蒸馏中,教师模型通常是一个较大的深度神经网络,拥有较高的性能和表达能力,而学生模型则是一个简化版本的模型,通常具有更少的参数和计算量。通过知识蒸馏,学生模型可以利用教师模型的复杂知识和经验,更有效地学习到数据的特征表示,从而在保持模型精度的同时减少计算和内存消耗。

MATLAB代码是使用MATLAB编程语言编写的程序或脚本。MATLAB是一种高级的数学软件,广泛用于科学和工程领域。MATLAB代码可以用来执行各种数学计算、数据分析、图形绘制等任务。MATLAB代码通常采用矩阵表示数据和进行计算,具有强大的数学计算能力和丰富的功能库。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/14075.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

pyqt5与yolov5进行视频检测(一)——登录操作

项目效果展示 一、登录界面 二、主界面 目前在更新中。。。 一、设计 二、登录代码 注意:下面会导入主界面的包,图片资源自己设计一下,密码保存时没设计加密,需要自行设计 main_window主界面下文会设计from main_window impor…

无线通信的穿墙能力主要取决于哪些指标

无线通信的穿墙能力是指无线信号在穿越建筑物墙壁时,其信号衰减程度以及能否维持足够强度以进行稳定通信的能力。穿墙能力的好坏直接影响到无线通信在室内环境中的覆盖范围和使用体验。 一、无线信号的频率 无线信号的频率是影响穿墙能力的重要因素之一。一般来说…

工行音视频服务平台建设与应用经验

近些年来,伴随着技术能力的积累突破,音视频服务开始蓬勃生长走进千家万户,使用远程视频通话、观看各类视频直播逐渐成为人们的日常,而金融服务作为社会生活的重要组成部分,自然需要积极拥抱应用新技术。 如今&#xff…

20232820 2023-2024-2 《网络攻防实践》实践十一报告

20232820 2023-2024-2 《网络攻防实践》实践十一报告 1.实践内容 web浏览器渗透攻击 任务:使用攻击机和Windows靶机进行浏览器渗透攻击实验,体验网页木马构造及实施浏览器攻击的实际过程 取证分析实践—网页木马攻击场景分析 攻防对抗实践—web浏览…

非关系型数据库NOSQL

文章目录 1. NOSQL 概述2. 相关理论基础2.1 一致性2.2 分区2.3 存储分布2.4 查询模型 3. NOSQL 数据库的种类3.1 文档存储3.2 键值存储3.3 列存储3.3 图存储 4. NOSQL 应用案例和新技术4.1 HBase 数据库4.2 云数据库 GeminiDB 非关系型的数据库 NOSQL (Not Only SQL)是对不同于…

linux-x86_64-musl 里面的musl是什么意思?

在一些开源库里面可以看到,linux-x86_64-musl类似于这样的字符串,这个musl是什么意思呢? 在字符串 "linux-x86_64-musl" 中,musl 指的是 musl libc,这是一个轻量级的 C 标准库实现。 让我们来拆解一下这个字…

Unity性能优化工具介绍

文章目录 一.Stats组件1.Audio音频的数据组件:2.图形数据 二.Profiler 性能分析器 一.Stats组件 Unity自带Statistics(统计数据),Game视窗中点击Stats打开 1.Audio音频的数据组件: 1):Level 声音强度 单位是分贝(dB) 表示音频听声音的大小,是闪烁波动的. 2):SDPload 数据信…

阅读笔记——《AFLNeTrans:状态间关系感知的网络协议模糊测试》

【参考文献】洪玄泉,贾鹏,刘嘉勇.AFLNeTrans:状态间关系感知的网络协议模糊测试[J].信息网络安全,2024,24(01):121-132.【注】本文仅为作者个人学习笔记,如有冒犯,请联系作者删除。 目录 摘要 1、引言 2、背景及动机 2.1、网络协议实现程…

每日AIGC最新进展(9):定制化多主题文本到视频的生成、3D动漫角色生成、具有多种几何形状和纹理细节的3D高斯引导服装合成

Diffusion Models专栏文章汇总:入门与实战 DisenStudio: Customized Multi-subject Text-to-Video Generation with Disentangled Spatial Control 本文提出了一个名为DisenStudio的框架,用于定制化多主题文本到视频的生成。该框架旨在解决现有文本到视频生成模型在处理多主题…

C++小病毒

C小病毒&#xff08;注&#xff1a;对电脑无过大伤害&#xff09; 短短行&#xff0c;创造奇迹&#xff01; 把这个文件命名为virus.exe就可以使用了。 #include<bits/stdc.h> #include<windows.h> using namespace std; int main() {HWND hwnd GetForegroundW…

Unity射击游戏开发教程:(24)创造不同的敌人

在这篇文章中,我们将讨论添加一个可以承受多次攻击的新敌人和一些动画来使事情变得栩栩如生。敌人没有任何移动或射击行为。这将有助于增强未来敌人的力量。 我们将声明一个 int 来存储敌人可以承受的攻击数量,并将其设置为 3。

PDF24 Creator v11.12.1软件安装教程(附软件下载地址)

软件简介&#xff1a; 软件【下载地址】获取方式见文末。注&#xff1a;推荐使用&#xff0c;更贴合此安装方法&#xff01; PDF24 Creator v11.12.1是一款免费、简便实用的多功能 PDF 工具。用户可通过直观拖放界面轻松组合、编辑和处理PDF文件。功能包括合并、分割、添加、…

Java开发工具类(JDK、Hutool、Guava)

目录 Java开发常用的工具类1、JDK自带程序读取控制台输入内容&#xff08;调试程序或者学习的时候比较有用&#xff09;Arrays工具类 数组转集合Collections 集合工具类 排序Collections 集合工具类 查找Lambda表达式 操作集合 收集、转map、分组 2、Apache 的 commons-lang3 和…

一文解读:OA中会议管理功能,帮助设计师看清楚门道

会议管理是OA系统中的重要功能之一&#xff0c;它涉及到会议的组织、安排、记录和跟进等方面。本文将从以下四个方面介绍会议管理在OA系统中的功能、流程、设计注意事项和所涉界面。 一、OA中会议管理的功能 OA中常用的会议功能如下&#xff1a; 会议预约&#xff1a;OA系统提…

RedisTemplate操作Redis, 看这一篇文章就够了

文章目录 1. String 命令1.1 添加缓存1.2 设置过期时间(单独设置)1.3 获取缓存值1.4 删除key1.5 顺序递增1.6 顺序递减1.7 常用的 2. Hash命令2.1 添加缓存2.2 设置过期时间(单独设置)2.3 添加一个Map集合2.4 提取所有的小key2.5 提取所有的value值2.6 根据key提取value值2.7 获…

1812 java二手汽车销售管理系统Myeclipse开发mysql数据库web结构java编程计算机网页项目

一、源码特点 jsp 二手汽车销售管理系统 是一套完善的web设计系统&#xff0c;对理解JSP java编程开发语言有帮助采用了java设计&#xff0c;系统具有完整的源代码和数据库&#xff0c;系统采用web模式&#xff0c;系统主要采用B/S模式 开发。开发环境为TOMCAT7.0,Myeclipse8…

【优选算法】模拟 {经验总结;相关编程题解析}

一、经验总结 模拟题型的算法原理相对简单&#xff0c;就是依葫芦画瓢&#xff1a;题目中怎样描述&#xff0c;算法就怎样执行。考验的主要是将实际问题转换为代码的能力。 但是模拟题型并不是只能傻乎乎的按步骤编码&#xff0c;也可以先将模拟算法的流程通过举例或绘图演示…

Excel插入多行VBA实现

我们还可以利用 VBA&#xff08;Visual Basic for Applications&#xff09;宏语言&#xff0c;在 Excel 中写一个 VBA 宏来自动插入多行数据。这种方法可以方便我们自定义需要插入的行数和插入位置。下面是编写 VBA 宏的步骤&#xff1a; 1、按下Alt F11快捷键&#xff0c;打…

VS QT 里头文件的<>和““的区别

今天在跑项目的时候遇到这么个问题&#xff0c;在添加api宏定义的时候&#xff0c;不加显示无法识别的外部错误&#xff0c;加了显示找不到文件。反正就是怎么都是错的&#xff0c;但是我检查了CmakeLists、模块所在文件夹、项目路径都是没有问题的。非常奇怪。 然后就开始尝试…

linux安装KubeSphere

linux安装KubeSphere 介绍 KubeSphere 是在目前主流容器调度平台 Kubernetes 之上构建的企业级分布式多租户容器平台&#xff0c;提供简单易用的操作界面以及向导式操作方式&#xff0c;在降低用户使用容器调度平台学习成本的同时&#xff0c;极大减轻开发、测试、运维的日常…