AI与物理学的交汇:Hinton与Hopfield获诺贝尔物理学奖

诺贝尔物理学奖颁给了AI!机器学习先驱Hinton与Hopfield联手获奖,出乎所有人的意料。

图片

今年的诺贝尔物理学奖颁给了机器学习领域的两位先驱,杰弗里·辛顿(Geoffrey Hinton)和约翰·霍普菲尔德(John Hopfield)。这打破了此前人们关于该奖项可能颁发给凝聚态物理或量子物理领域科学家的预测。机器学习,尤其是神经网络技术,成为今年的获奖领域,标志着人工智能技术在科学界获得了前所未有的认可。这一奖项表彰的是他们为人工神经网络的研究与发展所做出的基础性贡献,这些工作不仅在计算机科学领域产生了深远影响,更从根本上改变了我们理解和模拟人类大脑工作的方式。

那么,AI和机器学习与物理学到底有什么关系?诺贝尔奖委员会的解答给出了答案:Hinton和Hopfield在构建人工神经网络的过程中,借鉴并应用了物理学中的许多概念和方法。正是这些来自物理学的工具,帮助他们找到信息处理中的关键特征,并成功构建了如今深度学习革命的技术基础。

Hopfield提出的“Hopfield神经网络”,以相当于物理学中自旋系统能量的方式进行描述。

Hinton提出的“玻尔兹曼机”,则使用了统计物理学中的工具。

后来Hinton在这项工作的基础上,帮助启动了当前机器学习的爆炸性发展,也就是我们熟知的深度学习革命了。

图片

霍普菲尔德神经网络:物理与生物的桥梁

霍普菲尔德是神经网络领域的奠基人之一。1933年出生的他,在1954年获得了斯沃斯莫尔学院的物理学学士学位,1958年在康奈尔大学取得博士学位。早期的他专注于物理化学和凝聚态物理的研究,但在贝尔实验室工作期间,霍普菲尔德逐渐对分子生物学产生了浓厚的兴趣。正是在这种背景下,他开始思考如何将物理学的方法应用于大脑神经元网络的研究。

图片

人工神经网络的基本思想是模拟人类大脑中神经元的连接与信号传递过程。大脑中的神经元通过突触传递信号,当我们学习新事物时,一些神经元之间的连接变强,而另一些则变弱。霍普菲尔德在20世纪80年代提出的“霍普菲尔德神经网络”通过物理学中的自旋系统能量来描述神经元之间的连接,揭示了这些复杂网络中的动态过程。

后来,人们开始尝试利用计算机模拟大脑的网络功能,进而构建出人工神经网络。

在这些网络中,大脑的神经元被模拟为具有不同值的节点,突触则由节点之间的连接来表示,这些连接的强度可以增强或减弱。唐纳德·赫布的假设至今仍然是训练人工网络、更新其连接强度的基本规则之一。

在接下来的很长一段时间里,学术界都致力于通过数学和物理的方法来研究和探索生物神经网络的工作机制。

图片

例如,约翰·霍普菲尔德(John Hopfield)曾利用自己在物理学方面的背景,研究分子生物学中的理论问题。后来,他受邀参加了一次关于神经科学的会议,会上他接触到了有关大脑结构的研究。这些研究深深吸引了他,使他开始思考神经网络的动态行为。

霍普菲尔德意识到,当神经元群体共同作用时,它们能够产生新的、强大的特性,这些特性是单独观察网络各个组件时无法显现出来的。

1980年,霍普菲尔德离开了普林斯顿大学,研究兴趣逐渐从物理学领域转向神经科学。他搬到了加州理工学院(Caltech),在那里他能够利用免费的计算机资源进行实验,进一步发展他对神经网络的想法。

尽管霍普菲尔德进入了神经科学领域,但他从未放弃其物理学的根基,反而在其中找到了宝贵的灵感。他特别受益于对磁性材料的研究。这类材料因其原子自旋(使每个原子都如同微型磁铁的特性)而拥有独特的性质。相邻原子的自旋相互影响,能够形成同向排列的自旋区域。霍普菲尔德借用了物理学中的这一描述,构建了一个由节点和连接组成的模型,当自旋相互影响时,网络就会产生特定的行为模式。

与生物神经网络不同,人工神经网络是由编码数值的节点构成的。当网络进行训练时,节点之间的连接强度会随着节点的活动频率而增强或减弱,类似于神经元之间的突触连接。

Hopfield构建的网络节点通过不同强度的连接相互连接。

图片

每个节点可以存储一个单独的值——在Hopfield的第一次工作中,这可以是0或1,就像黑白图片中的像素格一样。

Hopfield用一个属性来描述网络的总体状态,这相当于物理学中自旋系统中的能量;能量是使用一个公式计算的,该公式使用所有节点的值和它们之间所有连接的强度。霍普菲尔德网络通过将图像输入到节点,赋予它们黑色(0)或白色(1)的值来编程。

然后,网络的连接使用能量公式进行调整,以便保存的图像获得低能量。当另一个模式输入到网络时,有一个规则是逐个检查节点,看看如果改变该节点的值,网络的能量是否会降低。

如果发现如果黑色像素是白色,能量会降低,它就会改变颜色。这个过程继续进行,直到无法找到进一步的改进。

当达到这一点时,网络通常已经在它被训练的原始图像上复制了自己。

如果只保存一个模式,这可能看起来并不那么引人注目。

也许你想知道为什么你不只是保存图像本身并与正在测试的另一个图像进行比较,但Hopfield的方法之所以特别,是因为可以同时保存多张图片,网络通常可以在它们之间进行区分。

Hopfield将搜索网络以寻找保存的状态比作在有摩擦减缓其运动的山峰和山谷景观中滚动一个球。

如果球被放在一个特定的位置,它会滚进最近的山谷并在那里停止。如果网络被给予一个接近保存模式之一的模式,它将以同样的方式继续前进,直到它最终到达能量景观中的山谷底部,从而找到记忆中最接近的模式。

图片

后来,霍普菲尔德和他的同事们进一步改进了网络,使得节点可以存储不仅仅是0或1的值,而是多个值,如图片中的像素可以有不同的颜色,而不仅仅是黑白。改进后的模型使得网络能够保存更多图像,并且即使图像非常相似,它们也能被成功区分。这意味着网络不仅可以识别信息,还可以根据输入重建数据,只要数据由足够多的点构成。

不过,记住一个图像是一回事,解释它代表的含义又是另一回事。即使是很小的孩子,也可以通过观察不同的动物,并指出它们是狗、猫或松鼠。虽然偶尔会出错,但他们很快就能正确分辨。孩子们无需学习复杂的分类规则,通过接触多个例子,他们的大脑能够自然形成类别概念。人们也是通过日常的体验,学会识别猫,理解词汇,或通过观察环境的变化来感知事物。

当霍普菲尔德发表他的联想记忆理论时,杰弗里·辛顿(Geoffrey Hinton)正在卡内基梅隆大学工作。辛顿此前在英国和苏格兰学习实验心理学和人工智能,并一直思考机器是否能够像人类一样,通过模式处理和分类,找到有效的信息解释方式。

辛顿与玻尔兹曼机:推动深度学习的革命

杰弗里·辛顿,作为神经网络领域的另一位领军人物,进一步推动了这一领域的发展。辛顿于1947年出生,早期在英国学习实验心理学和人工智能,后来在卡内基梅隆大学工作。

图片

在1980年代,辛顿与同事Terrence Sejnowski一起,利用统计物理学中的一些基本工具扩展了霍普菲尔德神经网络的模型。

他们的研究借鉴了统计物理学中由玻尔兹曼方程描述的理论。玻尔兹曼方程揭示了物质在不同能量状态下的分布概率,这一理论在复杂系统的分析中具有重要意义。辛顿用这一思想提出了“玻尔兹曼机”,这种神经网络能够通过学习训练,逐步调整节点之间的连接强度,从而在模式识别和数据处理上表现出色。

图片

虽然玻尔兹曼机的早期版本训练效率较低,但辛顿始终没有放弃对这一领域的研究。到了2006年,他和他的团队提出了“深度信念网络”(Deep Belief Nets),开启了深度学习的新时代。深度信念网络的无监督逐层训练方法极大地提高了神经网络的学习效率,成为了现代深度学习算法的核心基础。这一突破直接推动了当今人工智能的爆炸性发展,为语音识别、图像处理、自动驾驶等领域的应用奠定了坚实的技术基础。

图片

在最后,诺贝尔奖委员会提到,Hopfield和Hinton两人在80年代的工作为2010年左右开始的机器学习革命奠定了基础。

物理学与机器学习的交汇点

机器学习与物理学的联系不仅仅停留在理论层面。在实践中,物理学的方法论也大大加速了机器学习的发展。例如,物理学中的统计学方法帮助研究人员理解如何通过调整神经网络的参数来优化学习过程。此外,物理学中处理复杂系统的方法也为机器学习处理大规模数据提供了强大的工具。

另一方面,机器学习也为物理学提供了新的工具。近年来,机器学习技术在希格斯粒子发现、引力波探测等物理研究中得到了广泛应用,帮助物理学家处理海量数据、去除噪声、提升实验效率。更进一步,机器学习还被用于预测材料和分子的性质,推动新型材料的研发和发现。

双料得主辛顿:图灵奖与诺贝尔奖的荣耀

辛顿的卓越贡献不仅为他赢得了诺贝尔物理学奖,早在2018年,他便因其对深度学习领域的贡献,获得了计算机科学领域的最高荣誉——图灵奖。成为同时拥有诺贝尔奖和图灵奖的科学家,辛顿与赫伯特·西蒙(Herbert Simon)齐名。西蒙因其在人工智能和人类认知领域的开创性工作,分别获得1975年的图灵奖和1978年的诺贝尔经济学奖。

辛顿与西蒙的共同点在于,他们都跨越了多个学科,将计算机科学与其他领域结合,推动了跨学科研究的巨大进步。他们的工作不仅对人工智能和机器学习领域产生了深远影响,也为未来科学的发展提供了更多可能性。

今年诺贝尔物理学奖颁给Hinton和Hopfield,既是对他们在神经网络和机器学习领域卓越贡献的肯定,也展现了物理学与计算机科学之间的深刻联系。随着AI技术的不断进步,未来我们可能会看到更多类似的跨学科成果,而这也正是科学不断发展的魅力所在。

图片

参考链接:
[1]https://www.nobelprize.org/
[2]https://www.cs.toronto.edu/~fritz/absps/ncfast.pdf

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/55931.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

CSS计数器

CSS 中的计数器类似于变量,可以实现简单的计数功能,并将结果显示在页面上,在早期的网站上应用比较广泛。要实现计数器需要用到以下几个属性: counter-reset:创建或者重置计数器;counter-increment&#xf…

【软件部署安装】OpenOffice转换PDF字体乱码

现象与原因分析 执行fc-list查看系统字体 经分析发现,linux默认不带中文字体,因此打开我们本地的windows系统的TTF、TTC字体安装到centos机器上。 安装字体 将Windows的路径: C:\Windows\Fonts 的中文字体,如扩展名为 TTC 与TT…

力扣题31~40

题31(中等): 分析: 其实这题题目比较难懂,题目还是挺简单的 我们可以从后面末尾开始,如果前一个大于后面的,说明后面不用动,如果小于,那就找仅仅大于它的数字放前面&…

Chromium 关闭 Google Chrome 后继续运行后台应用功能分析c++

此功能允许关闭 Google Chrome 后继续运行后台,控制此功能的开关是 // Set to true if background mode is enabled on this browser. //更改此值可以修改默认开启关闭 inline constexpr char kBackgroundModeEnabled[] "background_mode.enabled"; …

案例分享—国外优秀UI设计作品赏析

深色UI界面的优点众多,首先体现在视觉舒适度上。深色背景能减少屏幕高亮面积,降低眼部压力,尤其在夜间或光线不足的环境下,深色模式能显著缓解眼睛疲劳,提供更舒适的使用体验。 深色UI界面在设计上更具高端感和优雅氛围…

用Raspberry Pi Imager重装树莓派系统

今天删东西的时候,无意中把系统文件给remove了,结果树莓派无法正常启动,只能重新安装。 用DiskGenius工具将SD卡彻底清空,并将boot分区和文件分区合并为一,之后再对这个新分区进行了格式化。接下来就是烧录镜像了。以…

自动化测试 | 窗口截图

driver.get_screenshot_as_file 是 Selenium WebDriver 的一个方法,它允许你将当前浏览器窗口(或标签页)的截图保存为文件。这个方法对于自动化测试中的截图验证非常有用,因为它可以帮助你捕获测试执行过程中的页面状态。 以下是…

布隆过滤器(Bloom Filter)详解

一、引言 在处理大量数据的场景中,我们经常会遇到判断一个元素是否在某个集合中的问题。传统的方法可能是使用 HashMap 等集合将数据保存起来,然后进行比较确定,但在元素很多的情况下,这种方式会非常浪费空间,检索速度…

Map的实现类:TreeMap

1.存储结构:红黑树 2.实现了SortedMap接口(是Map的子接口),可以对key自动排序。 3.实例代码:Student类和Demo03 如果出现类转换异常 参考【TreeSet(红黑树)】 package com.map;import java…

使用Git生成SSH密钥教程(附Git常用命令)

一、为什么使用SSH? 使用 Git 的 SSH(安全外壳协议)主要有以下几个原因:1. 安全性:SSH 是一种加密的网络协议,用于在网络中安全地运行网络服务。使用 SSH,所有传输的数据都会被加密&#xff0c…

Lory: 推进大型语言模型训练的新篇章

人工智能咨询培训老师叶梓 转载标明出处 随着模型规模的增长,如何有效训练并利用这些模型成为了一个挑战。陈丹琦团队一项新的研究提出了一种创新的预训练方法——Lory,旨在解决大模型在混合专家(MoE)架构中的可微分性和计算效率…

主机加固的关键要素:服务器防病毒

在数字化浪潮中,网络安全已成为企业不可忽视的一环。尤其是安全运维人员,他们肩负着保护企业数据不受侵害的重任。MCK主机加固解决方案,正是为了应对这一挑战而生。 网络安全的严峻现实 不久前,一家知名企业因勒索病毒攻击而被迫…

2024 kali虚拟机安装教程,分两大步骤,图文讲解(1)

第二步链接: 2024 kali虚拟机安装教程,分两大步骤,图文讲解(2)-CSDN博客 准备工作 1.kali的iso镜像文件 2.VMware Workstation Pro 虚拟机软件 正式开始 1.创建新的虚拟机,勾选自定义(高级…

ssm基于SSM框架的餐馆点餐系统的设计+VUE

系统包含:源码论文 所用技术:SpringBootVueSSMMybatisMysql 免费提供给大家参考或者学习,获取源码请私聊我 需要定制请私聊 目 录 摘要 I Abstract II 1绪论 1 1.1研究背景与意义 1 1.1.1研究背景 1 1.1.2研究意义 1 1.2国内外研究…

【AGC005D】~K Perm Counting(计数抽象成图)

容斥原理。 求出f(m) ,f(m)指代至少有m个位置不合法的方案数。 怎么求? 注意到位置为id,权值为v ,不合法的情况,当且仅当 v idk或 v id-k 因此,我们把每一个位置和权值抽象成点 ,不合法的情况之间连一…

Docker容器简介及部署方法

1.1 Docker简介 Docker之父Solomon Hykes:Docker就好比传统的货运集装箱 2008 年LXC(LinuX Contiainer)发布,但是没有行业标准,兼容性非常差 docker2013年首次发布,由Docker, Inc开发 1.1.1什么是Docker Docker是管理容器的引…

数据结构-LRU缓存(C语言实现)

遇到困难,不必慌张,正是成长的时候,耐心一点! 目录 前言一、题目介绍二、实现过程2.1 实现原理2.2 实现思路2.2.1 双向链表2.2.2 散列表 2.3 代码实现2.3.1 结构定义2.3.2 双向链表操作实现2.3.3 实现散列表的操作2.3.4 内存释放代…

Java后端面试----某团一面

美团一面 1.介绍一下你的第一个项目 这个就不多说了,主要是根据自己的简历上面的项目进行一个简短的概括使用的技术栈和什么背景解决了什么问题等等。 2.线程安全的类有哪些,平时有使用过哪些,主要解决什么问题 在Java中线程安全的类比如…

vue使用table实现动态数据报表(行合并)

<template><div class"previewTable"><h2>***项目研发数据报告</h2><table id"previewTable" width"100%"><tr><th>项目名称</th><td colspan"6">{{ resultData.proName }}<…

【D3.js in Action 3 精译_030】3.5 给 D3 条形图加注图表标签(下):Krisztina Szűcs 人物专访 + 3.6 本章小结

当前内容所在位置&#xff08;可进入专栏查看其他译好的章节内容&#xff09; 第一部分 D3.js 基础知识 第一章 D3.js 简介&#xff08;已完结&#xff09; 1.1 何为 D3.js&#xff1f;1.2 D3 生态系统——入门须知1.3 数据可视化最佳实践&#xff08;上&#xff09;1.3 数据可…