鄂维南:从数学角度,理解机器学习的“黑魔法”,并应用于更广泛的科学问题...

2190e013debb56579436adc62a90c1f0.jpeg

来源:科学智能AISI

北京时间2022年7月8日晚上22:30,鄂维南院士在2022年的国际数学家大会上作一小时大会报告(plenary talk)。今天我们带来鄂老师演讲内容的分享。鄂老师首先分享了他对机器学习数学本质的理解(函数逼近、概率分布的逼近与采样、Bellman方程的求解);然后介绍了机器学习模型的逼近误差、泛化性质以及训练等方面的数学理论;最后介绍如何利用机器学习来求解困难的科学计算和科学问题,即AI for science。文章作者Hertz。

f3e188da9cee4ce0032eca1662f2c2a8.jpeg

机器学习问题的数学本质

众所周知,机器学习的发展,已经彻底改变了人们对人工智能的认识。机器学习有很多令人叹为观止的成就,例如:

· 比人类更准确地识别图片:利用一组有标记的图片,机器学习算法可以准确地识别图片的类别:

6ce96141c8b5fe7b646b32dd2c3cf1ae.jpeg

Cifar-10 问题:把图片分成十个类别

来源:https://www.cs.toronto.edu/~kriz/cifar.html

· Alphago下围棋打败人类:完全由机器学习实现下围棋的算法:

e80a9f4447333f69e8645663c0c8f435.jpeg

参考:https://www.bbc.com/news/technology-35761246

· 产生人脸图片,达到以假乱真的效果:

0bc0918ed1f73adc1e0e32af9b4c4e6d.jpeg

参考:https://arxiv.org/pdf/1710.10196v3.pdf

机器学习还有很多其他的应用。在日常生活中,人们甚至常常使用了机器学习所提供的服务而不自知,例如:我们的邮件系统里的垃圾邮件过滤、我们的车和手机里的语音识别、我们手机里的指纹解锁……

所有这些了不起的成就,本质上,却是成功求解了一些经典的数学问题。

对于图像分类问题,我们感兴趣的其实是函数7e6ff089345d3172af8bbee1d5115200.png

0ed067620461108637833386de0ca64f.png: 图像→类别

函数cda7f511a2ce2e91f8e0df4d182b86e9.png把图像映射到该图像所属的类别。我们知道d5649d32beea0a15bbacda3a3aa92008.png在训练集上的取值,想由此找到对函数8dfc62770533c51bd9491ed6d3304fda.png的一个足够好的逼近

一般而言,监督学习(supervised learning)问题,本质都是想基于一个有限的训练集S,给出目标函数的一个高效逼近

对于人脸生成问题,其本质是逼近并采样一个未知的概率分布。在这一问题中,“人脸”是随机变量,而我们不知道它的概率分布。然而,我们有“人脸”的样本:数量巨大的人脸照片。我们便利用这些样本,近似得到“人脸”的概率分布,并由此产生新的样本(即生成人脸)。

一般而言,无监督学习本质就是利用有限样本逼近并采样问题背后未知的概率分布

对于下围棋的Alphago来说,如果给定了对手的策略,围棋的动力学是一个动态规划问题的解。其最优策略满足Bellman方程。因而Alphago的本质便是求解Bellman方程。

一般而言,强化学习本质上就是求解马尔可夫过程的最优策略

然而,这些问题都是计算数学领域的经典问题!!毕竟,函数逼近、概率分布的逼近与采样,以及微分方程和差分方程的数值求解,都是计算数学领域极其经典的问题。那么,这些问题在机器学习的语境下,到底和在经典的计算数学里有什么区别呢?答案便是:

维度(dimensionality)

例如,在图像识别问题中,输入的维度为93993e370cc29e25e60de96b7b4c6ad6.jpeg。而对于经典的数值逼近方法,对于5771e9e2054d64be8f710e08bb58fb4c.jpeg维问题,含e91a356a6cc658d622363ca7fadfc6b0.png个参数的模型的逼近误差d4214d872fca73b09b983917dc13e114.png. 换言之,如果想将误差缩小10倍,参数个数需要增加7a6f654f8856ea8b4e7100b01e34a21f.jpeg. 当维数96513dd2676b4ddcc20933ce931407ea.jpeg增加时,计算代价呈指数级增长。这种现象通常被称为:

维度灾难(curse of dimensionality)

所有的经典算法,例如多项式逼近、小波逼近,都饱受维度灾难之害。很明显,机器学习的成功告诉我们,在高维问题中,深度神经网络的表现比经典算法好很多。然而,这种“成功”是怎么做到的呢?为什么在高维问题中,其他方法都不行,但深度神经网络取得了前所未有的成功呢?

从数学出发,理解机器学习的“黑魔法”:监督学习的数学理论

2.1 记号与设定

神经网络是一类特殊的函数。比如,两层神经网络是:

615a3323a161e2eb96f9f3d3fa0027a6.jpeg

其中有两组参数,590f1bedb9388ddef41cc13ecde0c52b.jpeg28e8bfb1518bc011fb6e7f32d74f3072.jpeg97ed6ec02a5efe7d9cdb6582057802e5.jpeg是激活函数,可以是:

· 5c686f8f1b51b5127a334bb9b976e762.jpeg,ReLU函数;

· 2946cb7309cf3483edfe0b84dd8b60c5.jpeg,Sigmoid函数。

而神经网络的基本组成部分即为:线性变换与一维非线性变换。深度神经网络,一般就是如下结构的复合:

8fe32dbe537687b7f4354871d4af3c91.jpeg

aafce5b6a5e1997dbea3d21957a54723.jpeg

为了简便,我们在此省略掉所有的bias项36dd6b474faecfb5340e211133d12062.jpeg6f31c3d046c24b53952d3a10491468f7.jpeg是权重矩阵,激活函数9498af40f492f7ec78918e4ddcc10153.jpeg作用在每一个分量上。

我们将要在训练集S上逼近目标函数61dffaf41054650ea23930cd059c7418.png

cf1a2f3d00a30df88d6966ab949db1ae.jpeg

不妨假设6d3c149b19fb2e5e447eb5af3aeccdc2.png的定义域为a0290146941517cc3c8512589aac3e37.jpeg。令20736efdc56c87522976e20fc81fc6ca.pngd55a2c96004a39c60ae2b7b3979545b1.png的分布。那么我们的目标便是:最小化测试误差7d3c0e4f0994cee84391b630a9c75ea4.png(testing error,也称为population risk或generalization error):

3d286f1663006180935ff6b9687cdb8f.jpeg

2.2 监督学习的误差

监督学习一般有如下的步骤:

第一步:选取一个假设空间(测试函数的一个集合)67d62c054ec5f955f09229490e3fc65b.jpeg(m正比于测试空间的维数);

第二步:选取一个损失函数进行优化。通常,我们会选择经验误差(empirical risk)来拟合数据:

28b93ec7bd012d68facdad91874a1e03.jpeg

有时,我们还会加上其他的惩罚项。

第三步:求解优化问题,如:

· 梯度下降:

5f353cbffb892e9d0cc6cbe3c425986f.jpeg

· 随机梯度下降:

dbc3d2563157a582e3f9bb11b8d176fc.jpeg

faa5b5e51dc14ecbd53298170cf46536.jpeg是从1,…n中随机选取的。

如果把机器学习输出的结果记a4cd397f5f5d89fc7d924c375a7c2050.jpeg,那么总误差便是d473f01d20c70666ba2582de833c69b5.jpeg。我们再定义:

4b62fd524217e228e2bdf457fe0507af.jpeg是在假设空间里最好的逼近;

f1779e088656b60e1a19c66c7b88a922.jpeg是在假设空间里,基于数据集S最好的逼近。

由此,我们便可以把误差分解成三部分:

17d01546eeaa5054e1c9c0aa2cffcf37.jpeg

4ee0faf4fc305a613107728276c472ab.jpeg是逼近误差(approximation error):完全由假设空间的选取所决定;

f6742b28c7e8099a850797f88cb5f25f.jpeg是估计误差(estimation error):由于数据集大小有限而带来的额外的误差;

be2038a50ffa898b971ea03c77ed7172.jpeg是优化误差(optimization error):由训练(优化)带来的额外的误差。

2.3 逼近误差

我们下面集中讨论逼近误差(approximation error)。

我们先用传统方法傅立叶变换做一个对比:

3155b42b7e00dea547d2467a15cd5f3c.jpeg

如果我们用离散的傅立叶变换来逼近:

f1ebc05e908892960fa4d5254e6facf5.jpeg

其误差2fcb191d589141004817af108c7936c0.png便是正比于0a98b421c09eb7e90233d920a58c0963.png,毫无疑问地受到维度灾难的影响。

而如果一个函数可以表示成期望的形式:

e1041d95f40badfc7250cb77dd89efac.jpeg

4947c31b4d346fa68bb1ca4e1f93d183.jpeg是测度6f6b8d21f6bfdd188f6333063e92fe41.png的独立同分布样本,我们有:

b13af84e5cfbc443058189f70cd6443c.jpeg

那么此时的误差是:

5a02bbce4fee0462d5fc84dbad6c1031.jpeg

可以看到,这是与维数无关的!

如果让激活函数为35100a8b745eab4b46a17ac3fd994832.jpeg,那么9bcb93c5899749b67abe632f001407ee.jpeg就是以cca98071d250adc6c7eb2e33bab3ada4.jpeg为激活函数的两层神经网络。此结果意味着:这一类(可以表示成期望)的函数,都可以由两层神经网络逼近,且近误差的速率与维数无关

对于一般的双层神经网络,我们可以得到一系列类似的逼近结果。其中关键的问题是:到底什么样的函数可以被双层神经网络逼近?为此,我们引入Barron空间的定义:

c64fc2cb706185026281ddcb61f68fef.jpeg

Barron空间的定义

参考:E, Chao Ma, Lei Wu (2019)

对于任意的Barron函数,存在一个两层神经网络3f48b086138119776612e72a853b3efc.jpeg,其逼近误差满足:

36908e1b001ca5e43d5fa7b0f34e62ce.jpeg

可以看到这一逼近误差与维数无关!(关于这部分理论的细节,可以参考:E, Ma and Wu (2018, 2019), E and Wojtowytsch (2020)。其他的关于Barron space的分类理论,可以参考Kurkova (2001), Bach (2017),

Siegel and Xu (2021))

类似的理论可以推广到残差神经网络(residual neural network)。在残差神经网络中,我们可以用流-诱导函数空间(flow-induced function space)替代Barron空间。

2.4 泛化性:训练误差与测试误差的差别

人们一般会期待,训练误差与测试误差的差别会正比于b688304500fbdac42cfc1371d7880453.png(n是样本数量)。然而,我们训练好的机器学习模型和训练数据是强相关的,这导致这样子的Monte-Carlo速率不一定成立。为此,我们给出了如下的泛化性理论:

593c029cb393d7d332f6847568451116.jpeg

简言之,我们用Rademacher复杂度来刻画一个空间在数据集上拟合随机噪声的能力。Rademacher复杂度的定义为:

9a0fcc3d6acec010f001f8f22acaa7f4.jpeg

其中0cf20db61e010875d9d2fc9d293f04e9.png是取值为1或-1的独立同分布的随机变量。

61ea3c270b227b4ecf3f3d9b3416ccc4.png是李朴西斯空间中的单位球时,其Rademacher复杂度正比于64d5521a2c9a5aa3b556630f3dc2c36c.jpeg

当d增加时,可以看到拟合需要的样本大小指数上升。这其实是另一种形式的维度灾难。

2.5 训练过程的数学理解

关于神经网络的训练,有两个基本的问题:

梯度下降方法到底能不能快速收敛?

训练得到的结果,是否有比较好的泛化性?

对于第一个问题,答案恐怕是悲观的。Shamir(2018)中的引理告诉我们,基于梯度的训练方法,其收敛速率也受维度灾难的影响。而前文提到的Barron space,虽然是建立逼近理论的好手段,但对于理解神经网络的训练却是一个过大的空间。

特别地,这样子的负面结果可以在高度超参数(highly over-parameterized regime)的情形(即m>>n)下得到具体刻画。在此情形下,参数的动力学出现了尺度分离的现象:对于如下的两层神经网络:

4607e818b8f61121ed3317578bbf5620.jpeg

在训练过程中,e8dd9b2d8c3d6657b9ad67e163aa528b.jpeg的动力学分别为:

a1219d77e021dee3ccb88e710098c752.jpeg

由此可以看到尺度分离的现象:当m很大的时候,6d1ec347a0a2d68b92397e06585454e7.jpeg的动力学几乎被冻结住。

这种情形下,好消息是我们有了指数收敛(Du et al, 2018);坏消息却是这时候,神经网络表现得并不比从random feature model模型好。

我们也可以从平均场的角度理解梯度下降方法。令:85a92c63c0597b96985f3dea280976a6.jpeg,并令:

745744851708df6416047e77d1f4d486.jpeg

36458e13fcc39bf7017995cf8eb07f72.jpeg

2e31b2e02fcc5e8b1e1561bd612af46b.png是下列梯度下降问题的解:

2b4b932f8b2d3272a9882178fe2a093e.jpeg

当且仅当0a5acb0f35cf18131183af64b8f97dd2.png是下面方程的解(参考:Chizat and Bach (2018), Mei, Montanari and Nguyen (2018), Rotsko  and Vanden-Eijnden (2018), Sirignano and Spiliopoulos (2018)):

8dc97208304be1f5c4678a80ff73d314.jpeg

这一平均场动力学,实际上是在Wassenstein度量意义下的梯度动力学。人们证明了:如果其初始值7b7b151ca415146c2e3b533a4937e032.png的支集为全空间,且梯度下降的确收敛,那么其收敛结果必然是全局最优(参考:Chizat and Bach (2018,2020), Wojtowytsch (2020))。

机器学习的应用

3.1 解决高维科学计算问题

既然机器学习是处理高维问题的有效工具,我们便可运用机器学习解决传统计算数学方法难以处理的问题。

第一个例子便是随机控制问题。传统方法求解随机控制问题需要求解一个极其高维的Bellman方程。运用机器学习方法,可以有效求解随机控制问题。其思路与残差神经网络颇为类似(参考Jiequn Han and E (2016)):

182f6705c64df412b933fd3d1d09c7db.jpeg

第二个例子便是求解非线性抛物方程。非线性抛物方程可以被改写成一个随机控制问题,其极小点是唯一的,对应着非线性抛物方程的解。

841804fc56c5df0c97fe82eae3ec0288.jpeg

3.2 AI for science

利用机器学习处理高维问题的能力,我们可以解决更多科学上的难题。这里我们举两个例子。第一个例子是Alphafold。

4ccac23f6a6c0e8a55788bf6ce69ca58.jpeg

参考:J. Jumper et al. (2021)

第二个例子,便是我们自己的工作:深度势能分子动力学(DeePMD)。这是能达到从头计算精度的分子动力学。我们所使用的新的模拟“范式”便是:

利用量子力学第一性原理计算提供数据

利用神经网络,给出势能面准确的拟合(参考:Behler and Parrinello (2007), Jiequn Han et al (2017), Linfeng Zhang et al (2018))。

运用DeePMD,我们能够模拟一系列材料和分子,可以达到第一性层面的计算精度

06e6eee0fd47c5271fb9fa6ff8600fbf.jpeg

我们还实现了一亿原子的第一性原理精度的模拟,获得了2020年的戈登贝尔奖

81b5369d895d50e76eeb895db33e05da.jpeg

参考:Weile Jia, et al, SC20, 2020 ACM Gordon Bell Prize

我们给出了水的相图

e701f3743b495cec18673d6ff349b998.jpeg

参考:Linfeng Zhang, Han Wang, et al. (2021)

而事实上,物理建模横跨多个尺度:宏观、介观、微观,而机器学习恰好提供了跨尺度建模的工具

2f8caeb1d48a7e2ff3dd4ffa94f406d1.jpeg

AI for science,即用机器学习解决科学问题,已经有了一系列重要的突破,如:

量子多体问题:RBM (2017), DeePWF (2018), FermiNet (2019),PauliNet (2019),…;

密度泛函理论: DeePKS (2020), NeuralXC (2020), DM21 (2021), …;

分子动力学: DeePMD (2018), DeePCG (2019), …;

动理学方程: 机器学习矩封闭 (Han et al. 2019);

连续介质动力学: eb27eb27db2a88a8238fbb07ae21a85e.png (2020)

在未来五到十年,我们有可能做到:跨越所有物理尺度进行建模和计算。这将彻底改变我们如何解决现实问题:如药物设计、材料、燃烧发动机、催化……

0aedd06fce0bf3ea6564d64175f1e8a5.jpeg

总结

机器学习根本上是高维中的数学问题。神经网络是高维函数逼近的有效手段;这便为人工智能领域、科学以及技术领域提供了众多新的可能性。

这也开创了数学领域的一个新主题:高维的分析学。简而言之,可以总结如下:

监督学习:高维函数理论;

无监督学习:高维概率分布理论;

强化学习:高维Bellman方程;

时间序列学习:高维动力系统。

62873aa4d389e8933ab3b83b3dae9bd4.jpeg

关于AISI

北京科学智能研究院(AI for Science Institute, 以下简称AISI)成立于2021年9月,由鄂维南院士领衔,致力于将人工智能技术与科学研究相结合,加速不同科学领域的发展和突破,推动科学研究范式的革新,建设引领世界的「AI for Science」基础设施体系。

AISI的研究人员来自国内外顶尖高校、科研机构和科技企业,共同聚焦物理建模、数值算法、人工智能、高性能计算等交叉领域的核心问题。

AISI致力于创造思想碰撞的学术环境,鼓励自由探索和跨界合作,共同探索人工智能与科学研究结合的新可能。

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

b0a213c8746998ce12e5e72224649692.jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/481843.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2 小时写了篇论文,凭什么 GPT-3 不配拥有姓名?

来源 :CSDN(ID:CSDNnews)整理:郑丽媛自 OpenAI 推出具有 1750 亿参数的 AI 文本生成模型 GPT-3 后,这两年它便开始在各种不同的领域内“大显身手”:写小说、编剧本、敲代码、与人聊天、设计网页…

基于小样本学习的图像分类技术综述

基于小样本学习的图像分类技术综述 人工智能技术与咨询 昨天 本文来自《自动化学报》,作者李颖等 关注微信公众号:人工智能技术与咨询。了解更多咨询! 图像分类是一个经典的研究课题, 典型的图像分类算法涉及两个问题, 一是如何对图像特征…

Nature子刊 | 像婴儿一样学习,DeepMind新模型28小时学会物理世界规则

来源:机器之心编辑:小舟、陈萍Deepmind 旨在建立一个能够学习直观物理学的模型,并剖析模型实现这种能力的原因。从 AlphaFold 到数学推理,DeepMind 一直在尝试将 AI 和基础科学结合。现在,DeepMind 又创建了一个可以学…

双向特征融合的数据自适应SAR图像舰船目标检测模型

双向特征融合的数据自适应SAR图像舰船目标检测模型 人工智能技术与咨询 昨天 本文来自《中国图象图形学报》,作者张筱晗等 摘要: 利用合成孔径雷达(synthetic aperture radar,SAR)图像进行舰船目标检测是实施海洋监…

采用优化卷积神经网络的红外目标识别系统

采用优化卷积神经网络的红外目标识别系统 人工智能技术与咨询 前天 本文来自《光学精密工程》,作者刘可佳等 关注微信公众号:人工智能技术与咨询。了解更多咨询! 摘要 针对视频数据利用低效和光测设备目标识别能力较弱的问题&#xff0c…

基于知识图谱的直升机飞行指挥模型研究

基于知识图谱的直升机飞行指挥模型研究 人工智能技术与咨询 昨天 本文来自《无线电工程》,作者齐小谦 关注微信公众号:人工智能技术与咨询。了解更多咨询! 摘 要: 针对当前直升机飞行指挥效率低下、数据关系复杂和智能化层次低…

基于深度强化学习的智能船舶航迹跟踪控制

基于深度强化学习的智能船舶航迹跟踪控制 人工智能技术与咨询 昨天 本文来自《中国舰船研究》 ,作者祝亢等 关注微信公众号:人工智能技术与咨询。了解更多咨询! 0. 引 言 目前,国内外对运载工具的研究正朝着智能化、无人化…

基于深度强化学习的区域化视觉导航方法

基于深度强化学习的区域化视觉导航方法 人工智能技术与咨询 本文来自《上海交通大学学报》,作者李鹏等 关注微信公众号:人工智能技术与咨询。了解更多咨询! 在环境中高效导航是智能行为的基础,也是机器人控制领域研究的热点之一.实现自主…

知识图谱的最新进展、关键技术和挑战

知识图谱的最新进展、关键技术和挑战 人工智能技术与咨询 本文来自《 工程科学学报 》,作者马忠贵等 随着知识的不断积累和科学的飞速发展,人类社会进行了多次改变社会结构的重大生产力革命。最近的生产力革命正是由Web技术发展引发的信息革命。伴随…

NASA发布史上最深的宇宙全彩照!韦伯如何回传150万公里外的太空数据?

来源:大数据文摘作者:Mickey2022年7月11日凌晨,乔拜登总统、副总统卡玛拉哈里斯和美国国家航空航天局局长比尔纳尔逊公布了耗资100亿美元的詹姆斯韦伯太空望远镜的首秀!这是詹姆斯韦伯太空望远镜(JWST)发布了第一批图像。本张图片…

基于改进YOLO v3网络的夜间环境柑橘识别方法

基于改进YOLO v3网络的夜间环境柑橘识别方法 人工智能技术与咨询 本文来自《农业机械学报》,作者熊俊涛等 关注微信公众号:人工智能技术与咨询。了解更多咨询!

Nature走出重要的一步:研究代谢个体间差异的比较系统

来源:生物通一组线虫生物学家利用来自世界不同地区的四种不相关的秀丽隐杆线虫(C. elegans),开发了一个模型系统来研究新陈代谢的个体差异。这一进步代表着向“个性化”或“精准”医学迈出了潜在的重要一步。“精准”医学是一门相对较新的学科&#xff0…

工业和信息化部办公厅关于公布2021年产业技术基础公共服务平台复核结果的通知

工业和信息化部办公厅关于公布2021年产业技术基础公共服务平台复核结果的通知 人工智能技术与咨询 工业和信息化部办公厅关于公布2021年产业技术基础公共服务平台复核结果的通知 工信厅科函〔2021〕266号 北京市、上海市、广东省、吉林省、安徽省、河北省工业和信息化主管部…

英伟达用AI设计GPU算术电路,面积比最先进EDA减少25%,速度更快、更加高效

来源:机器之心随着摩尔定律的放缓,在相同的技术工艺节点上开发能够提升芯片性能的其他技术变得越来越重要。在这项研究中,英伟达使用深度强化学习方法设计尺寸更小、速度更快和更加高效的算术电路,从而为芯片提供更高的性能。大量…

国家自然科学基金项目经费怎么用有了新规定

国家自然科学基金项目经费怎么用有了新规定 人工智能技术与咨询 来源:光明日报 为破除科研经费在申请、管理、使用方面存在的“难点”“堵点”和“痛点”,今年8月,《国务院办公厅关于改革完善中央财政科研经费管理的若干意见》正式印发。作…

无人系统群体智能及其研究进展

来源:无人机作者:周兴社,武文亮(西北工业大学 计算机学院,陕西 西安 710129)摘 要:群体智能是人工智能的重要发展方向之一.无人系统群体智能作为人工群体智能的主要形态之一,在许多军用和民用领域都具有广阔…

工信部推动第二批“5G+工业互联网”实践的通知

工信部推动第二批“5G工业互联网”实践的通知 人工智能技术与咨询 工业和信息化部办公厅关于印发第二批“5G工业互联网”十个典型应用场景和五个重点行业实践的通知 工信厅信管函〔2021〕279号 各省、自治区、直辖市及计划单列市、新疆生产建设兵团工业和信息化主管部门&…

AI进军学术界:自己写稿自己发,提醒人类“密切监控”自己

来源:网易新闻(网络一线牵)采写/编译:南都见习记者杨博雯“我只是希望我没有打开潘多拉的盒子。”当哥德堡大学的研究员Almira Osmanovic Thunstrm完成研究时,反而这样表示。她研究的内容是让AI自己完成一篇关于自身的…

基于句式元学习的Twitter分类

关注微信公众号:人工智能技术与咨询。了解更多咨询! 基于句式元学习的Twitter分类 人工智能技术与咨询 本文来自《北京大学学报(自然科学版)》,作者闫雷鸣等 摘要 针对多类别的社交媒体短文本分类准确率较低问题, 提出一种学习多种句式的…

OpenAI 研究员:数据不足时,如何实现监督学习

来源:AI科技评论作者:Lilian Weng编译:丛末编辑:陈彩娴现实应用中,数据易得,而有标签的数据少有。一般而言,当监督学习任务面临标签数据不足问题时,可以考虑以下四种解决办法&#x…