消失了一周的小夕在玩什么啦?

啊,你们的小夕回来啦~

 

 

有没有被吓到( ̄∇ ̄)

0

小夕在玩什么

 

小夕,终于,在今天,把,各种deadline,完成了(´Д` )

 

首先,小夕要像大家深深的说一声谢谢啦。好多天没有打开订阅号的后台,今天一开,发现好多后台留言,满满的鼓励和正能量~好开心好开心o(≧v≦)o~但是今天为了省出时间写文章,小夕就迟一点再回复啦~

 

当小夕在文章标题竟然用了“玩”这个字的时候,深深的感到了自己的虚伪和丧心病狂(´Д` )哪有这么玩命的玩的呀(╯°Д°)╯︵ /(.□ . \)

 

小夕想了想,“玩”的这几件事中,好像英语的presentation没什么好讲的。。。项目的事情也不能透露啦,但是论文的事情当然可以跟大家分享啦(反正论文又不是我写的,喵喵喵)

 

在开始之前,小夕温馨提示,关注人工智能但是非专业从业者的同学请备好退烧药,关注人工智能且是从业者的同学请备好小本本,不关注人工智能但是喜欢小夕的童鞋可以欣赏一下小夕简(纯)洁(属)优(偷)美(懒)的PPT\(//∇//)\不关注人工智能也不喜欢小夕的童鞋,小夕打你哦!

1

一篇神奇的论文

 

还记不记得小夕为大家绘制的人工智能大地图呢?人工智能,有一个能力就是逻辑推理呀~当它记忆了足够的知识后,如果只是死记硬背不懂思考的话,那么这个人工智能也太蠢了,很难有所成就,所以让人工智能具备推理的能力是必须的~

 

下面呢,小夕就参考Socher等人在2013年的这篇论文,来给大家讲解如何将深度学习用于知识的推理。(老师规定ppt必须做成英文的,小夕也没办法呀…)

 

小夕不太放心,还是再啰嗦一下啦。下面小夕要讲的内容可能对于初学者而言理解难度有点大,不过看不懂的话留个印象也是好的呀~而且小夕以后会逐步为大家讲解基础知识,一步步的为看不懂的同学填上现有基础到这篇论文的鸿沟~

2

准备好了喵!

  

小夕将从如下3个方面给大家介绍一下啦。

 

 

首先是小夕的任务:(结合PPT后面小夕的讲解来看PPT哦)

 

 

本任务的数据集是一个知识库,这个知识库是由实体(entity)以及实体之间的关系(relation)组成的。比如图中的“姚明”entity与“上海”entity之间的relation就是“born-in”。

 

其中每两个实体以及它们之间的关系就构成一个样本。而我们就是要根据这些样本训练出一个Neural Tensor Network模型(以下简称NTN啦),然后用这个模型去推理知识库中的隐含的实体之间的relation。

 

 

因此,小夕的目标就是基于已有的知识库来学习到一个叫NTN的神经网络,然后将训练好的模型用于做推理。

 

 

这里我们直观的看一下数据集,一行就是一个样本。第一列和第三列是样本的两个实体,中间是它们的关系。小夕统计了一下,一共有11种relation。

 

 

然后我们如何用NTN网络来完成这个任务呢?

 

 

首先,我们将这11个relation看成11个分类任务,所以模型就是由11个子分类器组成的。然后每个子分类器就是负责判别输入的两个实体是不是符合它所负责的relation。那么问题来了,模型的输入,也就是实体,该如何表示呢?

 

 

左边三个蓝框就是三个relation,我们直接看最下面蓝框的第一个样本,其中e1是Bengal tiger,e2是tiger。NTN模型中的entity就可以表示成entity内部的单词的词向量的均值。所以这个Bengal tiger实体就会取Bengal和tiger的均值啦。所以每个entity依然是词向量大小的一个向量。

 

 

这里是NTN网络的假设函数。可以看到,如果小夕将e1WRe2这一项去掉,这就是一个全联接神经网络啦(经典的浅层前馈神经网络),这个全联接神经网络就是将两个entity向量连接起来做为输入。但是显然这样失去了entity之间的交互了呀,所以需要NTN网络中的tensor层完成e1与e2的交互,这个实体间的交互信息对于这两个实体的关系推理是至关重要的。

 

 

然后损失函数就很常见啦,这就是一个对比最大间隔损失函数再加上L2正则化。

 

 

下面就是小夕对该论文的复现(实验)环节啦。

 

 

基本流程就是这样子的:预处理-训练NTN网络-通过开发集调整超参数-分类(自动推理)和可视化。

 

 

开发环境是这样子的。深度学习框架用的TensorFlow。由于这里11万的训练样本也不少啦,虽然网络不太深。所以需要用CUDA来进行GPU并行计算。

 

 

这个是模型的超参数,论文中给出啦,所以小夕就将其固定了。(这里各种超参数就取字面意思啦,其中,corrupt_size就是为训练集的每个样本产生出多少个负样本,来进行损失函数中的对比最大间隔的计算。这里的slice_size就是tensor层的深度)

 

 

小夕的第一次试验是惨不忍睹的。不过看小夕这偷懒的参数初始化方式也很容易想到,问题肯定出在初始化上。。。

 

 

小夕改良了一下初始化方法,果然提升了5个百分点。然而论文中是86%的准确率呀,差的这13个百分点,一般不会完全是AdaGrad的锅,或者决策阈值的锅。因此,小夕继续改良初始化。

 

 

这次,小夕将tensor层的W参数改为Xavier方法了。果然~通过调整初始化,足足提升了12%的准确率。

 

 

这里就是Xavier方法的细节,其实就是说将W在上面这个区间里进行均匀分布的抽样会很好的~这里的n(l)和n(l+1)就是W的输入与输出,所以这里就是entity向量的大小啦,也就是词向量的大小。

 

 

第四次试验,小夕通过开发集训练得到了11个relation的最优决策阈值,又提升了4%的精度。虽然这个精度的提升会随模型参数的变化而变化,而且规律性不强。

 

 

这里就是84.14%的实验的训练曲线与测试曲线啦,可以看出训练曲线最弯的地方就是测试曲线准确度最高的地方~

 

 

这个是论文作者实现的对11个relation的准确率。

 

 

这个是小夕实现的。可以看到,除了第一个domain_topic小夕的准确率莫名其妙的比论文中高了好多,其他relation的准确率跟论文中差不太多的。

 

 

最后总结一下啦。反正准确率就是比论文低了2个百分点。而论文中明确说了Adagrad会在这里表现不佳,损失精度,论文中使用L-BFGS来优化的。然而tensorflow中没有实现L-BFGS啊,小夕也懒得再去引入其他库折腾了。所以tensorflow为这2%背锅啦。

听说,打赏功能受限了?那小狐狸就要复出啦!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/481223.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

第四届泰迪杯数据挖掘大赛

<script src"//g.alicdn.com/aliyun/goldeneye-deploy/0.0.1/static/goldeneye.js"></script> <link rel"stylesheet" href"//at.alicdn.com/t/font_422887_vrqbpml6oos.css"><!--top-header begin-->云栖社区博客问答聚…

一般化机器学习与神经网络

0前言机器学习的初学者很容易被各种模型搞得晕头转向。如果扎进各种模型的细节无法自拔的话&#xff0c;可能很难发现一般化的框架。如果你觉得神经网络是非常不同的机器学习模型&#xff0c;如果你觉得神经网络的各种新名词让你觉得这完全就是一片新天地&#xff0c;那么可能你…

扩散模型再发力!图灵奖得主Hinton团队提出:图像和视频全景分割新框架

来源&#xff1a;机器之心作者&#xff1a;Ting Chen 等 编辑&#xff1a;赵阳本文的创新点一方面在于能够在大型全景掩码上训练扩散模型&#xff0c;一方面在于可以同时适配图片和流媒体场景。全景分割是一项基本的视觉任务&#xff0c;该任务旨在为图像的每个像素指定语义标…

经典的K-means聚类算法

原理部分主要来自大牛zouxy09和trnadomeet两个人的博客&#xff1b;后面的代码详细讲解为自己精心编写 一、概述 非监督学习的一般流程是&#xff1a;先从一组无标签数据中学习特征&#xff0c;然后用学习到的特征提取函数去提取有标签数据特征&#xff0c;然后再进行分类器的训…

《Cell》发现免疫系统的“武器研发实验室”

来源&#xff1a;生物通如果B细胞是免疫系统的兵工厂&#xff0c;制造抗体来中和有害的病原体&#xff0c;那么被称为生发中心的微小生物结构就是它的武器开发设施。.淋巴结的生发中心簇充满了成熟的B细胞(红色)&#xff0c;点缀着进化程度较低的B细胞(绿色)。 如果B细胞是免…

机器学习从理论到工程的第一步-编程语言篇

前言在文章《机器学习从业者如何兼顾理论与工程》中&#xff0c;小夕对编程语言的选择进行了小小建议。鉴于有些同学对小夕建议的“主python&#xff0c;辅C&#xff0c;备用matlab和java”疑问较大&#xff0c;小夕在此详细解释一下&#xff0c;也欢迎大家补充新观点哦。为什么…

聚类算法当中的K-means算法如何去做天猫淘宝的推广任务

5 人赞同了该回答figure data-size"normal">data-size"normal">这个入口是全网人气新品池&#xff0c;我们今天所获取到的数据都是来源于这里。无论是C店还是B店&#xff0c;统统都有机会进来。这个平台最有价值的数据&#xff0c;就是可以告诉我们自…

通过双重众包预测 RNA 降解的深度学习模型

编辑 | 萝卜皮基于信使 RNA (mRNA) 的药物具有巨大的潜力&#xff0c;正如它们作为 COVID-19 疫苗的快速部署所证明的那样。然而&#xff0c;mRNA 分子的全球分布受到其热稳定性的限制&#xff0c;这从根本上受限于 RNA 分子对称为在线水解的化学降解反应的固有不稳定性。预测 …

线性代数应该这样讲(一)

前言小夕为什么要讲线性代数呢&#xff1f;因为有人已经做了机器学习一段时间了&#xff0c;竟然认为矩阵就是用来存储数据的。小夕表示非常震惊。而深刻透彻的理解核函数、PCA、LSI、谱聚类等以空间映射为理论核心的机器学习理论时&#xff0c;靠大学里教的那一套线性代数&…

震惊!丧心病狂的夕小瑶推出新一轮写作计划!

时至今日&#xff0c;距离小夕发布的第一篇正式文章已经过去整三个月啦。今天又回头看了一下自己写的第一篇文章&#xff0c;不禁有点感慨“文风”变了这么多&#xff0c;甚至有点受不了第一篇文章中的萌气了\(//∇//)\然后文章还写的不怎么样。。。虽然第一篇文章写的好差&…

LeCun预言的自监督模型来了:首个多模态高性能自监督算法,语音、图像文本全部SOTA...

来源&#xff1a;机器之心编辑&#xff1a;nhyilin人类似乎对不同的学习模式有着相似的认知&#xff0c;机器也应该如此&#xff01;>>>>自监督学习能在各种任务中学习到分层特征&#xff0c;并以现实生活中可使用的海量数据作为资源&#xff0c;因此是走向更通用人…

史上最清楚的BP算法详解

前馈神经网络 在文章《逻辑回归到神经网络》&#xff08;以下简写《LR到NN》&#xff09;中&#xff0c;小夕为大家描述了一个从逻辑回归延伸到神经网络的过程。在《一般化机器学习与神经网络》中&#xff0c;小夕阐述了神经网络的一般性。这一篇会完全进入神经网络的状态&…

基于主动学习算法减少人工标注量,提升文本标注效率的方案探究

基于主动学习算法减少人工标注量&#xff0c;提升文本标注效率的方案探究阅读 451收藏 232018-06-26原文链接&#xff1a;yq.aliyun.comOPPO技术开放日第三期&#xff0c;未来的探索 AI&AR的实践应用juejin.im项目地址: https://github.com/crownpku/Chinese-Annotator 自…

具有生物启发训练方法的物理深度学习:物理硬件的无梯度方法

编辑 | 绿萝对人工智能不断增长的需求推动了对基于物理设备的非常规计算的研究。虽然此类计算设备模仿了大脑启发的模拟信息处理&#xff0c;但学习过程仍然依赖于为数字处理优化的方法&#xff0c;例如反向传播&#xff0c;这不适合物理实现。在这里&#xff0c;来自日本 NTT …

BP算法是从天上掉下来的吗?

第二个标题&#xff1a;一般而特殊的前馈神经网络前馈神经网络在文章《逻辑回归到神经网络》&#xff08;以下简写《LR到NN》&#xff09;中&#xff0c;小夕为大家描述了一个从逻辑回归延伸到神经网络的过程。在《一般化机器学习与神经网络》中&#xff0c;小夕阐述了神经网络…

深度学习如何应用在广告、推荐及搜索业务?阿里妈妈实践案例解读

</span></ul><div class"markdown-body"><div id"meta_content" class"rich_media_meta_list"> </div>阿里妹导读&#xff1a;靖世&#xff0c;阿里妈妈精准展示技术研究员。2011 年&#xff0c;刚进阿里的他提出…

AI for Science的上半场:人工智能如何重新定义科学研究新范式?

AI发展七十余年&#xff0c;每一技术性突破都将给人类未来开辟新一种可能性。而它与科学研究的深度融合&#xff0c;则会裂变出无数或无穷种可能性。来源 :36氪万众瞩目下&#xff0c;今年10月&#xff0c;有着诺贝尔奖“嫡传”之称的诺贝尔化学奖终于揭晓&#xff0c;授予了对…

从前,小夕种了一棵树

从前&#xff0c;小夕种了一棵树&#xff0c;种在了小夕的小屋后面~为什么要种这棵树呢&#xff1f;因为呀&#xff0c;它可以帮小夕总结历史经验&#xff0c;然后帮小夕对当前的局势做出决策~这样小夕就可以安心给大家写文章啦~这棵树是这样的。一开始&#xff0c;小夕买了一颗…

用于化学动力学模拟的原子神经网络表示

编辑 | 白菜叶机器学习技术已广泛应用于化学、物理、生物学和材料科学的许多领域。最富有成果的应用之一是从离散量子化学数据中学习势能或相关电子特性的复杂多维函数。特别是&#xff0c;大量努力致力于开发各种原子神经网络 (AtNN) 表示&#xff0c;这些表示是指将目标物理量…

自然语言生成任务,如文本摘要和图像标题的生成。seq2seq的模型原理

版权声明&#xff1a;本文为博主原创文章&#xff0c;未经博主允许不得转载。 https://blog.csdn.net/Irving_zhang/article/details/78889364 </div><link rel"stylesheet" href"https://csdnimg.cn/release/phoenix/template/css/ck_htmledit…