java 做直播网站有哪些软件有哪些/全网营销的公司

java 做直播网站有哪些软件有哪些,全网营销的公司,东莞凤岗做网站,专业制作结婚证论文笔记整理:谭亦鸣,东南大学博士生,研究方向为知识库问答。来源:ACL2019本文构建了一个面向复杂推理任务的多选问答数据集 HEAD-QA,该数据集中的问题来自一个西班牙的医疗保健专业测试,对于具备该方向专业…

论文笔记整理:谭亦鸣,东南大学博士生,研究方向为知识库问答。



来源:ACL2019

           

     本文构建了一个面向复杂推理任务的多选问答数据集 HEAD-QA,该数据集中的问题来自一个西班牙的医疗保健专业测试,对于具备该方向专业知识的人也具有一定的挑战性。在原始数据的基础上,作者还考虑了“单语-即西班牙语”,“跨语言-西班牙语到英语”两种问答场景,分别使用信息检索和神经网络技术进行实验对比,并得到结论:1.HEAD-QA数据集对于当前的方法来说是具有相当难度的问答数据集;2.该数据集上的实验结果还远远低于人类回答者的水平,这表明其能够作为未来工作的benchmark。

表1是该数据集的一个示例:

动机

      作者发现,对于现有的问答数据集如:bAbI,SQuAD 等,如今的问答系统已经能够取得接近于人类级别的答题性能,且这些问题往往都能够被“Surface-Level”的知识直接解答。因此,多选和推理类型的问题被提出用于自动问答的研究,早期问题集一般来自于学校,如小学的自然科学等学科,以及后来的中学或高中知识。但是这些数据集并没有涉足例如医药等复杂领域,因此,作者考虑构建这样一个数据集用于问答领域的研究工作。

 

贡献   

作者认为本文的贡献如下:

  1. 构建了HEAD-QA,一个涵盖医疗保健多个子领域知识的高难度多选问答数据集,且包含西班牙语和英语两种版本;

  2. 在上述数据集的基础上,测试了当前面向开放域和多选的问答模型,体现出该数据集的复杂性以及其对于QA研究的实用性。

开源数据和模型链接:http://aghie.github.io/head-qa/

 

方法

数据集构建

Ministerio de Sanidad, Consumo y Bienestar Social(西班牙政府机构)每年举行的一个面向公众医疗保健领域的考试,作者收集了自2013年起至今的所有试题作为HEAD-QA的原始数据源,其中包含了以下子领域:医学,药理,心理学,护理,生物学和化学。其中2013-14年的多选题包含五个选项,其他年份均为四个选项,其问题内容主要面向技术,同时也包含一定的社会问题,其中约14%的问题含有图片作为问题的附加信息,由以下形式呈现:


       作者将数据整理为JSON结构并添加说明于文章的附录A中,每个问题的构成包含以下几点:

  1. 问题的ID和内容

  2. 问题对应的图片路径(如果有)

  3. 候选答案列表(包含答案序号和答案文本)

  4. 问题对应的正确答案ID

作者指出,虽然本文测试使用的模型均采用无监督或远程监督,但他们依然提供了训练集验证集和测试集供其他相关方法的研究使用。对于有监督方法,将2013-14数据作为训练集,2015作为验证集,其他年份数据作为测试集。相关统计信息如表2和表3所示:

作者表示,之所以没有使用随机抽取等常规构建训练集的方法有两个原因:

  1. 每年的问答数据均由专家人工构建,且主观上已经避免了考试内容可能存在的明显偏向性;

  2.  随机抽取可能破坏这种人工获得的优质问题分布

 

关于英文版本:虽然上述数据集仅有西班牙语官方版本,但作者使用Google翻译API将其译制为英文版本,从而用于跨语言问答实验。论文随机抽取了60个翻译样本(问答对)进行评估,发现翻译保留了原始问题绝大部分的题意。

 

测试方法

    本文的测试基于信息检索(IR)模型,主要参照 Chen 等人(2017),作者以Wikipedia作为信息数据源,用于所有baseline中。输入问题仅为原始问题文本(移除了相关的ID,JSON结构信息)

 

西班牙语IR(单语问答)

IR方法上,沿用 DrQA’s Document Retriver(Chen et al., 2017),该方法能够对query和文本向量之间的关系进行打分。

 

跨语言方法

a)  Multi-choice DrQA:

DrQA对于输入的问题,首先返回五个最相关的文本,接下来的任务是从中找出包含正确答案的文本范围(exact span),这一步利用一个神经网络模型(Attentive Reader,Hermann et al., 2015)来实现,该模型由SQuAD数据集训练得到。

b)     Multi-choice BiDAF:

该方法与上述DrQA类似,但是用BiDAF方法作为文本阅读器,只是它的训练方式有所不同,除了使用SQuAD训练外,之后再利用science question进行继续训练,该方法可能选择到不止一个的正确答案,当出现这种情况时,作者会选择文本长度最长的那个作为最终选项。

c)     Multi-choiceDGEM and Decompatt(Clark et al., 2018):

该方法采用DGEM和Decompatt用于IR,主要考虑将hypthesis hik=qi+aik,每个hi用作query从而检索到相关的文本句子,接着entailment分数用于衡量每个h与句子之间的相关性。

实验

       论文采用准确度作为问答的评价指标,同时构建一种得分累计机制参与系统性能评价:即,答对加3分,答错扣1分。

        以下是实验结果:

1.    非监督设定下的实验结果

2.    监督设定下的实验结果

对比人工回答的实验结果如下:


 


 

OpenKG

开放知识图谱(简称 OpenKG)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

点击阅读原文,进入 OpenKG 博客。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/479307.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Poor Man's BERT: 更小更快的Transformer模型

文 | sliderSun源 | 知乎NLP模型的大小不断增加,随之而来的是可用性降低,TinyBERT,MobileBERT,和DistilBERT都提出了一个独特的知识蒸馏框架,其共同目标是在保持性能的同时减小模型大小。尽管所有这些方法都以各自的方…

LeetCode 429. N叉树的层序遍历(queue)

1. 题目 返回其层序遍历:[[1],[3,2,4],[5,6] ]2. 解题 queue队列解题 /* // Definition for a Node. class Node { public:int val;vector<Node*> children;Node() {}Node(int _val, vector<Node*> _children) {val _val;children _children;} }; */ class Solu…

Android官方开发文档Training系列课程中文版:管理Activity的生命周期之Activity的重建

原文地址&#xff1a;http://android.xsoftlab.net/training/basics/activity-lifecycle/recreating.html#RestoreState 有这么几个关于activity通过正常渠道销毁的场景&#xff0c;比如用户按下了返回按钮&#xff0c;又或者是在activity中调用了终止信号finish。系统可能也会…

Java动态追踪技术探究

引子 在遥远的希艾斯星球爪哇国塞沃城中&#xff0c;两名年轻的程序员正在为一件事情苦恼&#xff0c;程序出问题了&#xff0c;一时看不出问题出在哪里&#xff0c;于是有了以下对话&#xff1a; “Debug一下吧。” “线上机器&#xff0c;没开Debug端口。” “看日志&#xf…

论文浅尝 | 从树结构的长短期记忆网络改进语义表示

论文笔记整理&#xff1a;窦春柳&#xff0c;天津大学硕士&#xff0c;方向&#xff1a;自然语言处理链接&#xff1a;https://arxiv.org/pdf/1503.00075.pdf动机由于长短期记忆网络&#xff08;LSTM&#xff09;这种具有复杂单元的循环神经网络具有良好的表示序列信息的能力&a…

详解NLP技术中的:预训练模型、图神经网络、模型压缩、知识图谱

NLP近几年非常火&#xff0c;且发展特别快。像BERT、GPT-3、图神经网络、知识图谱等技术应运而生。我们正处在信息爆炸的时代、面对每天铺天盖地的网络资源和论文、很多时候我们面临的问题并不是缺资源&#xff0c;而是找准资源并高效学习。但很多时候你会发现&#xff0c;花费…

根因分析初探:一种报警聚类算法在业务系统的落地实施

背景 众所周知&#xff0c;日志是记录应用程序运行状态的一种重要工具&#xff0c;在业务服务中&#xff0c;日志更是十分重要。通常情况下&#xff0c;日志主要是记录关键执行点、程序执行错误时的现场信息等。系统出现故障时&#xff0c;运维人员一般先查看错误日志&#xff…

论文浅尝 | BAG:面向多跳推理问答得双向 Attention 实体图卷积网络

论文笔记整理&#xff1a;谭亦鸣&#xff0c;东南大学博士生&#xff0c;研究兴趣&#xff1a;知识图谱问答来源&#xff1a;NAACL 2019链接&#xff1a;https://www.aclweb.org/anthology/N19-1032/实现多跳推理问答需要模型能够充分理解文本和 query 之间的关系&#xff0c;本…

Android官方开发文档Training系列课程中文版:使用Fragment构建动态UI之构建灵活的UI

原文地址&#xff1a;http://android.xsoftlab.net/training/basics/fragments/fragment-ui.html 当设计应用程序时需要支持尺寸较大的宽屏设备时&#xff0c;可以基于可用的屏幕空间在不同的布局中配置并重新使用fragment来提升用户体验。 举个例子&#xff0c;手持设备在同…

LeetCode 669. 修剪二叉搜索树

1. 题目 给定一个二叉搜索树&#xff0c;同时给定最小边界L 和最大边界 R。通过修剪二叉搜索树&#xff0c;使得所有节点的值在[L, R]中 (R>L) 。你可能需要改变树的根节点&#xff0c;所以结果应当返回修剪好的二叉搜索树的新的根节点。 来源&#xff1a;力扣&#xff08…

Pytorch翻车记录:单卡改多卡踩坑记!

文 | 哟林小平知乎先说明一下背景&#xff0c;目前正在魔改以下这篇论文的代码&#xff1a;https://github.com/QipengGuo/GraphWriter-DGLgithub.com由于每次完成实验需要5个小时&#xff08;baseline&#xff09;&#xff0c;自己的模型需要更久&#xff08;2倍&#xff09;&…

使用docker部署flask项目

前言 本次部署是把2个项目、mysql、redis、uwsgi封装在一个容器中&#xff0c;ngnix封装在一个容器中 实际应用中最好是&#xff1a; 项目和uwsgi封装在一个容器中mysql单独封装&#xff0c;可能还要读写分离&#xff0c;主从同步等redis单独封装&#xff0c;可能还要读写分离&…

论文浅尝 | DRUM:一种端到端的可微的知识图谱上的规则学习方法

论文笔记整理&#xff1a;张文&#xff0c;浙江大学在读博士&#xff0c;研究方向为知识图谱的表示学习&#xff0c;推理和可解释。现有的多数链接预测方法都不能处理新的实体&#xff0c;并且多为黑盒方法&#xff0c;使得其预测结果无法解释。本文提出了一种新的端到端的可微…

WSDM Cup 2019自然语言推理任务获奖解题思路

WSDM&#xff08;Web Search and Data Mining&#xff0c;读音为Wisdom&#xff09;是业界公认的高质量学术会议&#xff0c;注重前沿技术在工业界的落地应用&#xff0c;与SIGIR一起被称为信息检索领域的Top2。 刚刚在墨尔本结束的第12届WSDM大会传来一个好消息&#xff0c;由…

LeetCode 637. 二叉树的层平均值(层次遍历queue)

1. 题目 给定一个非空二叉树, 返回一个由每层节点平均值组成的数组. 输入:3/ \9 20/ \15 7 输出: [3, 14.5, 11] 解释: 第0层的平均值是 3, 第1层是 14.5, 第2层是 11. 因此返回 [3, 14.5, 11].2. 解题 queue按层遍历&#xff0c;每次进入循环记录队列长度n class So…

AI框架你只会调包,这种想法很危险!

深度学习神经网络正步入成熟&#xff0c;而深度学习框架目前众多&#xff0c;大都可以在图像识别、手写识别、视频识别、语音识别、目标识别和自然语言处理等诸多领域大显身手。深度学习框架平台占据人工智能产业生态的核心地位&#xff0c;具有统领产业进步节奏、带动终端场景…

Docker镜像大小

都说容器大法好&#xff0c;可是假设没有Docker镜像&#xff0c;Docker该是多无趣啊。 是否还记得第一个接触Docker的时候&#xff0c;你从Docker Hub下拉的那个镜像呢&#xff1f;在那个处女镜像的基础上。你执行了容器生涯的处女容器。镜像的基石作用已经非常明显。在Docker…

论文浅尝 | 机器阅读理解中常识知识的显式利用

论文笔记整理&#xff1a;吴林娟&#xff0c;天津大学硕士&#xff0c;自然语言处理方向。链接&#xff1a;https://arxiv.org/pdf/1809.03449.pdf动机机器阅读理解(MRC)和人类进行阅读理解之间还存在差距&#xff0c;作者认为主要体现在对于数据的需求和噪声鲁棒性上&#xff…

深度学习在美团配送ETA预估中的探索与实践

1.背景 ETA&#xff08;Estimated Time of Arrival&#xff0c;“预计送达时间”&#xff09;&#xff0c;即用户下单后&#xff0c;配送人员在多长时间内将外卖送达到用户手中。送达时间预测的结果&#xff0c;将会以”预计送达时间”的形式&#xff0c;展现在用户的客户端页面…

在AndroidStudio中配置Gradle进行 “动态编译期间,根据远程服务器地址 ,生成多类安装包”

原文地址&#xff1a;http://www.cnblogs.com/vir56k/p/4763810.html 需求&#xff1a; 在产品开发中&#xff0c;经常需要发布各个版本&#xff0c;每个版本的服务器地址有不同的服务器地址。比如 开发 服务器使用 192.168.1.232服务器&#xff0c;测试 服务器使用 192.168.1.…