复旦副教授魏忠钰:AI和人类对垒「奇葩说」,如何打造智能辩手?

9f4f350375afe3d9ad44156297e484fb.png

来源: 智源社区

作者:魏忠钰

整理:熊宇轩

导读:想象一下,在一场AI和人类对垒的「奇葩说」,智能辩手的表现会如何?

论辩的过程,既需要理解对方的表达,同时根据对方的观点生成自身的论据和观点,这个处理过程对于AI来讲,比一般性的对话要复杂很多。

2004 年,在论文「A Syetematic Theory of Argumantation: The Pragma-Dialectical Approach」中,学者们将「论辩」定义为一种口头的、社会的和理性的活动,旨在通过提出一组命题来证明或反驳某种观点中所表达的命题,从而说服对方接受我方的观点。

复旦大学大数据学院副教授魏忠钰在青源 Talk 第 13 期发表了题为「迈向智能辩手之路:对话式论辩技术进展」的报告。在本次报告中,魏忠钰介绍了计算论辩学的研究进展,重点介绍了其团队在「对话式观点抽取」方面的研究工作,指出了计算论辩学领域急需解决的问题。了解魏忠钰最新研究动态,请点击链接关注 https://hub.baai.ac.cn/users/951

01

你真的了解「论辩」吗?

863fe4f3fc68bece02d3b153652cbdec.png

从「口头性」的角度来说,论辩是一个语言处理问题,这种语言可能来自于口语环境也可能来自于书面写作环境;从「社会性」的角度来说,论辩过程发生在两个或多个人之间,它们针对某些具有争议的问题进行讨论;从「理性」的角度来说,论辩各方需要使用合理的观点表达对事情的看法。 

cbb30b551fcf0fd62c09e382dfe642a3.png

「论点」是论辩活动中的重要概念,它包含观点(核心的声明点)和前提(支撑材料、原因)。我们的论辩过程要针对一些有争议性的话题展开,这些话题可以是一些社会性问题。如上图所示,假设我们论辩的话题是「死刑是不是应该要被废除」,为了支撑「应该废除死刑」的论点,我们可以使用以下两个前提:(1)死刑是不可逆转的暴力行为(2)做出死刑判决的人也可能犯错,有风险会让无辜的人收到伤害。使用观点作为基本工具,我们希望在论辩过程中说服对方,或使双方就某一个话题形成共识。

02

计算论辩学

99a8a87284cb607e1fc94d11ba8ac97a.png

「计算论辩学」旨在自动分析和生成观点和论辩过程,它有非常广泛的应用场景:(1)辅助决策:可以对有争议的问题提出论点,表明立场。例如,通过自动论辩文本分析方法为政策制定者分析舆论场中的正面、负面观点,帮助其做出更理性、更符合大众需求的判断;在法庭中,自动化论辩文本分析方法可以快速形成双方核心观点,从而节省法官的时间。(2)写作支持:评估议论文的质量,提供反馈。例如:为人类写作自动搜索论点,提供素材;辅助阅卷老师为作文打分。(3)逻辑审查:检查某段陈述是否逻辑一致。例如:识别个人陈述中的谎言。

be7f9b0ad4f08c85458da8514ecb1163.png

论辩过程包含不同的粒度。在如上图所示的两段对话中,如果我们相对单一说话者形成的文本进行分析,首先需要发现文本中的基本「论辩单元」(例如:结论、前提),多个论辩单元可以组成一个观点。对某人的一段陈述进行分析、发现其观点的过程被称为「单体论辩」或者「独白式论辩」。而双方参与论辩的场景被称为「对话式论辩」。

a9e69cfa033f26d26a25e208d8768005.png

「论辩」是一门交叉学科,与语言学、逻辑学有紧密的联系。在过去的数十年中,相关领域的研究者提出了一些论辩模型。其中,最经典的单体式论辩模型为「图尔敏模型」。对于一整句话,我们会将其中的核心观点、证据、让步假设等组成部分进行解析。

d5f445d050e4f42344b8a315737dd39e.png

事实上,对话式论辩的场景更加普遍。1991 年,Freeman 在图尔敏模型的基础上提出了简化版的针对对话式论辩的模型。Freeman 模型弱化了对单个观点内部复杂结构的解析,仅仅保留了两个观点的内部结构:观点和前提,而更加关注观点之间交互关系的建模。它清晰地定义了支持、攻击的观点交互结构。

针对对话式论辩场景的「推理锚定理论」于 2011 年被提出,它更加普适。该理论将整个论述切分为两个部分:(1)基础表述(2)对话上下文。每当有新的对话内容加入之后,就会将其与当前的基础表述桥接,从而得到一系列桥接的标签集合(例如,对基础表述持质疑或断定态度)。

03

单体论辩

单体式论辩存在三大基础任务:(1)观点结构分析。将某人的表述细分成多个论辩性语义单元,对这些单元进行分类,识别出语义单元、语义单元之间的关系。(2)观点评估。对发言者的立场进行分析,对形成观点的方式进行分类,对形成的观点打分。(3)观点生成。对论辩性文本进行总结;给定某个观点,生成反方观点。

f1f03d2bc1ffc8484dbd4a8a9b98a17b.png

04

对话式论辩

对话式论辩则考虑一系列交互的观点,涉及到观点的交换。对话式论辩的文本理解包含以下四个子任务:(1)观点抽取。给定一个段落,通过单体式论辩分析技术分析其结构,提取观点,对观点分类。(2)交互式论点对识别。给定正反两方针对某一话题的发言,发现有交互关系的观点对。(3)交互式策略识别。给定论点对,识别回应观点使用的论辩方式。我们往往可以从四个层级上表达相反的意见,即「完全不相关的拒绝」(Irrelevance)、「仅仅反对」(Contradiction)、「给出未切中角度的回应」(Target Losing)、「切中角度的质疑」(Regutation)(4)论辩质量评估。给定观点对,评估回复的说服力。

33b7a09433539d1bca913cc6607952a8.png

05

对话式观点抽取

41d300d4a491a738f6c9e830fed1cfed.png

对话式观点抽取的研究受限于数据真实标注的收集。给定两个段落的交互文本,逐一发现其中有交互关系的观点对是一个很难的标注任务。我们在 NAACL 2021 上发表的论文「Discrete Argument Representation Learning for Interactive Argument Pair Identification」 (论文最早于2019年在Arxiv上放出) 充分利用「Change My View」(CMV)论坛帖子中使用的的引用(Quotation)操作,进行真实标注样本的收集。数据集合包含 12,000 条带有引用关系的交互观点对。在具体任务设置上,由于引用只能带来正样本,我们构建了正样本排序任务,即给定原始文本中的一个观点,从 5 个候选观点中找出唯一的正样本观点。

54f2cff2ed16c98c3a99147f71744b00.png

通过对样本的分析,我们发现回复贴往往会从一些特定的角度出发来回应某一主题,因此,我们在进行观点对抽取时,同时考虑了回复帖的回应角度,有效提升了观点对的抽取效果。在本文中,我们用离散变分自编码器(DVAE)进行观点的表示学习,DVAE 可以在隐式空间中对不同主题进行聚类建模,从而体现不同的回应角度。

06

外部知识对文本理解的帮助

df9fac1b290ac3fac0e57c1a17024ef5.png

在我们于 ACL 2021 上发表的论文「Leveraging Dialogical Argumentation Graph Knowledge in Interactive Argument Pair Identification」中,我们进一步探索了常识背景知识和推理知识对于论辩场景理解的帮助,从而获得更好的对话式观点抽取性能。

f0caba07899cf899df252c169fd70a05.png

我们在对文本建模的同时,抽取出了其中包含的实体。接着,我们在背景知识的论辩知识图谱中发现每两个实体之间的链路,然后将链路与原始文本进行联合建模,最后使用文本和知识两部分的信息推理,判断两个观点是否成对。我们利用了 CMV 论坛上的帖子建模知识库,通过开源的信息抽取方法提取了实体及其关系。此外,我们还使用了 WordNet 和维基百科进行实体消歧。在使用了外部知识之后,模型的性能有明显的提升。

07

同行评审中的观点对抽取

1fcfe7e3e1fa75871c96e70a749710b1.png

阿里巴巴达摩院的语言智能研究团队于 2020 年的 EMNLP 提出了论文审稿场景下的观点对抽取任务,该任务更加完备,由单体论辩挖掘和观点匹配子任务组成。他们在 ICLR 的公开评审网站上收集了 4,000 多条评审意见以及回复的段落,共提取了 40,000 多个观点。

b0aebf4df5d8f5ba5a7fc7f3e0cc0109.png

如上图所示,左侧为评审意见,右侧为作者的回复。他们构建了三个子任务:(1)观点挖掘。识别评审意见和回复中的观点。(2)句子匹配。给定评审意见和回复中的观点,判断这些观点两两是否成对。(3)观点对抽取。给定两个段落后,自动抽取相应观点,包含观点的发现和观点对匹配。

073229683cc71fb4656722d796fe2d91.png

在论辩挖掘场景下,他们使用了扩增版的 BIO 标签体系(IOBES)进行序列化标注。其中 S 代表单句观点;E 代表观点的结束句。在观点对识别部分,他们仅仅使用了观点的第一个句子进行匹配。他们在训练中,将上述两个任务进行联合训练。

7677c82c6857150ca80959ea794d3f8b.png

在 2021 年的 EMNLP 上,在哈尔滨工业大学深圳分校的研究团队发表的论文「Argument Pair Extraction with Mutual Guidance and Inter-sentence Relation Graph」中,作者构建了句子之间的关系图(ISRG),图中的绿色节点代表评论的句子,蓝色节点代表回复的句子,因此图中的边分为「同类节点之间的边」和「异类节点之间的边」。在推导过程中,他们提出了两种序列标注模型:(1)不使用交互图更新的句子表示,直接进行推理(2)结合交互图更新的句子表示进行推理。

f73793fd32bccaaa1cb8a495ae9065dd.png

对话式论辩场景下的公开数据集如上图所示,它们主要针对论辩挖掘、交互式论辩对抽取、论辩质量评估任务涉及。

08

迈向智能辩手之路

65d64726c9b3a5ef7396d654ba828ebd.png

IBM 在以色列的团队于 2021 年在《自然》杂志上发表了一篇有关自主辩论系统的文章。在这篇文章中,他们设计了一个标准的牛津式的辩论系统,辩论双方分别需要进行开场发言、第二轮发言,以及总结发言。所有的观众在辩论开始前会选定自己的立场,然后在辩论结束后再次选择立场,根据支持比例的变化来判定哪一方获胜。

a0f660134bff3535d376b654961e5905.png

该系统首先通过论辩挖掘发现文本中的观点对,进而构建了一个包含通用回复的论辩知识库,系统根据论辩结构分析和论辩知识库生成有可能的潜在回应,并且将这些回应组合起来。作者对该系统进行了评估,结果显示该系统的性能优于普通人类,稍逊于人类专家。

f05a2aa6dabdd73bd0f0009fb9b5e6a3.png

然而,现实生活中涉及的辩题和场景更加复杂。为此,我们与阿里巴巴达摩院语言智能小组在 NLPCC 2021 上退出了一项评测挑战赛,该赛事包含三个赛道:(1)辩论立场分类(2)社交网络上的交互式观点对抽取(3)同行评审场景下的观点对抽取。

6167a3c407b6f0e0edb99ea7dfe5e279.png

除了一般性的论辩机器人,我们将对话式论辩技术应用到了法律领域。庭审记录中包含诉辩双方对于案件的陈述,如何对陈述进行理解和组织是一些法律科技公司的核心诉求。为此,我们联合北京大学王选计算机研究所在中国法律智能技术评测平台上推出了论辩理解竞赛,该竞赛包含两个赛道:(1)争议观点对抽取(2)争议观点类型的发现。

4c0645c4fb62edc2799e5011fe471a31.png

如上图所示,庭审记录往往包含两段很长的诉称和辩称文本,法官的工作量往往很大。我们希望针对不同的讨论议题发现一些有争议的议题。于是,我们需要对诉称的某些论点进行提取,并且发现辩称中与之相关联的论点,进而判断双方论点对的关系。

09

计算论辩学的未来

b0b6b0c12088d5a957d00a86c3377d7f.png

总的来说,目前参与计算论辩学研究的学者仍然较少。论辩的理论体系非常庞杂,涉及的内容十分广泛。因此,在对文本的建模中,我们需要进一步考虑如何将话题词语表述词进行切分,更好地对观点进行表示学习。此外,我们也需要尝试将图尔敏模型这些景点的单体式论辩模型引入计算模型的设计中。

其次,论辩图谱的研究也大有可为。相较于普通的知识图谱,论辩过程是动态的,实体间的关系仅仅是论辩图谱的底层结构,论辩图谱需要体现实体间形成观点的过程,以及观点与观点之间的关系。

最后,目前计算论辩学研究领域中的相关中文资源还很少,我们未来需要贡献更多的中文语料集合,构造中文相关的计算论辩任务。

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

d21f592f87aeec2242283c08e74da7d5.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/482314.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

EleutherAI:当OpenAI不够开放时,我们该如何选择?

来源:ScienceAI编辑:萝卜皮人工智能最令人不安的事情之一是它超越了人类控制、遏制或规范它的权力。然而,它可能会产生可怕的结果,例如药物发现人工智能最近错误地发现了可用作化学武器的致命毒素。今天,没有比 Eleuth…

星地融合→→→6G移动通信关键技术的未来

来源:人民邮电报作者:柯文卫星通信与地面移动通信融合构建全球无缝覆盖的星地融合网络,这一趋势作为未来6G网络技术发展的重要方向得到业界广泛认可,成为当前学术界和产业界研究的热点。  中国信科副总经理、专家委主任&#xf…

这就是深度学习如此强大的原因

来源:ScienceAI编译:绿萝据报道称,由于采用基于云的技术和在大数据中使用深度学习系统,深度学习的使用在过去十年中迅速增长,预计到 2028 年,深度学习的市场规模将达到 930 亿美元。但究竟什么是深度学习&a…

Java基础语法之Map

浅谈Map及其遍历的四种方式 Map简介 Map提供了一种映射关系,其中的元素是以键值对(key-value)的形式存储的,Map中的键值对以Entry类型的对象实例形式存在;Map集合没有继承Collection接口,其提供的是key到value的映射…

谁是ASML的最大股东?为何荷兰光刻巨头要听美国的话?

来源:EETOP整理:technews目前能生产7 纳米以下芯片的极紫外光(EUV) 光刻机,只有荷兰ASML,ASML可说是掌握全球芯片先进制程的关键。ASML 的EUV 光刻机通常优先供货给台积电、三星、英特尔三家,其他要买都要排在三家之后…

SpringMVC详细执行流程与组件说明

SpringMVC详细执行流程与组件说明 文章目录SpringMVC详细执行流程与组件说明1.SpringMVC架构流程2.流程图3.组件说明1.SpringMVC架构流程 用户发送请求至前端控制器DispatcherServlet; DispatcherServlet收到请求调用HandlerMapping处理器映射器; 处理器映射器根据前端请求的…

机器学习的重新思考:人工智能如何学习“失忆”?

来源:Samuel Greengard作者:Samuel Greengard编译:维克多机器学习已经成为各行各业的宝藏工具,常被用来构建系统,帮助人们发现那些容易忽略的细节,并辅助决策。尽管已经取得了惊艳的结果,但是也…

浅谈Spring IOC和DI及Spring工厂类

浅谈Spring IOC和DI及Spring的工厂类 文章目录浅谈Spring IOC和DI及Spring的工厂类一. IOC1.什么是IOC2.为什么使用IOC传统开发模式的弊端3. 使用spring-IOC步骤二. DI1.什么是DI2.传统面向接口编程2.使用DI方式三. Spring的工厂类一. IOC 1.什么是IOC ​ IOC: Inversion of …

城市大脑标准体系与评价指标总体框架研究

来源:城市大脑全球标准研究组根据城市大脑标准的前期研究和中国指挥与控制学会(CICC)《城市大脑建设规范》标准启动会的专家意见,形成城市大脑标准体系与评价指标总体框架(如图1所示),供各位专家探讨&#…

AOP和Spring AOP介绍

AOP和Spring AOP介绍 文章目录AOP和Spring AOP介绍一.AOP简介二. 传统开发存在的弊端三. AOP实现原理四.Spring AOP五.AOP相关术语一.AOP简介 AOP为Aspect Oriented Programming的缩写,意为:面向切面编程。是OOP的延续,是软件开发中的一个热…

新鲜出炉!大规模神经网络最新综述!

来源:arXiv编译:机器之心在本综述论文中,研究者解释了不同技术的工作原理、评估和比较,还分析了一些实现这些技术的框架。现代深度学习和人工智能技术的发展涉及使用深度神经网络(DNN)来解决图像、视频、音…

数据结构与算法理论概述

数据结构与算法理论概述 文章目录数据结构与算法理论概述数据结构概述◆ 数据结构涵盖的内容◆ 存储数据算法概述◆ 算法的基本特性◆ 算法设计要求◆ 算法分析数据结构概述 狭义上:数据结构是专门研究数据存储的问题; 数据的存储包括:个体的…

战略性基础研究的由来及国际实践研究

来源:微信公众号中国科学院院刊,原载:《中国科学院院刊》2022年第3期作者:阿儒涵1,2、杨可佳3、吴丛1,2、李晓轩1,2*1 中国科学院科技战略咨询研究院2 中国科学院大学公共政策与管理学院3 挪威奥斯陆大学技术创新和文化研究中心近…

顺序表Sqlist.cpp

顺序表Sqlist.cpp 文章目录顺序表Sqlist.cpp1 顺序表插入逻辑2 顺序表删除逻辑3 代码演示4 运行结果1 顺序表插入逻辑 在表的第 i 个位置前插入一个元素 实现步骤: 将第 n 至第 i 位的元素向后移动一个位置;将要插入的元素写到第 i 个位置;表…

顺序表的插入删除查找遍历

顺序表的插入删除查找遍历 文章目录顺序表的插入删除查找遍历代码运行结果截图代码 #define Maxsize 100typedef int ElemType; typedef struct{ElemType data[Maxsize];int length; }Sqlist;void Createlink(Sqlist &L) {int a;printf("请输入你要创建的顺序表的长…

Yann LeCun最新访谈:能量模型是通向自主人工智能系统的起点

来源:ZDNet编译:钱磊编辑:陈彩娴继自监督学习之后,Yann LeCun 在接受 ZDNet 的最新访谈中又着重探讨了他在几年前曾大篇幅推崇的概念:「能量模型」(energy-based models)。什么是能量模型&#…

HTML5崛起之时,Java桌面时代就已经终结了

来源:AI前线作者:Steve Hannah翻译:核子可乐编辑:燕珊2004 年 Google Maps 的面世标志着 Java 桌面时代的终结,也改变了桌面环境下“跨平台”的基本定义。本文作者以个人视角对 Java 桌面发展历程做了回顾,…

单链表介绍及其实现

链表 文章目录链表链表的专业术语:实现链表的专业术语: 首节点:存放第一个有效数据的结点;尾结点:存放最后一个有效数据的结点;尾指针指向;头结点:头结点的数据类型和首结点的类型一…

Linux基础概念及常用命令

Linux基础概念及常用命令 文章目录Linux基础概念及常用命令1 Linux概述1.1 为什么要学Linux1.2 Linux简介1.3 Linux 发行版1.4 Linux 应用领域2 Linux常用命令2.1 Linux目录结构2.2 Linux目录命令2.3 Linux文件命令2.4 Linux其他命令1 Linux概述 1.1 为什么要学Linux linux诞生…

PNAS新研究:剑桥学者发现,有些 AI 模型无法被计算

来源:AI科技评论作者:Ailleurs编辑:陈彩娴近日,剑桥学者在《美国科学院院报》(PNAS)上发表了一篇名为“The Difficulty of Computing Stable and Accurate Neural Networks: On the Barriers of Deep Learn…