知识链接,人工智能可以帮助人类验证世界知识吗?#verify_wikipedia

f61d8498fbe1e89d089049cd9dc59c5e.png

这是一篇来自Samaya AI的文章,主要介绍了其 CTO 在 Meta AI's FAIR labs 工作发表在 nature 上的一篇论文成果,用于验证和改进维基百科上的引用来源。我做了一些精选和整理,分享给大家:

研究背景

几千年来,人类一直在创造知识。计算机的出现把知识数字化了,而互联网的出现使其可以被更容易获取,从而促进了进一步的知识创造。

搜索引擎极大地增加了我们在日常决策中可以使用的信息的广度和可访问性,远远超出了纸质书籍和传统图书馆的限制。

然而,获得大量知识并不能让我们无所不知——理解这些知识仍然极其困难且耗时。

研究人员仍然需要阅读文献、写笔记、在头脑中将各个点联系起来。知识工作者需要多年的经验、研究和阅读才能发现新颖的关联。此外,由于不同的信息可能相互冲突,并且必须理解并追溯到其原始来源,因此该过程变得复杂。



论文

Improving Wikipedia verifiability with AI

研究表明,构建机器来帮助人类导航、解释和验证世界知识在今天是可以实现的。

维基百科是地球上使用最广泛的知识集合之一,在志愿者和专家编辑的支持下,这是一项令人难以置信的集体努力。

维基百科是可验证的,信息来源有大量的引用支持,以便“使用百科全书的人可以检查信息是否来自可靠的来源”。


然而,确保维基百科的可验证性的任务是艰巨的。专家编辑目前依靠志愿者的工作,截至目前,维基百科上有超过 500,000 条语句被标记为“需要引用”。

在论文中,作者展示了机器可以协助编辑完成引用的校对和建议——

发现有问题的引用并提高其可验证性。


7f8701d4470779af15260b4166fb1d19.png

SIDE

一种基于人工智能的系统,旨在提高Wikipedia引用的可验证性。通过使用信息检索系统和语言模型,SIDE可以识别Wikipedia引用中不太可能支持其主张的引用,并从网络中推荐更好的引用。

1/ 需要验证的引用

SIDE 利用专门的语言模型来评估维基百科的声明-引文对,分配可验证性分数并识别潜在的证据不足。

eceea58c6fb87d5028c87ddc0337bc49.png

2/ 检索引擎

它配备了一个检索引擎,能够提取上下文中的维基百科声明,并在网络规模的“Sphere”语料库中搜索替代来源。

3ec3a9981b91f589af64549ff1101ce3.png

3/ 建议的引用

SIDE 会标记可验证性较低的声明,并建议替代来源,从而可能指导编辑的内容管理过程。

4284445f8bb721ec0b338f584440a1e4.jpeg

SIDE 展示了强大能力,它不仅可以识别这些差异,而且当声明被认为可能无法验证时,维基百科用户通常更喜欢系统建议的引用,而不是原始维基百科的引用。

社群交流通道:

503467ee1d5580f232cd47599d298f2a.jpeg

原文:

https://samaya.ai/blog/

https://www.nature.com/articles/s42256-023-00726-1

https://github.com/facebookresearch/side/tree/main/projects/verify_wikipedia

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/120794.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

leetcode_39 组合总和

1. 题意 给定一个数组&#xff0c;和一个目标值&#xff1b;求得所有数组中所有和为目标值的元素序列。 组合总数 2. 题解 回溯列举每一个可能的序列&#xff0c;注意去重。 2.1 我的解法 class Solution { public:void gen(vector<vector<int>> &ans,co…

中国技术的对外输出:Telegram也开始搞小程序应用了

Telegram 宣布为其开发者提供了一项“能够在其中运行迷你应用”的新功能&#xff08; 迷你应用即 Mini App&#xff0c;下文中以“小程序”代替&#xff09;。 在 Telegram 的博客中&#xff0c;开发人员介绍可以使用 JavaScript 构建自己的迷你应用 在一篇博客文章中&#xf…

【linux】麒麟v10安装Redis主从集群(ARM架构)

安装redis单示例的请看&#xff1a;麒麟v10安装Redis&#xff08;ARM架构&#xff09; 安装环境 ​Hostname​IP addressmaster192.168.0.1slave1192.168.0.2slave2192.168.0.3 下载安装包 &#xff08;三台都操作&#xff09; wget https://repo.huaweicloud.com/kunpeng/…

69 划分字母区间

划分字母区间 题解1 贪心1&#xff08;方法略笨&#xff0c;性能很差&#xff09;题解2 贪心2&#xff08;参考标答&#xff09; 给你一个字符串 s 。我们要把这个字符串划分为尽可能多的片段&#xff0c;同一字母最多出现在一个片段中。 注意&#xff0c;划分结果需要满足&am…

“从部署到优化,打造高效会议管理系统“

目录 引言一、部署单机项目 - 会议OA1.1 硬件和软件环境准备1.2 检查项目1.3 系统部署1.后端部署 二、部署前后端分离项目 - SPA项目后端部署2.前端部署 总结 引言 在现代化办公环境中&#xff0c;会议是组织沟通、决策和合作的重要方式之一。为了提高会议的效率和质量&#x…

针对element-plus,跳转jump(快速翻页)

待补充 const goToPage () > {const inputElement document.querySelector(.el-pagination .el-input__inner);console.log(inputElement, inputElement); } 打印之后可以看到分页跳转的数字输入框&#xff0c;是有进行处理的&#xff0c;max"102",是我自己的…

FreeSWITCH 使用指北(2)-多段音频顺序播放的设置

文章目录 1. 多段音频顺序播放的设置2. uuid_bridge 时机问题 1. 多段音频顺序播放的设置 在 FreeSWITCH 中涉及到放音的 APP 有不少&#xff0c;比较典型的是播放录音文件的 playback 和 play_and_detect_speech 。这两个 APP 播放录音的功能都依赖于 switch_ivr_play_say.c#…

面对6G时代 适合通信专业的 毕业设计题目

对于通信专业的本科生来说&#xff0c;选择一个与学习内容紧密相关的毕业设计题目十分重要。 以下是东枫科技建议的题目&#xff0c;它们涵盖了通信技术的不同方面&#xff1a; 高校老师可以申请东枫科技工程师共同对学生指导&#xff0c;完成毕业设计。 基于5G/6G的通信技术…

【每日一题】掷骰子等于目标和的方法数

文章目录 Tag题目来源题目解读解题思路方法一&#xff1a;动态规划 写在最后 Tag 【动态规划】【数组】 题目来源 1155. 掷骰子等于目标和的方法数 题目解读 你手里有 n 个一样的骰子&#xff0c;每个骰子都有 k 个面&#xff0c;分别标号 1 到 n。给定三个整数 n&#xff0…

【Linux】操作系统以及虚拟机的安装与配置

&#x1f973;&#x1f973;Welcome Huihuis Code World ! !&#x1f973;&#x1f973; 接下来看看由辉辉所写的关于Linux的相关操作吧 目录 &#x1f973;&#x1f973;Welcome Huihuis Code World ! !&#x1f973;&#x1f973; 一.操作系统的介绍 二.VMWare虚拟机的安装…

游戏研发的解决方案有哪些?

游戏研发的解决方案可以根据不同的需求和情境而有所不同&#xff0c;以下是一些常见的游戏研发解决方案&#xff1a; 游戏引擎&#xff1a; 游戏引擎是游戏研发的基础&#xff0c;它提供了开发游戏所需的核心功能&#xff0c;如图形渲染、物理引擎、音效管理、动画等。一些流行…

前端搜索过滤表格数据

一&#xff0c;纯前端过滤表格数据 <el-input v-model"searchName" placeholder"请搜索工况名" blur"searchCondition" style"margin-left:20px ;"> </el-input><el-input v-model"searchName1" placeholder…

电大搜题:开启智慧学习新时代

近年来&#xff0c;随着社会的发展和科技的迅猛进步&#xff0c;远程教育成为了广大学子继续教育的新选择。而在重庆&#xff0c;一所备受关注的远程教育学府——重庆开放大学&#xff0c;以其开放的教育理念和多元的学习方式&#xff0c;为广大学生提供了便捷而高效的学习平台…

Python与CAD系列基础篇(十)图形复制、移动、删除

目录 0 简述1 图形复制与移动2 图形删除0 简述 本篇详细介绍使用①通过pyautocad连接AutoCAD进行处理②通过ezdxf处理dxf格式文件进行图形复制、移动、删除的方法。 1 图形复制与移动 pyautocad方式 from pyautocad import Autocad, APointdef draw_circle_copied():# 连接到…

49.Redis缓存设计与性能优化

缓存与数据库双写不一致小概率事件 //线程1 写数据库stock 5 ---------------》更新缓存 //线程2 写数据库stock 4 -----》更新缓存 //线程1 ------》写数据库stock 10 -----》删除缓存 //线程2 ---------------------------------------------------------------------…

子集生成算法:给定一个集合,枚举所有可能的子集

给定一个集合&#xff0c;枚举所有可能的子集。 &#xff08;为简单起见&#xff0c;本文讨论的集合中没有重复元素&#xff09; 1、方法一&#xff1a;增量构造法 第一种思路是一次选出一个元素放到集合中&#xff0c;程序如下&#xff1a; void print_subset(int n, int …

36基于matlab的对分解层数和惩罚因子进行优化

基于matlab的对分解层数和惩罚因子进行优化。蚁狮优化算法优化VMD,算术优化算法优化VMD&#xff0c;遗传优化算法优化VMD&#xff0c;灰狼优化算法优化VMD&#xff0c;海洋捕食者优化算法优化VMD&#xff0c;粒子群优化VMD&#xff0c;麻雀优化算法优化VMD&#xff0c;鲸鱼优化…

我会在以下情况用到GPT

ChatGPT可以在各种情况下派上用场&#xff0c;包括但不限于以下情况&#xff1a; 获取信息&#xff1a;你可以使用ChatGPT来获取关于各种主题的信息&#xff0c;例如历史事件、科学知识、文化背景等。ChatGPT可以用作一个知识库&#xff0c;回答你的问题。 学习新知识&#xf…

C语言 每日一题 PTA 10.27 day5

1.高速公路超速处罚 按照规定&#xff0c;在高速公路上行使的机动车&#xff0c;达到或超出本车道限速的10 % 则处200元罚款&#xff1b; 若达到或超出50 % &#xff0c;就要吊销驾驶证。请编写程序根据车速和限速自动判别对该机动车的处理。 输入格式 : 输入在一行中给出2个正…

win10 + VS2017 编译libjpeg(jpeg-9b)

需要用到的文件&#xff1a; jpeg-9b.zip win32.mak 下载链接链接&#xff1a;https://pan.baidu.com/s/1Z0fwbi74-ZSMjSej-0dV2A 提取码&#xff1a;huhu 步骤1&#xff1a;下载并解压jpeg-9b。 这里把jpeg-9b解压到文件夹"D:\build-libs\jpeg\build\jpeg-9b" …