语言生成类人工智能如何改变科学

4336b9c651f8410fd5f06090bb4e5ff6.png

来源:ScienceAI

编辑 :萝卜皮

d6a0e17b41f3fb7e3364f3015465d72a.png

密歇根大学安娜堡分校新兴技术治理专家 Shbita Parthasarathy 表示,从大量文本中生成流利语言的机器学习算法可能会改变科学研究的方式,但不一定会变得更好。

在2022 年 4 月 27 日发布的一份报告中,Parthasarathy 团队试图预测被称为大型语言模型(LLM)的新兴人工智能(AI)技术的社会影响。

报告链接:https://stpp.fordschool.umich.edu/research-projects/whats-in-the-chatterbox

它们可以产生令人惊讶且信服的论文,在语言之间进行翻译,回答问题,甚至生成代码。构建它们的公司——包括谷歌、Facebook 和微软——旨在将它们用于聊天机器人和搜索引擎,并总结文档。(至少有一家位于加利福尼亚州旧金山的公司 Ought 正在研究 LLMs;它正在构建一个名为「Elicit」的工具来使用科学文献回答问题。)

LLMs 已经存在争议。他们有时会在他们接受培训的数百万或数十亿份文件中重复错误或有问题的刻板印象。研究人员担心,与人类写作无法区分的明显权威的计算机生成语言流可能会导致不信任和混乱。

Parthasarathy 说,虽然 LLM 可以加强理解复杂研究的努力,但它们也可以加深公众对科学的怀疑。她向媒体讲述了这份报告。

LLMs 如何对科学产生影响?

Parthasarathy 最初认为 LLM 可以产生民主化和授权的影响。在科学方面,它们可以使人们能够快速从信息中提取见解:例如,通过查询疾病症状或生成技术主题摘要。

但是算法摘要可能会出错,包括过时的信息或消除细微差别和不确定性,而用户不会对此表示赞赏。如果有人可以使用 LLM 使复杂的研究变得易于理解,但他们冒着获得与混乱现实不一致的简化、理想化的科学观点的风险,这可能会威胁到专业性和权威性。它还可能加剧公众对科学的信任问题。人们与这些工具的交互将非常个性化,每个用户都会获得自己生成的信息。

LLMs 可能使用过时的或者不可靠的研究,这难道不是一个大问题吗?

是的。但这并不意味着人们不会使用 LLM。它们很诱人,而且它们的流畅输出和令人兴奋的新技术的描述将具有客观性的外表。它们有限制的事实——它们可能建立在部分或历史数据集之上——可能不会被普通用户识别。

科学家很容易断言它们很聪明,并意识到 LLM 是有效,但并不完整的工具——例如,用于开始文献综述。尽管如此,这些类型的工具可能会缩小使用者的视野,并且使用者很难发觉 LLM 何时会出现问题。

LLM 在数字人文学科中可能很有用,例如:总结历史文本对特定主题的描述。但是这些模型的过程是不透明的,并且它们没有在输出的同时提供资源,因此研究人员需要仔细考虑他们将如何使用它们。Parthasarathy 在社会学中看到了一些提议的用法,并对一些学者的轻信程度感到惊讶。

谁可以为科学创造这些模型?

Parthasarathy 的猜测是,大型科学出版商将处于开发特定科学 LLM(改编自通用模型)的最佳位置,能够爬取其论文的专有全文。他们还可以寻求自动化同行评审的各个方面,例如查询科学文本以找出应该咨询谁作为审稿人。LLMs 也可用于尝试在手稿或专利中,挑选出特别创新的结果,甚至可能帮助评估这些结果。

出版商还可以开发 LLM 软件来帮助非英语国家的研究人员改进他们的论文。

当然,出版商可能会达成许可协议,将他们的文本提供给大公司以包含在他们的语言素材库中。Parthasarathy 认为他们更有可能试图保持控制。如果是这样,对他们的知识垄断越来越感到沮丧的科学家们会对此提出质疑。

基于开放获取论文和付费论文摘要的 LLMs 有一些潜力;但以这种方式可能很难获得足够多的最新科学文本。

LLMs 可以用来制作以假乱真的论文吗?

是的,如果这件事很容易做到,并且他们认为这样做有助于他们的职业生涯,有些鬼迷心窍的人会使用 LLM 来生成假的论文。尽管如此,大多数确实想成为科学界一员的科学家,还是希望就使用 LLM 的法规和规范达成一致。

应如何规范 LLM 的使用?

令人着迷的是,几乎没有任何 AI 工具通过了系统性法规或标准维护机制。对于 LLM 来说也是如此:他们的方法是不透明的,并且因开发人员而异。在 Parthasarathy 的报告中,他们建议政府机构介入一般监管。

特别是对于 LLM 可能在科学中的应用,透明度至关重要。那些正在开发 LLM 的人应该解释使用了哪些文本,以及所涉及算法的逻辑——并且应该清楚是否使用计算机软件来生成输出。他们认为,学界还应该支持开发一个受过广泛领域的所有公开科学文章培训的 LLMs。

科学家们应该警惕期刊或资助者依赖 LLM 来寻找同行评审员或(可以想象)将此过程扩展到评审的其他方面,例如评估手稿或赠款。由于 LLM 转向过去的数据,因此他们的建议可能过于保守。

论文链接:https://www.nature.com/articles/d41586-022-01191-3

未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。

  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”

936b551929fc9ec50350ef4b583e8f1c.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/482154.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

美国最牛的100个AI团队在哪里?

来源:Forbes撰文:海外来电图片:海外来电AI领域的关键玩家都有谁?企业为了保持竞争优势,需要快速有效地扩大人工智能(AI)能力。而Vectice最新一份报告,列出了100家公司拥有增长最快的…

介绍几个专门面向中文的命名实体识别和关系抽取工具

知识图谱已经在人工智能的各个领域发挥越来越重要的作用,例如视觉问答、对话系统、推荐系统等。知识图谱构建是应用这些知识图谱的基础,而面对生活和企业中数据的爆发式增长,自动化知识图谱构建显得越来越重要。从非结构化文本中自动抽取三元…

一文梳理类脑计算的前世今生 | 中科院自动化所研究员李国齐

来源:智源社区整理:王光华编辑:李梦佳导读:众所周知,人类大脑活动是复杂而连续的动力学过程,其复杂程度远超当前算力资源所能模拟的上限。大脑约有1000亿个神经元,100万亿个突触,单个…

常识推理相关最新研究进展

以深度学习为代表的智能感知技术已经取得了突破性进展,并已在各行各业产生了巨大的价值。目前,人工智能的研究领域已经逐渐从感知智能向认知智能领域过渡,其中,深度学习无法解决的一个主要问题是常识推理问题。常识知识是人类智能…

全球半导体厂商TOP 10

来源:数据观综合编辑:蒲蒲近日,IC Insights 分析了全球主要半导体供应商(不含纯代工厂)的市场份额,并公布排名前十的半导体厂商排名。从分析情况来看,全球半导体市场份额越来越集中于排名靠前的…

常识知识在AI不同领域应用的最新研究进展

上期,我们一起学习了常识推理的最新研究进展。这次,我们一起来看看常识知识在AI不同的领域都有哪些应用,泽宇找到几篇最新或有代表性的研究和大家分享学习。 Commonsense Knowledge Aware Conversation Generation with Graph Attention Aut…

MIT 团队的新测试,将 AI 推理与人类思维进行比较

来源:ScienceAI编辑:萝卜皮人工智能获得洞察力和做出决策的方式通常是神秘的,这引发了人们对机器学习的可信度的担忧。现在,在一项新研究中,研究人员揭示了一种新方法,用于比较人工智能软件的推理与人类推理…

年末巨制:知识图谱嵌入方法研究总结

泽宇对自己的研究方向也就是知识图谱嵌入(KG Embedding)技术进行了总结,并制作了一套slides,力求让大家只看slides就可以理解并掌握知识图谱嵌入的相关知识和最新研究情况,包括知识图谱嵌入的基本概念、方法分类和经典…

吴恩达:未来十年,人工智能将向以数据为中心转变

来源:AI前线作者:Eliza Strickland译者:平川策划:凌敏本文最初发布于 IEEE Spectrum。吴恩达在人工智能领域可谓声名显赫。2000 年底,他与斯坦福大学的学生一起开创了使用图形处理单元(GPU)训练…

知识图谱最新权威综述论文解读:时序知识图谱部分

从最近一两年有关知识图谱的顶会论文中可以发现,越来越多的国内外研究者开始关注动态时序知识图谱,可见时序知识图谱已经成为了一大研究趋势,相信之后会有更多相关研究出来。因此,这期我们对综述论文的时序知识图谱部分接着进行解…

CACM观点:超越联邦学习,让AI跨越公司边界

来源:AI科技评论 编译:张泷玲、杨柳编辑:维克多今年1月份,苏黎世联邦理工学院的Stefan Feuerriegelc教授在 《Communications of the ACM》期刊上刊文“Artificial Intelligence Across Company Borders”,在文中教授指…

知识图谱最新权威综述论文解读:知识图谱应用部分

知识图谱在人工智能的许多领域都发挥了重要作用,综述论文的这一章引入多个最新的基于深度学习的知识驱动方法,主要包括的应用领域有自然语言理解,推荐系统和问答系统。 1 自然语言理解 知识感知的自然语言理解通过将结构化的知识注入一个统一…

知识图谱和专家系统、知识工程、数据库等概念的比较

知识图谱虽然是Google在2012年公布其开发的搜索引擎时提出的名词,但是知识图谱的雏形早在1960左右就已经出现,因此,知识图谱其实是很多相关技术继承发展的结果。并且,和知识图谱类似的还有好几个概念:专家系统、知识工…

CICC城市大脑专委会成功举办“城市大脑成熟度评估专家研讨会”

来源:中国指挥与控制学会2020年以来,城市大脑已成为科技领域的新热点。作为一个新兴的前沿科技领域,不同企业、不同城市对城市大脑的理解并不相同,在建设的过程中没有统一的建设规范和标准作为指导,从而导致不同企业建…

“知识图谱+”系列:知识图谱+图神经网络

最近有很多朋友联系泽宇说想了解一些知识图谱和图神经网络(GNN)结合的研究。那泽宇当然要满足朋友们的要求啊,本期泽宇从知识图谱的几个不同研究方向总结了结合GNN的经典研究,也和大家一起分享。所有内容是泽宇查阅了很多顶会论文…

周志华:“数据、算法、算力” 人工智能三要素,在未来要加上“知识”!

来源:AI科技评论作者:李雨晨 编辑:丛末在CCF-GAIR 2020 的人工智能前沿专场上,南京大学计算机系主任、人工智能学院院长、CCF会士、ACM、AAAI、IEEE、IAPR Fellow周志华教授以“反绎学习”为题发表了大会报告。周志华表示&#x…

“知识图谱+”系列:知识图谱+强化学习

泽宇个人一直认为强化学习是建模动态系统最好的方法之一,通过与环境的不断交互,在动作选择和状态更新的动态过程中逐渐达到优化目标。因此,本期泽宇将从知识图谱结合强化学习的角度介绍几个不同的研究方向的内容,包括知识图谱推理…

吴恩达 | 未来十年,人工智能将向以数据为中心转变

来源:IEEE Spectrum访者:吴恩达 计算机科学家吴恩达在人工智能领域可谓声名显赫。2000 年底,他与斯坦福大学的学生一起开创了使用图形处理单元(GPU)训练深度学习模型的先河,并在 2011 年共同创立了谷歌大脑…

给几句话就能生成分子,看见分子也能生成描述,神秘的Google X把多模态AI做成了黑科技...

来源:机器学习研究组订阅AIscience 领域近来有了诸多进展。设想一下,医生写几句话来描述一种专门用于治疗患者的药物,AI 就能自动生成所需药物的确切结构。这听起来像是科幻小说,但随着自然语言和分子生物学交叉领域的进展&#x…

MIT新发现:细胞在分裂前会把垃圾带走

来源:生物通 细胞可以利用这种策略清除有毒的副产品,给后代一个干净的环境。麻省理工学院(MIT)的研究人员发现,在细胞开始分裂之前,它们会进行一些清理,将似乎不再需要的分子排出体外。利用他们开发的一种测量细胞干质…