快速列出所有字段_快速掌握目标课题的研究现状 | 应用实例

8ddd5a0e232e61578d166fcddaa6fc0a.png

Graphical Abstract

摘要

    本文旨在利用文献分析工具“Bibliometrix”及其交互界面“Biblioshiny”,基于文献数据库的检索结果,快速获取目标课题的关键信息。相较于传统人为反复阅读的方法,该方法可高效实现以下重要功能:

  • 拓展和获取更加准确的关键词

  • 了解领域内已经被占领的研究内容

  • 获取领域内必读的重要文献

  • 了解领域相关的重要期刊

  • 梳理研究进展,了解当下研究热点

  • 定位主题在领域内的位置,确认创新性和有效性

    两种文献综述方法的比较

    传统方法:

  1. 选择文献数据库

  2. 输入关键词进行检索

  3. 初筛文献,导入文献管理系统软件

  4. 通过泛读和精读,总结归纳

  5. 不断重复2,3,4步

    优化方法:

  1. 选择文献数据库

  2. 利用限定关键词进行检索

  3. 利用文献分析工具获取领域关键信息

    下文将以我之前的论文主题  “城市植物叶片中多环芳烃的城乡分布特征”  为例,进行实例演示。

0 前期准备

0.1 Bibliometrix库的安装

0.1 Bibliometrix的安装

x,公众号:KvasirBibiometrix库的安装

    Bibliometrix的实质:对文献检索结果进行排序、聚类等统计分析并进行可视化的R包。

    Biblio已经加入交互工具Shiny,这使得“non-coder”也能够轻松实现原R包的全部功能;事实上,对于“coder”来说,Shiny的加入也可以免去不必要的代码输入,大大简化工作流程。原包和交互界面的一些介绍,可参考师弟的文章。

0.2 Bibliometrix的介绍和使用

ClarkD,公众号:段造了解一个全新领域有没有什么更好的办法?

1 获取文献检索结果

    文献检索的结果是文献分析的基石,数据必须可靠,否则会影响最终的分析效果,所以必须对文献检索结果的质量进行控制。

    获取高质量文献检索结果的关键在于选择和组合合适的关键词

    当我们对不熟悉领域进行文献检索时,关键词的作用应是限定一个“相对大的、可供分析”的文献范围,因此,需要选择“相互独立的最低上位词”作为关键词。

1.1 选择最低上位词

-什么是最低上位词

--距离“未确定的研究对象”的最近上位词,以及“已确定的研究对象”

    以示例课题中的“多环芳烃”为例,相关关键词的层次为(从上位到下位):

POPs(Persistent Organic Pollutants)-持久性有机污染物Hydrocarbon-烃类物质PAHs (Polycyclic Aromatic Hydrocarbons)-多环芳烃BaP (Benzoapyrene) -苯并[a]芘在确定研究对象是多环芳烃时,最低上位词为多环芳烃;在未确定研究对象,只知课题背景是关于城市污染物研究的情况下,则应选择POPs或者Hydorcarbon作为最低上位词。1.2 相互独立,完全穷尽(MECE分析法)Mutually Exclusive Collectively Exhaustivef33b36e52228556fd8a984aeb15528e3.png关键词选取准确,无重叠,完全覆盖目标研究领域以示例课题为例:“城市植物叶片中多环芳烃的城乡分布特征”,构建关键词组合。例1:"urban" AND "plant" AND "leaf" AND "PAHs" AND "gradient" AND "distribution" AND "pattern"解析:
  1. urban选取不够准确
  2. plant 和 leaf ,pattern和distribution存在重叠
改1:"urbanization" AND "leaf" AND "PAHs" AND "gradient" AND "distribution"解析:未考虑同义词、变体和最小上位词改2:"urban*" OR "gradient" AND "leaf" OR "monitor*" OR "biomonitor" AND "PAHs" 解析:
  1.  urban,gradient词义相近,使用布尔运算符合OR并
  2. urban意在描述城市和城市化,同义词有urbanization,替换词有urbanisation,使用截词符*
  3. leaf不是确定的研究对象,应使用最小上位词“生物监测器”biomonitor,同时考虑替换词monitor和monitoring
  4. distribution可能过于限制研究内容,考虑先行删除
输入关键词9921a696b75508ec2b7f10d70deffb2a.png1.3 文献检索结果获取利用Web of Science文献数据库,输入关键词,选择“WoS核心合集”,进行文献检索。51e6bef2fa335d96bea77d48a1117805.pngWoS检索界面检索得到834篇文献,导出为“.txt”格式,并合并压缩成.zip文件。(WoS每次只能导出500条记录,故需导出两次)17026f01e8990b324b66f6e4616fafc7.pngWoS文献检索导出界面2 Bibiometrix的交互可视化文献分析2.1 导入数据打开R,运行以下代码加载Bibiometrix包,打开交互界面Biblioshiny (这之后就可以和R说再见了)
library('bibliometrix')biblioshiny()
ae97cdc0b8e0b2d228f7f4adaccdc607.pngBiblioshiny 可视化窗口导入.zip文件,开始分析,成功后,右侧会显示所有文献的各个字段的清单,可保存bibliometrix文件,便于下次直接导入使用。754bf13f1321cb3ec45993f8fd2ed984.pngData工具栏和字段清单2.2 Filter:过滤器可选取时间段,可导出所有字段清单至Excel中。693b00d68e73c051d08b72ce5ec96ea8.pngFilter 工具2.3 DataSet:字段信息概览2.3.1 Annual Scientific Production 文章发表趋势96aea8c4a3549e886df5640c32e5487c.png由图可得,2017年至今该主题的研究较为热门,证明该领域的研究基础已经较为完善,被占领的研究内容和方向可能较多。2.3.2 Three-Fields Plot “三字段桑基图”比较实用的字段包括“Keywords”,“Keywords Plus”,“References”,“Authors”,每个矩形都可拖动,便于区分。b86fe9a55e7cae70c4408da13046691d.png    由图可实现关键词拓展和同义词修正内容方面:    source appointment -来源解析    exposure-暴露    biomarker/biomonitoring-生物监测    accumulation-积累特征存在介质方面:    sediment-沉积物    soil-土壤    air/ambient air/atmosphere/air pollution    大气相关污染物:    heavy metals-重金属    PM2.5/PM10-亚微米级颗粒物    pcbs-多氯联苯2.4 Source :重要期刊的筛选c51007e7bc10157f44d7f8aa5858b330.pngSource 结果一览上图中的图题即为选择的功能,包括:
  • Most Relavent Sources “主题相关期刊”
  • Most Local Cited Sources “当前数据库中的高被引期刊”
  • Source Clustering 基于“布拉德福定律”划分的核心期刊区
  • Source Impact 期刊影响力(基于H指数)
    得到四张图列出的期刊,观察或导出表格取交集,就可以得到几个重要期刊"Science of the Total Environment""Chemosphere""Environmental Pollution""Atmosphere Environment"Source Dynamics 期刊动态变化c6f40a349da05b9ae2c80954982e5cbc.png期刊动态变化图图中红圈圈出的三个期刊,相关文章发表的数量逐年增加,而且未出现拐点,说明这三个期刊近年来比较愿意接受这个主题的文章,这是一个能够增加中稿率的关键信息。2.5 Author:重要作者筛选作者的分析功能和方法类似于2.4期刊的筛选,包括:
  • Most Relavant Authors  主题最相关作者
  • Author Impact  作者影响力排序
  • Most Local Cited Author  高被引作者
a63c5169bcd8566ad58df2179dceca7d.pngAuthor 结果一览与2.4期刊处理方法相同,取交集4-10个,可以得到几个重要作者De Nicola FAlfani AHarner TJones KC

2.6 Documents:关键词获取

Documents功能中虽然集成了重要参考文献的筛选,但个人认为,该功能较为鸡肋,原因是缺少题名字段,因此将在2.7中介绍重要文献的获得。Keywords Plus:由WoS增加的与原文章相关的关键词,但是非作者本人添加,可增加文章在相关专题下的命中率。    有三个比较实用的功能,高频词列表,词云和词树,其中高频词列表导出直接可作为关键词的补充,比上文提到的桑基图更为直接;而词云和词树可视化的作用居多,仅供直观的参考。594c0dfef97ab73d9d092c05c88381e1.png高频词可视化Word Growth 高频词和主题趋势    为研究方向的选择提供参考ca8b56a8d133dc1cc17ffce82b73a893.png高频词趋势图 1从上图可以看出,PAHs(多环芳烃)的研究热度逐年递增,部分领域(PM, Source Appointment, Air)热度递增,部分领域(Urban)热度递减f3928f49437eb746fbacc400ff497c61.png高频词趋势图 2由上图可得近年来的新兴方向,如“Risk Assessment”, “Spatial Distribution”, “Health Risk”等。上面两张图的区别可能在于,图1的纵坐标是每年关键词出现的次数,图2的纵坐标可能是关键词出现次数的标准化数据(关键词出现次数占当年关键词总次数的比例),且图2显示无重复,说明可能只在关键词标准化次数最大值的年份标注。2.7 重要文献的获取“Author's Production over Time ” 的妙用Documents中的文献功能虽然也给出了类似“2.4 作者”和“2.5期刊”的柱形图的表格,但并不实用,原因在于缺乏题目字段,因而无法直接获取关键词,无法判断文献是否属于自己想要阅读的。反而在Author功能中有一个功能极为实用,“Authors' Production over Time”,推荐导出表格,操作如下图:953d5843d7461228c5ce60747a567e2c.pngAuthor‘’s Production over Timee: Export Tableexcel中包括高被引作者文章的题目、期刊、链接、总引和年均引五个字段,可浏览题目选择感兴趣的关键词,按照期刊排序,选择高影响因子的期刊文章;按照总引排序,选择高被引文章,点击链接直接进行转到,下载或在线阅读。在浏览器地址栏输入https://doi.org/+“DOI”字段里的值即可直接访问。8b078389768d926715bada345ccc0969.pngTable例如,浏览题目后发现第一篇就与我们的主题极为相关,“冬青叶片中的PAHs积累量”,在地址栏输入“https://doi.org/10.1016/j.envpol.2007.08.008”即可。728e2c96ecdceb0d32a203134910cd50.pngPaper Example2.8 Conceptional Structure:梳理概念结构侧重梳理主题发展,特别地,对综述性文章的撰写极为有用。2.8.1Thematic Map “主题四象限图”纵坐标密度,横坐标中心程度(领域内)。
  • 第一象限:既处于领域中心且发展好
  • 第二象限:发展好但位置相对边缘
  • 第三象限:密度低且不是领域内中心,可能是新兴主题或过气主题
  • 第四象限:处于领域中心但缺乏发展的主题
  总体来说,第一、二象限属于热门学科但被占领的研究内容可能较多,三、四象限属于新兴或待发展主题,创新性和潜力较高。713359b1833ee4cf014451acbb63c325.pngTheme Map    上图可得,我们的主题部分关键词属于第三象限,但如果单纯研究“urban”和“PAHs”缺乏创新性,可以考虑结合主题演进,选择新兴的热门主题进行主题交叉。2.8.2 Theme Evolution “主题演进图”99b3ac13eb6117e58eb2d65df51a6bd8.png主题演化图:1997年至今可按照需求,划分时间节点,研究不同时间段内的主题热度。我们将主题以2008, 2013, 2017三个时间点划分为四个时间段,主要分析2017年至今(近3年)。d2492352ce3abbc3f587789ef4c3a4db.png主题聚类图:2017年至今从第二象限来看,近三年的研究较为分离,若考虑将关键词交叉研究,可能会出好结果,师姐前段时间新鲜出炉的7分Sci就是将第二象限中的“land-use”, “biomonitor” 和“PAHs”结合。从第四象限来看,近三年的研究中,我们主题中的关键词“distribution”, “urban”, “passive sampler” (leaf) 仍处于集中但研究较少的阶段,证明我们的主题仍然是当下的热点;同时与健康相关的“健康暴露”和“与室内空气的关系” (“cancer-risk”和“indoor air”)可能是未来的研究热点3 总结1. 利用Bibliometrix及其交互界面,我们实现了以下重要目标:
  • 拓展和获取更加准确的关键词
  • 了解领域内已经被占领的研究内容
  • 获取领域内必读的重要文献
  • 了解领域相关的重要期刊
  • 梳理研究进展,了解当下研究热点
  • 定位主题在领域内的位置,确认创新性和有效性
   2. 在文献引用网络和文献分类方面,Biblio的可视化较差,可考虑使用HistCite, CitNetExplorer等引文分析分类软件。3. Bibliometrix目前仅支持部分数据库(Web of Science, Scopus, Dimension, PudMed, Cochrane)。4. Biblioshiny的出现基本拜托了R的桎梏,大大简化工作流程。相关资料1Bibliometrix官网:https://bibliometrix.org/index.html.2Bibliometrix文章原文:Aria, M., & Cuccurullo, C. (2017).Bibliometrix:An R-tool for comprehensive science mapping analysis. Journal of Informetrics,11(4), 959-975. 10.1016/j.joi.2017.08.007.2020/08/13-翻书:biblio,biblio,biblio.-合书:bilibli.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/244970.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

驱动程序和应用程序之间的体系结构不匹配_修复Win10上的黑屏问题全攻略,并不高深,一看就会...

在Windows 10上,你可能会遇到的最烦人的问题之一是黑屏,因为你不会在屏幕上看到错误代码或消息以获取有关从何处开始进行疑难解答的提示。黑屏的发生可能有多种原因。它可能与最近的显卡驱动程序更新有关,或者可能在包含兼容性问题的功能更新…

常用各种芯片手册大全_【汇总】超全面!国内芯片60个细分领域知名代表企业...

国内芯片60个细分领域知名代表企业↓↓↓↓↓↓文章来源:ittbank软文广告与加入群互动交流群的朋友,请加小编微信交流加入微信交流的朋友,请备注:公司名字(公司简称)名字行业方便小编按行业区分邀请进群,术有专攻请自觉…

文件被后台程序占用无法删除_win10重装后系统占用50G?只要做好这2步,运行比win7还快...

大家都清楚系统C盘是电脑的"生命",一旦C盘出现"爆红",那你离电脑死机也就不远了。如果你还无法体会到这种感觉,那你可以想象打开一个word文档都要看到鼠标在转圈,随即黑屏,啥都动不了的那种生无可…

plsql执行command命令控制台出现乱码_展现“管理员”的神级能力,有趣又实用的我的世界基础命令...

在上一篇文章《Minecraft基岩版(手机版、便携版、PE版)开服指南》中,我们介绍了《我的世界》基岩版的开服方法。然后这篇文章,就为那些了解更多细节的玩家,介绍一下常见的管理员命令。另外,由于《我的世界》有多个版本(JAVA版、基…

新一代人工智能发展规划_助力人工智能创新发展,新华三任合肥市新一代人工智能产业发展联盟理事单位...

近日,合肥市新一代人工智能产业发展联盟正式成立。合肥市委常委、常务副市长罗云峰出席成立大会并讲话,联盟相关指导单位领导、理事单位成员代表等参加会议。会上,紫光旗下新华三集团下属新华三信息安全技术有限公司副总裁王冬作为理事单位代…

sqlserver 查询中文查询不到 查询英文可以查到_估值数据和财报数据查询方法

为了让更多的读者朋友学会自己查阅估值数据和财报数据,根据自己查到的资料进行独立思考,帮助投资,二师父搜集整理了估值数据和财报数据的查询网站,并教给大家如何通过这些网站查阅到的数据来做投资决定。估值数据查询网站&#xf…

python刷阅读_用Python汇集并生成每日教育动态

本文记录了“每日教育动态”想法的产生以及实现过程,分为三部分:想法由来及实现效果、实现步骤和实现后的一点想法。一、想法由来及实现效果教育学是一门理论与实践相结合的学科,实践起来人人都会,每天打开手机刷个公众号都是完成…

linux切换root报错,Linux用户切换到root后运行图形程序报错(*GLib-GIO-CRITICAL **)

用su切换到root用户后,运行某些带图形的程序,会报如下错误:(ImageProc_qt:3158): GLib-GIO-CRITICAL **: g_dbus_connection_register_object: assertion G_IS_DBUS_CONNECTION (connection) failed(ImageProc_qt:3158): GLib-GIO-CRITICAL *…

python程序打包多个py文件_不使用setup.py,打包 Python 项目

我编写了许多开源项目,并允许其他人通过PyPI访问这些项目。为此,我需要从这些项目构建一个源代码分发版(sdist)和一个可选的wheel包,并将二者上传到PyPI。最后,这个sdist和wheel包必须要能通过pip进行安装,以便其他人使…

软件工程软件开发成本度量规范_软件开发成本度量方法

软件成本度量一直都是软件行业的一个痛点问题。软件度量一度乱象丛生。拍脑袋的定价方式曾大行其道。软件成本度量的乱象直接导致了软件价格的诸多问题。比如预算费用存在浪费或不足的现象,招标存在投标额过低过高等非正常状况。这些情况都是因为度量标准的缺失&…

数据挖掘算法_算法篇(01) 数据挖掘算法初探

前言无论是传统行业,还是互联网行业。掌握数据,就是掌握规律。当你了解了市场数据,对它进行分析,就可以得到市场规律。当你掌握了产品自身的数据,对它进行分析,就可以了解产品的用户来源、用户画像等等。所…

java中怎么判断一段代码时线程安全还是非线程安全_24张图带你彻底理解Java中的21种锁...

(给ImportNew加星标,提高Java技能)转自:悟空聊架本篇主要内容如下:本篇文章已收纳到我的 Java 在线文档、 Github。我的 SpringCloud 实战项目持续更新中。帮你总结好的锁:序号锁名称应用1乐观锁CAS2悲观锁synchronized、vector、…

python大概学多久_自学Python要学多久可以学会?

如果是自学,从零基础开端学习python的话,按照每个人理解能力的不同,大致上需求半年到一年半左右的时刻,当然,如果有其它编程言语的经历,入门还是比较快的,大概需求2~3个月可以用Python言语编写一…

u盘 linux centos 5.3,鸟哥linux私房菜学习笔记,U盘安装centos5.3不能正常进入图形界面的问题...

前面说过自己成功引导了centos系统,现在进入启动界面,首次进入会进行相关设置,按照步骤一步一步完成,取消完光盘安装,点击下一步,就进入下面这个界面,没有登录框。。。没错!怎么蓝屏…

将excel转为python的字典_python读取excel表并把数据转存为字典

excel表如下:我们需要通过使用python的xlrd方法先读取excel,再遍历赋值给字典。代码如下: importxlrdclassRead_Ex():defread_excel(self):#打开excel表,填写路径 book xlrd.open_workbook("../Data/test.xlsx")#找到s…

micropython是啥 知乎_嵌入式开发必备调试工具:Micro-Lab

在工作中,以什么样的方式向领导汇报工作最直接高效呢?当然是图形界面!图形界面更好表达一个程序设计的逻辑思维,一目了然,本次介绍的Micro-Lab出自风媒电子-赵工之手。 1.什么是Micro-Lab? Micro-Lab可以称得上是迄今…

python面向对象三大基本特性_python面向对象之三大特性

继承 先看个简单的例子了解一下继承。class Animal: #父类 def __init__(self, name, age, department): self.namename self.ageage self.departmentdepartmentdefrunning(self):print(‘%s可以奔跑!‘%self.name)class Cat(Animal): #括号里放要继承的父类 def __…

python怎么调用列表_Python中列表的使用

python中的列表与java中的数组非常类似,但使用方法比java中数组简单很多,python中的数据类型不需要显示声明,但在使用时必须赋值,列表元素下标从0开始 初始化列表(初始化一个包含五个元素的列表和一个空列表&#xff0…

jquery find 找到frame select_简述jQuery

jQuery 是一个高效、精简并且功能丰富的 JavaScript 工具库。它提供的 API 易于使用且兼容众多浏览器,这让诸如 HTML 文档遍历和操作、事件处理、动画和 Ajax 操作更加简单。一、获取元素jQuery的核心设计思想就是获取元素,然后对其操作;因此…

求中位数中回文数之和C语言,一些算法题及答案

1. 两数之和给定一个整数数组 nums 和一个目标值 target,请你在该数组中找出和为目标值的那 两个 整数,并返回他们的数组下标。你可以假设每种输入只会对应一个答案。但是,你不能重复利用这个数组中同样的元素。示例:给定 nums [2, 7, 11, 1…