快速列出所有字段_快速掌握目标课题的研究现状 | 应用实例

8ddd5a0e232e61578d166fcddaa6fc0a.png

Graphical Abstract

摘要

    本文旨在利用文献分析工具“Bibliometrix”及其交互界面“Biblioshiny”,基于文献数据库的检索结果,快速获取目标课题的关键信息。相较于传统人为反复阅读的方法,该方法可高效实现以下重要功能:

  • 拓展和获取更加准确的关键词

  • 了解领域内已经被占领的研究内容

  • 获取领域内必读的重要文献

  • 了解领域相关的重要期刊

  • 梳理研究进展,了解当下研究热点

  • 定位主题在领域内的位置,确认创新性和有效性

    两种文献综述方法的比较

    传统方法:

  1. 选择文献数据库

  2. 输入关键词进行检索

  3. 初筛文献,导入文献管理系统软件

  4. 通过泛读和精读,总结归纳

  5. 不断重复2,3,4步

    优化方法:

  1. 选择文献数据库

  2. 利用限定关键词进行检索

  3. 利用文献分析工具获取领域关键信息

    下文将以我之前的论文主题  “城市植物叶片中多环芳烃的城乡分布特征”  为例,进行实例演示。

0 前期准备

0.1 Bibliometrix库的安装

0.1 Bibliometrix的安装

x,公众号:KvasirBibiometrix库的安装

    Bibliometrix的实质:对文献检索结果进行排序、聚类等统计分析并进行可视化的R包。

    Biblio已经加入交互工具Shiny,这使得“non-coder”也能够轻松实现原R包的全部功能;事实上,对于“coder”来说,Shiny的加入也可以免去不必要的代码输入,大大简化工作流程。原包和交互界面的一些介绍,可参考师弟的文章。

0.2 Bibliometrix的介绍和使用

ClarkD,公众号:段造了解一个全新领域有没有什么更好的办法?

1 获取文献检索结果

    文献检索的结果是文献分析的基石,数据必须可靠,否则会影响最终的分析效果,所以必须对文献检索结果的质量进行控制。

    获取高质量文献检索结果的关键在于选择和组合合适的关键词

    当我们对不熟悉领域进行文献检索时,关键词的作用应是限定一个“相对大的、可供分析”的文献范围,因此,需要选择“相互独立的最低上位词”作为关键词。

1.1 选择最低上位词

-什么是最低上位词

--距离“未确定的研究对象”的最近上位词,以及“已确定的研究对象”

    以示例课题中的“多环芳烃”为例,相关关键词的层次为(从上位到下位):

POPs(Persistent Organic Pollutants)-持久性有机污染物Hydrocarbon-烃类物质PAHs (Polycyclic Aromatic Hydrocarbons)-多环芳烃BaP (Benzoapyrene) -苯并[a]芘在确定研究对象是多环芳烃时,最低上位词为多环芳烃;在未确定研究对象,只知课题背景是关于城市污染物研究的情况下,则应选择POPs或者Hydorcarbon作为最低上位词。1.2 相互独立,完全穷尽(MECE分析法)Mutually Exclusive Collectively Exhaustivef33b36e52228556fd8a984aeb15528e3.png关键词选取准确,无重叠,完全覆盖目标研究领域以示例课题为例:“城市植物叶片中多环芳烃的城乡分布特征”,构建关键词组合。例1:"urban" AND "plant" AND "leaf" AND "PAHs" AND "gradient" AND "distribution" AND "pattern"解析:
  1. urban选取不够准确
  2. plant 和 leaf ,pattern和distribution存在重叠
改1:"urbanization" AND "leaf" AND "PAHs" AND "gradient" AND "distribution"解析:未考虑同义词、变体和最小上位词改2:"urban*" OR "gradient" AND "leaf" OR "monitor*" OR "biomonitor" AND "PAHs" 解析:
  1.  urban,gradient词义相近,使用布尔运算符合OR并
  2. urban意在描述城市和城市化,同义词有urbanization,替换词有urbanisation,使用截词符*
  3. leaf不是确定的研究对象,应使用最小上位词“生物监测器”biomonitor,同时考虑替换词monitor和monitoring
  4. distribution可能过于限制研究内容,考虑先行删除
输入关键词9921a696b75508ec2b7f10d70deffb2a.png1.3 文献检索结果获取利用Web of Science文献数据库,输入关键词,选择“WoS核心合集”,进行文献检索。51e6bef2fa335d96bea77d48a1117805.pngWoS检索界面检索得到834篇文献,导出为“.txt”格式,并合并压缩成.zip文件。(WoS每次只能导出500条记录,故需导出两次)17026f01e8990b324b66f6e4616fafc7.pngWoS文献检索导出界面2 Bibiometrix的交互可视化文献分析2.1 导入数据打开R,运行以下代码加载Bibiometrix包,打开交互界面Biblioshiny (这之后就可以和R说再见了)
library('bibliometrix')biblioshiny()
ae97cdc0b8e0b2d228f7f4adaccdc607.pngBiblioshiny 可视化窗口导入.zip文件,开始分析,成功后,右侧会显示所有文献的各个字段的清单,可保存bibliometrix文件,便于下次直接导入使用。754bf13f1321cb3ec45993f8fd2ed984.pngData工具栏和字段清单2.2 Filter:过滤器可选取时间段,可导出所有字段清单至Excel中。693b00d68e73c051d08b72ce5ec96ea8.pngFilter 工具2.3 DataSet:字段信息概览2.3.1 Annual Scientific Production 文章发表趋势96aea8c4a3549e886df5640c32e5487c.png由图可得,2017年至今该主题的研究较为热门,证明该领域的研究基础已经较为完善,被占领的研究内容和方向可能较多。2.3.2 Three-Fields Plot “三字段桑基图”比较实用的字段包括“Keywords”,“Keywords Plus”,“References”,“Authors”,每个矩形都可拖动,便于区分。b86fe9a55e7cae70c4408da13046691d.png    由图可实现关键词拓展和同义词修正内容方面:    source appointment -来源解析    exposure-暴露    biomarker/biomonitoring-生物监测    accumulation-积累特征存在介质方面:    sediment-沉积物    soil-土壤    air/ambient air/atmosphere/air pollution    大气相关污染物:    heavy metals-重金属    PM2.5/PM10-亚微米级颗粒物    pcbs-多氯联苯2.4 Source :重要期刊的筛选c51007e7bc10157f44d7f8aa5858b330.pngSource 结果一览上图中的图题即为选择的功能,包括:
  • Most Relavent Sources “主题相关期刊”
  • Most Local Cited Sources “当前数据库中的高被引期刊”
  • Source Clustering 基于“布拉德福定律”划分的核心期刊区
  • Source Impact 期刊影响力(基于H指数)
    得到四张图列出的期刊,观察或导出表格取交集,就可以得到几个重要期刊"Science of the Total Environment""Chemosphere""Environmental Pollution""Atmosphere Environment"Source Dynamics 期刊动态变化c6f40a349da05b9ae2c80954982e5cbc.png期刊动态变化图图中红圈圈出的三个期刊,相关文章发表的数量逐年增加,而且未出现拐点,说明这三个期刊近年来比较愿意接受这个主题的文章,这是一个能够增加中稿率的关键信息。2.5 Author:重要作者筛选作者的分析功能和方法类似于2.4期刊的筛选,包括:
  • Most Relavant Authors  主题最相关作者
  • Author Impact  作者影响力排序
  • Most Local Cited Author  高被引作者
a63c5169bcd8566ad58df2179dceca7d.pngAuthor 结果一览与2.4期刊处理方法相同,取交集4-10个,可以得到几个重要作者De Nicola FAlfani AHarner TJones KC

2.6 Documents:关键词获取

Documents功能中虽然集成了重要参考文献的筛选,但个人认为,该功能较为鸡肋,原因是缺少题名字段,因此将在2.7中介绍重要文献的获得。Keywords Plus:由WoS增加的与原文章相关的关键词,但是非作者本人添加,可增加文章在相关专题下的命中率。    有三个比较实用的功能,高频词列表,词云和词树,其中高频词列表导出直接可作为关键词的补充,比上文提到的桑基图更为直接;而词云和词树可视化的作用居多,仅供直观的参考。594c0dfef97ab73d9d092c05c88381e1.png高频词可视化Word Growth 高频词和主题趋势    为研究方向的选择提供参考ca8b56a8d133dc1cc17ffce82b73a893.png高频词趋势图 1从上图可以看出,PAHs(多环芳烃)的研究热度逐年递增,部分领域(PM, Source Appointment, Air)热度递增,部分领域(Urban)热度递减f3928f49437eb746fbacc400ff497c61.png高频词趋势图 2由上图可得近年来的新兴方向,如“Risk Assessment”, “Spatial Distribution”, “Health Risk”等。上面两张图的区别可能在于,图1的纵坐标是每年关键词出现的次数,图2的纵坐标可能是关键词出现次数的标准化数据(关键词出现次数占当年关键词总次数的比例),且图2显示无重复,说明可能只在关键词标准化次数最大值的年份标注。2.7 重要文献的获取“Author's Production over Time ” 的妙用Documents中的文献功能虽然也给出了类似“2.4 作者”和“2.5期刊”的柱形图的表格,但并不实用,原因在于缺乏题目字段,因而无法直接获取关键词,无法判断文献是否属于自己想要阅读的。反而在Author功能中有一个功能极为实用,“Authors' Production over Time”,推荐导出表格,操作如下图:953d5843d7461228c5ce60747a567e2c.pngAuthor‘’s Production over Timee: Export Tableexcel中包括高被引作者文章的题目、期刊、链接、总引和年均引五个字段,可浏览题目选择感兴趣的关键词,按照期刊排序,选择高影响因子的期刊文章;按照总引排序,选择高被引文章,点击链接直接进行转到,下载或在线阅读。在浏览器地址栏输入https://doi.org/+“DOI”字段里的值即可直接访问。8b078389768d926715bada345ccc0969.pngTable例如,浏览题目后发现第一篇就与我们的主题极为相关,“冬青叶片中的PAHs积累量”,在地址栏输入“https://doi.org/10.1016/j.envpol.2007.08.008”即可。728e2c96ecdceb0d32a203134910cd50.pngPaper Example2.8 Conceptional Structure:梳理概念结构侧重梳理主题发展,特别地,对综述性文章的撰写极为有用。2.8.1Thematic Map “主题四象限图”纵坐标密度,横坐标中心程度(领域内)。
  • 第一象限:既处于领域中心且发展好
  • 第二象限:发展好但位置相对边缘
  • 第三象限:密度低且不是领域内中心,可能是新兴主题或过气主题
  • 第四象限:处于领域中心但缺乏发展的主题
  总体来说,第一、二象限属于热门学科但被占领的研究内容可能较多,三、四象限属于新兴或待发展主题,创新性和潜力较高。713359b1833ee4cf014451acbb63c325.pngTheme Map    上图可得,我们的主题部分关键词属于第三象限,但如果单纯研究“urban”和“PAHs”缺乏创新性,可以考虑结合主题演进,选择新兴的热门主题进行主题交叉。2.8.2 Theme Evolution “主题演进图”99b3ac13eb6117e58eb2d65df51a6bd8.png主题演化图:1997年至今可按照需求,划分时间节点,研究不同时间段内的主题热度。我们将主题以2008, 2013, 2017三个时间点划分为四个时间段,主要分析2017年至今(近3年)。d2492352ce3abbc3f587789ef4c3a4db.png主题聚类图:2017年至今从第二象限来看,近三年的研究较为分离,若考虑将关键词交叉研究,可能会出好结果,师姐前段时间新鲜出炉的7分Sci就是将第二象限中的“land-use”, “biomonitor” 和“PAHs”结合。从第四象限来看,近三年的研究中,我们主题中的关键词“distribution”, “urban”, “passive sampler” (leaf) 仍处于集中但研究较少的阶段,证明我们的主题仍然是当下的热点;同时与健康相关的“健康暴露”和“与室内空气的关系” (“cancer-risk”和“indoor air”)可能是未来的研究热点3 总结1. 利用Bibliometrix及其交互界面,我们实现了以下重要目标:
  • 拓展和获取更加准确的关键词
  • 了解领域内已经被占领的研究内容
  • 获取领域内必读的重要文献
  • 了解领域相关的重要期刊
  • 梳理研究进展,了解当下研究热点
  • 定位主题在领域内的位置,确认创新性和有效性
   2. 在文献引用网络和文献分类方面,Biblio的可视化较差,可考虑使用HistCite, CitNetExplorer等引文分析分类软件。3. Bibliometrix目前仅支持部分数据库(Web of Science, Scopus, Dimension, PudMed, Cochrane)。4. Biblioshiny的出现基本拜托了R的桎梏,大大简化工作流程。相关资料1Bibliometrix官网:https://bibliometrix.org/index.html.2Bibliometrix文章原文:Aria, M., & Cuccurullo, C. (2017).Bibliometrix:An R-tool for comprehensive science mapping analysis. Journal of Informetrics,11(4), 959-975. 10.1016/j.joi.2017.08.007.2020/08/13-翻书:biblio,biblio,biblio.-合书:bilibli.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/244970.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

linux 引导程序修复工具,linux 引导修复工具

如果你有Windows 系统安装盘/ 启动盘,或者安装了DOS 工具,可以从Windows 进入纯DOS 界面的话,那么可以分别用 fixmbr 命令生成正确的引导文件boot.ini ,和使用 fdisk /mbr 命令修复MBR 。详细请看windows xp 双系统卸载linux ubun…

驱动程序和应用程序之间的体系结构不匹配_修复Win10上的黑屏问题全攻略,并不高深,一看就会...

在Windows 10上,你可能会遇到的最烦人的问题之一是黑屏,因为你不会在屏幕上看到错误代码或消息以获取有关从何处开始进行疑难解答的提示。黑屏的发生可能有多种原因。它可能与最近的显卡驱动程序更新有关,或者可能在包含兼容性问题的功能更新…

常用各种芯片手册大全_【汇总】超全面!国内芯片60个细分领域知名代表企业...

国内芯片60个细分领域知名代表企业↓↓↓↓↓↓文章来源:ittbank软文广告与加入群互动交流群的朋友,请加小编微信交流加入微信交流的朋友,请备注:公司名字(公司简称)名字行业方便小编按行业区分邀请进群,术有专攻请自觉…

linux 创建路径函数,Linux函数库的创建方法(2)

2. 静态库的创建与使用静态库本质就是一组 .o 组成的压缩文件,扩展名为 .a / .lib代码如下:ar -crv libXXX.a mmmm.o nnnn.oXXX 是库名,mmmm.o nnnn.o 是要打包的目标文件。crv 参数,含义分别是c: do not warn if the …

文件被后台程序占用无法删除_win10重装后系统占用50G?只要做好这2步,运行比win7还快...

大家都清楚系统C盘是电脑的"生命",一旦C盘出现"爆红",那你离电脑死机也就不远了。如果你还无法体会到这种感觉,那你可以想象打开一个word文档都要看到鼠标在转圈,随即黑屏,啥都动不了的那种生无可…

plsql执行command命令控制台出现乱码_展现“管理员”的神级能力,有趣又实用的我的世界基础命令...

在上一篇文章《Minecraft基岩版(手机版、便携版、PE版)开服指南》中,我们介绍了《我的世界》基岩版的开服方法。然后这篇文章,就为那些了解更多细节的玩家,介绍一下常见的管理员命令。另外,由于《我的世界》有多个版本(JAVA版、基…

一键 linux桌面安装vnc,Ubuntu 16.04 LTS一键安装VNC

Ubuntu 16.04 LTS 安装VNC,在搜索上找了很多教程,不是太老,就是说的驴唇不对马嘴,所以忍不住写一些以正视听。Ubuntu 16.04 LTS是最近出的LTS版本系统,估计未来也会有长期的使用频率,配置好远程桌面&#x…

新一代人工智能发展规划_助力人工智能创新发展,新华三任合肥市新一代人工智能产业发展联盟理事单位...

近日,合肥市新一代人工智能产业发展联盟正式成立。合肥市委常委、常务副市长罗云峰出席成立大会并讲话,联盟相关指导单位领导、理事单位成员代表等参加会议。会上,紫光旗下新华三集团下属新华三信息安全技术有限公司副总裁王冬作为理事单位代…

sqlserver 查询中文查询不到 查询英文可以查到_估值数据和财报数据查询方法

为了让更多的读者朋友学会自己查阅估值数据和财报数据,根据自己查到的资料进行独立思考,帮助投资,二师父搜集整理了估值数据和财报数据的查询网站,并教给大家如何通过这些网站查阅到的数据来做投资决定。估值数据查询网站&#xf…

linux内核参数的程序,技巧-Linux内核参数调整办法

ulimit设置ulimit -n 要调整为100000甚至更大。 命令行下执行 ulimit -n 100000即可修改。如果不能修改,需要设置 /etc/security/limits.conf,加入* soft nofile 262140* hard nofile 262140root soft nofile 262140root hard nofile 262140* soft core …

java面试换背景颜色_实习|渣二本Java菜鸡0 Offer的春招血泪史,一定要主动去找实习呀!

作者:codingCoge链接:https://www.nowcoder.com/discuss/177823来源:牛客网前言:一个菜鸡的春招血泪史,共勉到现在还是0offer先玄学求一波Offer2019.3.27更新:三月快结束了,对我来说春招也基本落幕了.虽然好多大厂4月才开始招聘,不过我已经不…

python刷阅读_用Python汇集并生成每日教育动态

本文记录了“每日教育动态”想法的产生以及实现过程,分为三部分:想法由来及实现效果、实现步骤和实现后的一点想法。一、想法由来及实现效果教育学是一门理论与实践相结合的学科,实践起来人人都会,每天打开手机刷个公众号都是完成…

linux切换root报错,Linux用户切换到root后运行图形程序报错(*GLib-GIO-CRITICAL **)

用su切换到root用户后,运行某些带图形的程序,会报如下错误:(ImageProc_qt:3158): GLib-GIO-CRITICAL **: g_dbus_connection_register_object: assertion G_IS_DBUS_CONNECTION (connection) failed(ImageProc_qt:3158): GLib-GIO-CRITICAL *…

python程序打包多个py文件_不使用setup.py,打包 Python 项目

我编写了许多开源项目,并允许其他人通过PyPI访问这些项目。为此,我需要从这些项目构建一个源代码分发版(sdist)和一个可选的wheel包,并将二者上传到PyPI。最后,这个sdist和wheel包必须要能通过pip进行安装,以便其他人使…

软件工程软件开发成本度量规范_软件开发成本度量方法

软件成本度量一直都是软件行业的一个痛点问题。软件度量一度乱象丛生。拍脑袋的定价方式曾大行其道。软件成本度量的乱象直接导致了软件价格的诸多问题。比如预算费用存在浪费或不足的现象,招标存在投标额过低过高等非正常状况。这些情况都是因为度量标准的缺失&…

linux 神的编辑器,编辑器之神-vim的使用,编辑器神-vim

编辑器之神-vim的使用,编辑器神-vimvim即vi的升级版;在linux中,vi是vim的软链接,我们敲vi和vim出来的都是vim;纯手打,如有错误,敬请指出。vi的三种模式及简单使用vi三种模式命令模式(默认)&…

爬虫python下载视频_用python做爬虫下载视频

用python有一段时间了,对python是十二分喜爱,在我看来python是个好工具,可以轻松简洁的帮我完成一些我想要完成的工作。下面和大家分享一下我用python爬取某网站视频的案例。用python去保存网站的视频,主要是为了后续的查看和备份…

python3软件怎么用_Python3学习之路~4.4 软件目录结构规范

为什么要设计好目录结构?可读性高: 不熟悉这个项目的代码的人,一眼就能看懂目录结构,知道程序启动脚本是哪个,测试目录在哪儿,配置文件在哪儿等等。从而非常快速的了解这个项目。可维护性高: 定义好组织规则后,维护者…

linux安装nginx1.9,CentOS7.2安装Nginx 1.9

今天在最新的centos7.2上安装nginx1.9,希望安装流程对你有所帮助,一定要查看对应centos的版本。一、确认一下centos的版本[rootlocalhost ~]# cat /etc/redhat-releaseCentOS Linux release 7.2.1511 (Core)二、安装依赖包和开发工具:yum ins…

python获取文件夹下文件_Python 获取指定文件夹下的目录和文件的实现

经常有需要扫描目录,对文件做批量处理的需求,所以对目录处理这块做了下学习和总结。Python 中扫描目录有两种方法:os.listdir 和 os.walk。 一、os.listdir 方法 os.listdir() 方法用于返回指定的目录下包含的文件或子目录的名字的列表。这个…