HistCite 的使用方法

摘要

读文献自然要读精品,在面对一个陌生领域,如何才能以最快速度定位精品文献呢?本文将详细介绍 HistCite 的使用方法,结合 Web of Science 和 Endnote ,演示如何在几个小时之内,对某个陌生领域的文献进行宏观的梳理,并快速定位重要文献。

前言

作为科研工作者,我们常常需要对一个陌生领域进行文献调研。我们通常使用 Web of Science(WOS) 或者 Google Scholar 进行文献检索,并认为引用频次较高的文章,就是该领域的重要文章。但是,大多数情况下,其搜索结果都不会太理想。因为所统计的引用既包括同行的,也包括外行的,而我们真正想寻找的是那些被同行引用频次最高的文献。同时,进入陌生领域最快速的方式无疑是看最新的综述,但是最新综述的引用频次往往很低,因为发表年限太短,人们往往还没来得及引用。所以,使用引用频次排序的方法往往会把最新的综述文章漏掉。再次,既然是一个陌生领域,我们很可能不知道其热门研究方向,因此往往连用什么关键词都不太清楚,在这种情况下该如何进行文献检索呢?

事实上,上述问题早就有了很好的解决方案——使用 HistCite 软件,它可以帮助我们在短短几个小时之内对陌生领域大量文献,进行引证关联分析,从而快速描绘出陌生领域的发展脉络,锁定重要文献,找出该领域的明星科学家。

HistCite 简介

关于 HistCite 的介绍参考罗昭锋老师写的《引文分析软件 histcite 简介》。

HistCite = History of Cite ,意为引文历史,或者叫引文图谱分析软件。该软件系SCI的发明人加菲尔德开发,能够用图示的方式展示某一领域不同文献之间的关系。软件的最新版本可以从http://www.histcite.com 网站下载。

f1

图1 HistCite 的界面

从 http://www.histcite.com 网站下载软件,安装之后,点击 HistCite 图标即可开启软件,软件使用IE作为其界面,显得很简陋(图1)。

f2

图2 HistCite 给出的文献引证关系图

但是, HistCite 的功能十分强大,最酷炫的功能就是能够给出引证关系图(图2),有了这个功能,我们甚至连文章标题都不用看,就可以判断哪些文章值得一读。

接下来,我们用一个实例,演示如何使用 HistCite 对某个领域的文献进行分析。例如:我最近在调研火星的地球化学研究。

从WOS获取数据

f3

图3 WOS 检索关键词 “Mars”

登录 http://www.webofknowledge.com 网站,并检索关键词 “Mars”(图3)。需要注意的是,数据库必须选择 “Web of ScienceTM核心合集”。否则,检索结果无法导出全部引文记录,也就无法使用 HistCite 进行分析。

f4

图4 关键词 “Mars” 的检索结果

检索结果有 34797 条(图4),文献有点多,考虑到我只关心火星的地球化学特征,所以,我们使用 “GEOCHEMISTRY GEOPHYSICS” 精炼一下,这样就只剩下 4439 条记录。此时,我们并不需要找全所有文献,只需要包含大部分文献即可。后续通过 HistCite 进行分析,重要文献基本都跑不掉。

f5af5b

图5 导出检索结果

选择“保存为其他文件格式”(图5上),在弹出的对话框中(图5下),“记录内容”选择“全记录与引用的参考文献”,“文件格式”选择“纯文本”。由于一次最多只能下载 500 条记录,所以我们先下载第 1 至 500 条。共 4439 条记录,共需要下载 9 次。

在 HistCite 导入数据

打开 HistCite 软件,选择 File -- Add File ,选择下载的文件,点击 Add File 按钮导入文件(图6)。

f6

图6 导入数据文件

注意:如果无法导入,(1)请把下载的 txt 文件用记事本打开,将第一行的 "FN Thomson Reuters Web of Science™VR" 替换成 "FN ISI Export FormatVR",另存为 txt 文件,编码选择 ANSI ;(2)确保文件的路径中没有中文(如图6)。

f7

图7 导入成功后的界面

导入数据后,可以见到上方的 Records 中已经有了 500 条记录(图7)。接下来,我们依次导入其它8个数据文件。全部导入成功之后,我们可以用File -- Save As ,把所有数据存在一个(*.hci)文件中(图8)。这样下次导入数据就不必挨个打开 txt 文件了,直接打开此 hci 文件即可。

f8

图8 将所有数据另存到一个 hci 文件中

HistCite 参数介绍

f9

图9 HistCite 分析界面

从上方的数据可知,我们一共导入文献 4433 条,由 7721 位作者完成,发表在 107 种杂志上,这些都好理解。需要详细说明的是右边的4个参数:

  1. GCS = global citation score ,即总引用频次,它表示这篇文章被整个WOS数据库中所有文献引用的次数。
  2. LCS = local citation score ,即本地引用次数,它表示这篇文章在当前数据集中被引用的次数。在这个例子里面就是,被导入的 4433 篇文献引用的次数。因为导入的文献是 “Mars” 的搜索结果,所以如果一篇文章的 LCS 值高,意味着它是 “Mars” 领域内的重要文献。
  3. LCR = local cited references ,本地参考文献数,它表示这篇文献的参考文献在当前数据集中的数量,即这篇文献引用别人的情况。如果一篇文章的 LCR 值高,意味着它引用了大量的 “Mars” 领域内文献,极有可能是综述文章。
  4. CR = cited references ,参考文献数,它表示这篇文章的参考文献在整个 WOS 数据库中的数量。 
    简而言之, LCS 和 LCR 更重要,它们分别代表了与本领域相关联的被引用数和引用数, LCS 值高的文章一般是重要的新发现或者新解释, LCR 值高的一般是综述类文章。

补充漏网文献

在检索文献的时候,无论怎样设置关键词,一定会存在漏网的重要文献。使用 HistCite ,重要文献基本上都跑不掉。

通过界面上方的 “Cited References” (图10),我们知道有 86924 篇文献被全部 4433 篇文章所引用。通过点击该链接,我们可以进入这 86924 篇被引文献的列表。在这个列表中,我们发现很多文献后面都有个绿色的“+”号,这表明这篇文献并没有被本地数据集收录,也就是说通过关键词搜索并没有检索到的文献。每篇文献最后有个 Recs 值,表示这篇文献在当前数据集中被引频次,通过 Recs 排序,我们很快就可以定位重要的被遗漏的文献。实际上,“漏网之鱼”还真不少,排名前9的文献,有 6 篇都没有被收录进来。

f10

图10 HistCite “Cited References” 界面

接下来,我们需要把这些重要的“漏网之鱼”的数据补全。首先,拷贝这篇文献的 DOI 值,到 WOS 网站搜索(图11)。

f11

图11 使用 WOS 检索漏网文献

然后勾选搜索到的文献,选择“添加到标记结果列表”(图12)。

f12

图12 将搜索结果添加到标记结果列表

然后,继续搜索下一篇文献,并添加到标记结果列表。等完成所有搜索之后,点击右上角的“标记结果列表”,一次性把所有结果导出来。导出时,与图5所示一样,“记录内容”选择“全记录与引用的参考文献”,“文件格式”选择“纯文本”。最后,再将 txt 文件导入到 HistCite 中,导入方法与前面介绍的一样。

寻找专家大牛

f13

图13 HistCite “Author” 界面'

通过点击界面上方的 “Author” 链接(图13),可以进入作者列表,总共有 7736 位作者。 Recs 代表文章数, TLCS = Total LCS , TGCS = Total GCS 。通过这个列表很容易找出该领域内最高产和最具有学术影响力的专家。

收集关键词

f14

图14 HistCite “Word” 界面

通过点击界面上方的 “Word” 链接(图14),我们可以进入关键词列表,从而了解这个领域目前的研究焦点,记住这些关键词,在后续对某个特定问题进行搜索时会比较方便。

生成引证关系图

f15

图15 HistCite 开启 “Graph Maker”

选择Tools -- Graph maker(图15),软件开启一个新窗口(图16)。

f16

图16 HistCite “Graph Maker” 界面

作图界面并不复杂,关键选择是参与做图的文献数量,其余参数都是调整图片中方块、线条和字体的大小。这里选择的是 LCS 排名前 50 的文献。如果对图中某篇文献感兴趣,可以直接点击它,软件会在一个新窗口中打开该文献的详细信息,我们可以预览一下论文的标题和摘要(图17)。

f17

图17 HistCite 文献详细信息界面

选择感兴趣的文献导出

f18

图18 HistCite 开启 “Mark & Tag”

首先,Tools -- Mark & Tag(图18),然后界面会有一些变化,出现了一个 Marking and Tagging Tool 工具条,并且每篇文献前面多了一个小方框可以勾选(图19)。

f19

图19 HistCite “Marking and Tagging Tool”界面

勾选上感兴趣的文献,然后点击右边的 Mark 按钮进行标记。界面上方会出现一个 “Marks” 链接(图20)。把所有要导入 Endnote 的文献,全部标记,然后点击此 Marks 链接,可显示全部被标记的 23 篇文献的列表(图20)。

f20

图20 HistCite 的 Marks 列表

然后,File -- Export -- Records (图21),将标记文献导出至一个 hci 文件。

f21

图21 从 HistCite 导出被标记的文献

将文献导入至 Endnote

首先,把导出的 hci 文件的后缀改成 txt,然后打开 Endnote,File -- Import -- File(图22)。

f22

图22 Endnote 导入文献选项

在弹出的对话框中,选择导入的文件,Import Option 选择 “Multi-Filter (Special)” (图23),这样可以保留文献的 DOI 信息,方便后续自动下载文献。

f23

图23 Endnote 导入文献对话框

在 Endnote 界面,可以看到已经成功导入全部 23 篇文献,并且 Endnote 立刻开始自动查找,并下载文献全文,短短几分钟已经找到了 17 篇(图24)。

f24

图24 Endnote 自动下载文献全文

结语

HistCite 作为文献分析工具,其功能非常强大,本文并未全部介绍,比如可以查看文献的逐年引用率,有些文献早期被引用很多,但是近期无人引用,说明热点已经过去,而有些文献早期无人引用,但是近期却很火爆,等等。感兴趣可以自行摸索,软件使用非常简单。

我使用 HistCite 已经有2-3年,但是使用频率并不高,因为我也不经常去调研陌生的研究领域,而对于自己熟悉的领域,则不必用 HistCite 。尽管如此,每次使用的时候,我都非常有收获。 HistCite 就像是地图,游览熟悉的城市,我们不需要地图。但是游览陌生的城市,地图在手无疑事半功倍。哪些是不容错过的景点?各个景点之间的路线如何联通?节省时间倒还是次要的,重要的是地图能够帮助我们从整体上、从全局上去理解一个陌生城市。

也许很多科研工作者还没有听说这个实用工具,特此分享。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/445526.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

数据结构课上笔记7

介绍栈和队列基本概念和用法。 设输入序列1、2、3、4,则下述序列中( )不可能是出栈序列。【中科院中国科技大学2005】 A. 1、2、3、4 B. 4、 3、2、1 C. 1、3、4、2 D.4、1、2、3 选…

ROC曲线与AUC值

ROC曲线与AUC值 1.概述AUC(Area Under roc Curve)是一种用来度量分类模型好坏的一个标准。这样的标准其实有很多,例如:大约10年前在machine learning文献中一统天下的标准:分类精度;在信息检索(IR)领域中常…

设置SSH免密码自动登录(使用别名)

每次登录服务器都要写一大串的用户名(username服务器地址)和登录密码十分的繁琐,所以本文就告诉大家如何通过修改配置文件,达到只需要输入:ssh jack(你起的别名)就可以一键登录到服务器中。 1.创建公钥(相当…

串的定长表示

思想和代码都不难&#xff0c;和线性表也差不多&#xff0c;串本来就是数据受限的线性表。 串连接&#xff1a; #include <stdio.h> #include <string.h> //串的定长顺序存储表示 #define MAXSTRLEN 255 //用户可在255以内定义最大串长 typedef unsigned cha…

轻松理解牛顿迭代法且用其求平方根

牛顿迭代法概述 牛顿迭代法&#xff08;Newton’s method&#xff09;又称为牛顿-拉弗森方法&#xff08;Newton-Raphson method&#xff09;&#xff0c;它是牛顿在17世纪提出的一种在实数域和复数域上近似求解方程的方法。 牛顿迭代公式 设rrr是f(x)0f(x)0f(x)0的根&#…

如何使用cookie信息,完成自动登录

在做爬虫任务的时候&#xff0c;我们常常会遇到很多网页必须登录后&#xff0c;才可以开放某些页面。所以登录是爬取网页的第一步。但是&#xff0c;通过post表单&#xff08;包含用户名和密码&#xff09;的方法&#xff0c;对于那些不需要输入比较复杂的验证码的网页&#xf…

Spring Cloud 学习笔记(1 / 3)

Spring Cloud 学习笔记&#xff08;2 / 3&#xff09; Spring Cloud 学习笔记&#xff08;3 / 3&#xff09; ---01_前言闲聊和课程说明02_零基础微服务架构理论入门03_第二季Boot和Cloud版本选型04_Cloud组件停更说明05_父工程Project空间新建06_父工程pom文件07_复习Depend…

后缀树/后缀数组

字典树&#xff1a;https://blog.csdn.net/hebtu666/article/details/83141560 后缀树&#xff1a;后缀树&#xff0c;就是把一串字符的所有后缀保存并且压缩的字典树。 相对于字典树来说&#xff0c;后缀树并不是针对大量字符串的&#xff0c;而是针对一个或几个字符串来解决…

kaggle(02)-房价预测案例(基础版)

房价预测案例 Step 1: 检视源数据集 import numpy as np import pandas as pd读入数据 一般来说源数据的index那一栏没什么用&#xff0c;我们可以用来作为我们pandas dataframe的index。这样之后要是检索起来也省事儿。 有人的地方就有鄙视链。跟知乎一样。Kaggle的也是个处…

如何使用github中的pull request功能?

* pull request是社会化编程的象征&#xff0c;通过这个功能&#xff0c;你可以参与到别人开发的项目中&#xff0c;并做出自己的贡献。pull request是自己修改源代码后&#xff0c;请求对方仓库采纳的一种行为*–《github入门与实践》 下面具体说一下github中使用pull reque…

「假装努力」

有多少人在「假装努力」&#xff1f; 又有多少人在「真正成长」&#xff1f; 再努力努力 回想起当年毕业后&#xff0c;在北京和室友合租的日子。 那时&#xff0c;我在工作&#xff0c;室友在培训。 一天&#xff0c;我下班回来&#xff0c;听见他在电话里和家人争吵&…

如何阅读论文?

本文主要讲述了如何才能高效的阅读一篇论文&#xff01;&#xff01;

数据结构课上笔记8

串的概念&#xff1a;串&#xff08;字符串&#xff09;&#xff1a;是由 0 个或多个字符组成的有限序列。 通常记为&#xff1a;s ‘ a1 a2 a3 … ai …an ’ ( n≥0 )。 串的逻辑结构和线性表极为相似。 一些串的类型&#xff1a; 空串&#xff1a;不含任何字符的串&#x…

Numpy 入门

Numpy 入门 Numpy简介 官网链接&#xff1a;http://www.numpy.org/NumPy是Python语言的一个扩充程序库。支持高级大量的维度数组与矩阵运算&#xff0c;此外也针对数组运算提供大量的数学函数库 Numpy的基本功能 快速高效的多维数组对象ndarray用于对数组执行元素级计算以…

数据结构课上笔记10

树 树的定义&#xff1a;树(Tree)是 n(n≥0)个结点的有限集。若 n0&#xff0c;称为空树&#xff1b;若 n > 0&#xff0c;则它满足如下两个条件&#xff1a; (1) 有且仅有一个特定的称为根 (Root) 的结点&#xff1b; (2) 其余结点可分为 m (m≥0) 个互不相交的有限…

pandasStudyNoteBook

pandas 入门培训 pandas简介 - 官网链接&#xff1a;http://pandas.pydata.org/ - pandas pannel data data analysis - Pandas是python的一个数据分析包 , Pandas最初被作为金融数据分析工具而开发出来&#xff0c;因此&#xff0c;pandas为时间序列分析提供了很好的支持 …

二叉树最长路径

分析&#xff1a; 暴力求每一段距离也可。 对于以本节点为根的二叉树&#xff0c;最远距离有三种可能&#xff1a; 1&#xff09;最远路径来自左子树 2 &#xff09;最远路径来自右子树&#xff08;图示与左子树同理&#xff09; 3&#xff09;最远路径为左右子树距离根最远…

判断完全二叉树

完全二叉树的定义: 一棵二叉树&#xff0c;除了最后一层之外都是完全填充的&#xff0c;并且最后一层的叶子结点都在左边。 https://baike.baidu.com/item/%E5%AE%8C%E5%85%A8%E4%BA%8C%E5%8F%89%E6%A0%91/7773232?fraladdin 百度定义 思路&#xff1a;层序遍历二叉树 如果…

判断二叉搜索树

二叉查找树&#xff08;Binary Search Tree&#xff09;&#xff0c;&#xff08;又&#xff1a;二叉搜索树&#xff0c;二叉排序树&#xff09;它或者是一棵空树&#xff0c;或者是具有下列性质的二叉树&#xff1a; 若它的左子树不空&#xff0c;则左子树上所有结点的值均小于…

剑指offer_01

文章目录[toc]第一章 面试流程1.1 面试官谈面试1.2 面试3种形式1.3 面试的3个环节第一章 面试流程 1.1 面试官谈面试 初级的程序员谈算法和数据结构&#xff0c;高级的程序员谈项目经验要对公司近况和项目情况了解不要紧张&#xff0c;不要马上上手写代码 1.2 面试3种形式 …