计算机基础知识的文献,四 计算机文献检索基础知识(原理、结构和功能)

a4c26d1e5885305701be709a3d33442f.png

1.计算机检索原理

计算机一方面接受用户的检索提问,一方面从数据库中读取文献记录,然后把两者进行比较,即检索提问标识与文献记录标识进行匹配运算,如果比较的结果一致,那么这篇文献就会作为命中文献在检索结果中显示,否则就是未命中文献。

a4c26d1e5885305701be709a3d33442f.png

2.文献数据库的结构

(1)文献数据库(Database):作为以某种方式将众多的文献信息存贮在计算机存贮设备上(如磁盘、光盘等)的数据结合,由于往往包含数以万计的文献记录,为便于选择检索,常被划分为若干个文档。如dialog联机检索的MEDLINE数据库被划分为若干个回溯文档(MED66、MED75、MED80、MED85、MED90)和现期文档 MED93.

(2)文档(File):是数据库一部分记录的集合,是由按一定方式排列的文献记录构成。

(3)记录(Record):是构成文献数据库的基本信息单元,每条记录描述一种(篇)文献的外表和内容特征,如文献篇名、作者、主题等。

(4)字段(Field):是构成记录中的数据项,如文献的篇名、作者、主题词等,分别成为篇名字段、作者字段、主题词字段等。字段可作为一个检索入口,所以又称之为可检字段。

3.计算机检索功能

3.1布尔逻辑检索功能

(Booleans)

布尔逻辑组配检索是现行计算机检索的基本技术,它利用布尔逻辑组配符表示两个检索词之间的逻辑关系,常用的组配符有:“ AND ”(和)、“ OR ”(或)、“ NOT ”(非)三种,其优先级依次为“ NOT ”、“ AND

”和“ OR

”;改变优先级的方法是使用括号“(

)”,括号内的逻辑式优先执行。为缩短检索式和醒目起见, Dialog 检索系统中“ AND ”、“ OR

”、“ NOT

”算符可分别用“ *

”、“+

”、“ – ”代替。

a4c26d1e5885305701be709a3d33442f.png逻辑与: 逻辑与也称逻辑乘,用关系词“ and

”或“ * ”表示。

A and B (或 A*B

)表示两个概念的交叉和限定关系,只有同时含有这两个概念的记录才算命中信息,见下图,阴影部分即为命中信息。使用“逻辑与”组配技术,将会缩小检索范围,增强检索的专指性,能够提高检索信息的查准率。

逻辑或: 逻辑或也称逻辑和,用关系词“ or

”或“ + ” 表示。

A or B (或 A+B

)表示两个概念的并列关系,记录中只要含有任何一个概念就算命中信息,即凡单独含有概念 A 或单独含有概念 B 或者同时含有 A 、 B

两个概念的信息均为命中信息,可用下图表示,阴影部分为命中信息。使用“逻辑或”组配技术,可扩大检索范围,能够提高检索信息的查全率。在检索中,可对与检索概念有关的同义词、近义词、相关词等用逻辑或来连接,以避免漏检。

逻辑非:

逻辑非也称逻辑差,用关系词“ not

”或“-” 表示。 A not B (或 A - B

)表示两个概念的排除关系,指记录中含有概念 A

而不含概念 B

的记录为命中信息,可用下图表示,阴影部分为命中信息。使用“逻辑非”组配技术,则剔除了不需要的概念,可提高检索信息的查准率,但这种方式也会排除掉相关信息,影响检索信息的查全率。

复合检索: 使用布尔逻辑组配检索词构成的检索式,逻辑算符 AND 、 OR

、 NOT

的运算次序在不同的检索系统中有不同的规定,往往在检索系统的“帮助”菜单中会有说明。布尔算符的优先执行顺序一般是:逻辑非、逻辑与、逻辑或,但用括号可以规定或改变其执行顺序,如下图所示,三个概念的信息集合中,阴影部分是逻辑表达式(

A and B )not C

的命中信息。三个逻辑算符和括号的配合使用,可将检索词组配成较为复杂的逻辑提问式,以满足复杂概念信息检索的需要。

3.2词位限定检索功能

(Proximity)

该技术主要是通过检索式中的专门符号来规定检索词在结果中的相对位置。布尔算符检索时,只对检索词进行逻辑组配,未限定检索词之间的位置及检索词在记录中的位置关系。在某些情况下,若不限制检索词之间的位置关系则会造成误检,影响查准率。例如检索“生物防治”的文献,若用检索式“biological*control”检索,则会将“抑制生物”(control

biological)的文献也查出来,这显然不是所需文献。因此,在大部分检索系统中设置了位置限定运算符号以确定检索词之间的位置关系,常用的相邻位置算符有(W)、(nW)、(N)、(nN),句子位置算符(S),字段算符(F)、(L)等。但在不同的检索系统所采用的位置运算符是不一样的,功能也有差异,使用时应具体对待。   下表为 Dialog 联机检索系统供的词位限定算符及相应功能

算符

用法

表示的检索含义

W

A(nW)B

A 、B 两词相隔 n 个单词且前后次序不变; n=0 时格式为 A()B 或 A(W)B

N

A(nN)B

A 、B 两词相隔 n 个单词且前后次序不限; n=0 时,格式为 A(N)B

L

A(L)B

A 、B 两词在同一主题词字段中,

A 为主题词, B 为其副主题词

S

A(S)B

A 、B

两词在同一子字段中,即同一语句或同一短语中,词序不限

F

A(F)B

A 、B 两词在同一字段中,字段不限,词序不限

3.3截词检索功能

(Wildcard)

在英语等西方语言中,常常有词语单、复数表示形式不同,英美拼写方式不同,词根相同、含义相近而词尾形式不同等情况,为使检索时不遗漏相关词,提高检索效率,一般信息检索系统都发展了截词技术,利用截词符来屏蔽未输入的字符。截词符根据检索系统的不同而不同,常用截词符有“?”、“ *

”、“ $

”、“!”等,截断方式也有后截、中截、前截等。

截词检索的方式有多种,按截词位置可分为前截词、后截词、前后截词和中间截词;按截断字符数的不同,可分为有限截断和无限截断。   前截词:

也称左截词或后方一致。截词符位于词干的前边,允许检索词的前端有若干变化形式,如 ?computer 可检索 computer 、 minicomputer 、 microcomputer 等结果。   后截词:

也称右截词或前方一致。截词符位于词干的后边,允许检索词尾部有若干变化。

如computer?可检索

computer 、 computers 、 computerize 、 computerized 、 computerization 等结果。   前后截词:

词干的前后各有一个截词符,允许检索词的前端和尾部各有若干变化形式。如 ?computer?可检索 computer 、 computers 、 computerize 、 computerized 、 computerization 、 minicomputer 、 minicomputers 、 microcomputer 、 microcomputers 等结果。   中间截词: 也称“通用字符检索法”,截词符作为通用字符位于检索词的中间,而词的前后方一致,凡前后方一致的词,都能检出,通常用在英美对某些词的不同拼写法。如:

defen*e 可同时检出

defence 和 defense 的结果。

截词检索技术能提高检索的查全率。不同数据库使用的截词符号也不同,如 DIALOG 系统用“?”,

BRS 系统用“ $”, ORBIT

系统用“ #

”等。网络信息检索工具中绝大多数都支持截词功能,有的是自动截词,有的是在一定条件下才能截词。在允许截词的检索工具中,一般是指右截词,部分支持中间截词,左截词比校罕见。

3.4短语检索功能(Phrase)

也称精确检索功能,常用“”表示。当把一个短语作为一个整体进行检索时,在短语的两端加上双引号。

如“gene express” 只能检出

gene

express的结果,而不会检出express

human gene、gene

constructs to express等结果。

3.5限定字段检索功能

(Field)

文献数据库的每条记录通常都由多个代表不同信息内容的字段组成,几乎所有机检系统中均设置了字段限定检索的功能,以满足用户特定检索某一字段信息的要求。限定字段检索即指定检索词在记录中出现的字段,检索时,计算机只对限定字段进行匹配运算,以提高检索效率和查准率。不同数据库和不同种类文献记录中所包含的字段数目不尽相同,字段名称也有区别。在一些网络数据库中,字段名称通常放置在下拉菜单中,用户可根据需要选择不同的检索字段进行检索。数据库中常见的字段和代码见下表。

基本字段

辅助字段

字段名称

英文全称

缩写

字段名称

英文全称

缩写

题目

Title

TI

记录号

Document Number

DN

文摘

Abstract

AB

作者

Author

AU

叙词

Descriptor

DE

作者单位

Corporate Source

CS

标题词

Identifier

ID

期刊名称

Journal

JN

出版年份

Publishing Year

PY

出版国

Country

CO

文献类型

Document Type

DT

文献性质

Treatment Code

TR

语种

Language

LA

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/282708.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

APP地推心得:可复制的APP地推方案

APP地推难?APP地推方案包含哪些?现在,不需要编程就能自己完成手机APP制作,而且还有大量的APP模板,可以直接套用。APP的制作资金技术大幅度降低,现在最大的问题就是怎么APP推广的问题。 在移动互联网的时代&…

【代码笔记】iOS-播放从网络上下载的语音

代码&#xff1a; ViewController.m #import "ViewController.h" //录音 #import <AVFoundation/AVFoundation.h>interface ViewController () {//播放器AVAudioPlayer *player; }endimplementation ViewController- (void)viewDidLoad {[super viewDidLoad];/…

C# 基于.NET6的CM+Fody+HC入门实战项目(经典)

概述上期我们概述了CMFodyHC&#xff0c;如果之前没有阅读&#xff0c;可以先了解下&#xff1a;C# 为什么说CMFodyHC是WPF开发的最强组合&#xff1f;今天基于最新的VS版本、最新的CM框架版本&#xff0c;.NET基于6.0&#xff0c;搭建了一个WPF入门学习项目实例&#xff0c;关…

PHP资源列表(转)

一个PHP资源列表&#xff0c;内容包括&#xff1a;库、框架、模板、安全、代码分析、日志、第三方库、配置工具、Web 工具、书籍、电子书、经典博文等等。 初始翻译信息来自&#xff1a;《推荐&#xff01;国外程序员整理的 PHP 资源大全》 该内容也可以在github的相关项目上浏…

当今 计算机已进入千家万户英语,学生英语教学论文,关于信息技术在大学英语教学中的应用探析相关参考文献资料-免费论文范文...

导读:这是一篇与学生英语教学论文范文相关的免费优秀学术论文范文资料,为你的论文写作提供参考。摘 要&#xff1a;随着经济全球化和信息化时代的到来,计算机技术已深入到社会的各个领域.以往大学中所使用的传统面授课教学模式已经跟不上信息时代的发展步伐,不能满足当今教学的…

POJ - 2187 Beauty Contest(最远点对)

http://poj.org/problem?id2187 题意 给n个坐标&#xff0c;求最远点对的距离平方值。 分析 模板题&#xff0c;旋转卡壳求求两点间距离平方的最大值。 #include<iostream> #include<cmath> #include<cstring> #include<queue> #include<vector>…

Kong入门学习实践(2)实验环境搭建

【API网关】| 总结/Edison Zhou最近在学习Kong网关&#xff0c;因此根据老习惯&#xff0c;我会将我的学习过程记录下来&#xff0c;一来体系化整理&#xff0c;二来作为笔记供将来翻看。由于我司会直接使用Kong企业版&#xff0c;学习过程中我会使用Kong开源版。本篇&#xff…

Mysql-索引的基础和类型

一、 索引的基础 索引类似于书籍的目录&#xff0c;要想找到一本书的某个特定主题&#xff0c;需要先查找书的目录&#xff0c;定位对应的页码。 存储引擎使用类似的方式进行数据查询&#xff0c;先去索引当中找到对应的值&#xff0c;然后根据匹配的索引找到对应的数据行 二…

ligerUI的列头合并代码片段

//列头合并 function onAfterShowData(data){//显示数据前触发此事件 console.log(123); var k 0; var tr $(.l-grid-body.l-grid-body1).find(table tr);//找到被冻结的列&#xff08;frozen&#xff09;,利用find方法找到所有的行 $.each($(tr)…

我的未来计算机作文,我的未来作文(精选4篇)

我的未来作文(精选4篇)在平平淡淡的日常中&#xff0c;大家总免不了要接触或使用作文吧&#xff0c;作文根据体裁的不同可以分为记叙文、说明文、应用文、议论文。怎么写作文才能避免踩雷呢&#xff1f;以下是小编收集整理的我的未来作文&#xff0c;仅供参考&#xff0c;大家一…

RDS for MySQL Mysqldump常见问题及处理

2019独角兽企业重金招聘Python工程师标准>>> 摘要&#xff1a; RDS for MySQL Mysqldump 常见问题和处理 GTID 特性相关 避免表级锁等待 设置导出字符集 其他导出时需要注意的选项 举例 RDS for MySQL 不支持的选项 RDS for MySQL 逻辑备份 1. GTID 特性相关 MySQ…

AI求解PDE

一、波动方程的PINN解法: Guo Y, Cao X, Liu B, et al. Solving partial differential equations using deep learning and physical constraints[J]. Applied Sciences, 2020, 10(17): 5917. 二、二维的Navier–Stokes方程组的PINN解法 矢量形式的不可压缩Navier-Stokes方程…

使用CADisplayLink实现UILabel动画特效

在开发时&#xff0c;我们有时候会遇到需要定时对UIView进行重绘的需求&#xff0c;进而让view产生不同的动画效果。 本文项目 效果图 初探 CADisplayLink 定时对View进行定时重绘可能会第一时间想到使用NSTimer&#xff0c;但是这样的动画实现起来是不流畅的&#xff0c;因为在…

《ASP.NET Core 6框架揭秘》实例演示[27]:ASP.NET Core 6 Minimal API的模拟实现

Minimal API仅仅是在基于IHost/IHostBuilder的服务承载系统上作了小小的封装而已&#xff0c;它利用WebApplication和WebApplicationBuilder这两个类型提供了更加简洁的API&#xff0c;同时提供了与现有API的兼容。[本文节选《ASP.NET Core 6框架揭秘》第17章]一、基础模型二、…

Mysql的关联查询语句

一 内连接( inner join&#xff09; 1、多表中同时符合某种条件的数据记录的集合 (取两表公共部分) 2、inner join 可以缩写成 join 例如: select * from A,B WHERE A.idB.id 或者 select * from A inner join B on A.idB.id 内连接分为三类:{ &#xff08;1&#xff0…

高性能Server---Reactor模型

无处不在的C/S架构 在这个充斥着云的时代,我们使用的软件可以说99%都是C/S架构的&#xff01; 你发邮件用的Outlook,Foxmail等你看视频用的优酷&#xff0c;土豆等你写文档用的Office365,googleDoc&#xff0c;Evernote等你浏览网页用的IE,Chrome等(B/S是特殊的C/S)……C/S架构…

计算机控制系统的试题,计算机控制系统练习题(1)

21. 给出多通道复用一个D/A转换器的原理示意图。 答&#xff1a;22. 什么是信号重构&#xff1f;答&#xff1a;把离散信号变为连续信号的过程&#xff0c;称为信号重构&#xff0c;它是采样的逆过程。23. 写出零阶保持器的传递函数&#xff0c;引入零阶保持器对系统开环传递函…

springmvc_3(将数据放入map中)

jsp页面 结果 转载于:https://www.cnblogs.com/mohehpc/p/6491376.html

怎样用原生js配合css的transition写个无缝滚动

之所以想要写原生js配合css转换的无缝滚动&#xff0c;是因为之前在简书上看到一哥们写的一篇文章&#xff0c;说是在网上找了一堆js配合css transition属性写的轮播插件&#xff0c;可惜没有无缝的效果&#xff0c;结果他用原生js重写了一个可以无缝滚动的。好吧&#xff0c;我…

聊聊策略模式

1、简介策略模式就是把各个平等的具体实现进行抽象、封装成为独立的算法类&#xff0c;然后通过上下文和具体的算法类来进行交互。各个策略算法都是平等的&#xff0c;地位是一样的&#xff0c;正是由于各个算法的平等性&#xff0c;所以它们才是可以相互替换的。虽然我们可以动…