计算机基础知识的文献,四 计算机文献检索基础知识(原理、结构和功能)

a4c26d1e5885305701be709a3d33442f.png

1.计算机检索原理

计算机一方面接受用户的检索提问,一方面从数据库中读取文献记录,然后把两者进行比较,即检索提问标识与文献记录标识进行匹配运算,如果比较的结果一致,那么这篇文献就会作为命中文献在检索结果中显示,否则就是未命中文献。

a4c26d1e5885305701be709a3d33442f.png

2.文献数据库的结构

(1)文献数据库(Database):作为以某种方式将众多的文献信息存贮在计算机存贮设备上(如磁盘、光盘等)的数据结合,由于往往包含数以万计的文献记录,为便于选择检索,常被划分为若干个文档。如dialog联机检索的MEDLINE数据库被划分为若干个回溯文档(MED66、MED75、MED80、MED85、MED90)和现期文档 MED93.

(2)文档(File):是数据库一部分记录的集合,是由按一定方式排列的文献记录构成。

(3)记录(Record):是构成文献数据库的基本信息单元,每条记录描述一种(篇)文献的外表和内容特征,如文献篇名、作者、主题等。

(4)字段(Field):是构成记录中的数据项,如文献的篇名、作者、主题词等,分别成为篇名字段、作者字段、主题词字段等。字段可作为一个检索入口,所以又称之为可检字段。

3.计算机检索功能

3.1布尔逻辑检索功能

(Booleans)

布尔逻辑组配检索是现行计算机检索的基本技术,它利用布尔逻辑组配符表示两个检索词之间的逻辑关系,常用的组配符有:“ AND ”(和)、“ OR ”(或)、“ NOT ”(非)三种,其优先级依次为“ NOT ”、“ AND

”和“ OR

”;改变优先级的方法是使用括号“(

)”,括号内的逻辑式优先执行。为缩短检索式和醒目起见, Dialog 检索系统中“ AND ”、“ OR

”、“ NOT

”算符可分别用“ *

”、“+

”、“ – ”代替。

a4c26d1e5885305701be709a3d33442f.png逻辑与: 逻辑与也称逻辑乘,用关系词“ and

”或“ * ”表示。

A and B (或 A*B

)表示两个概念的交叉和限定关系,只有同时含有这两个概念的记录才算命中信息,见下图,阴影部分即为命中信息。使用“逻辑与”组配技术,将会缩小检索范围,增强检索的专指性,能够提高检索信息的查准率。

逻辑或: 逻辑或也称逻辑和,用关系词“ or

”或“ + ” 表示。

A or B (或 A+B

)表示两个概念的并列关系,记录中只要含有任何一个概念就算命中信息,即凡单独含有概念 A 或单独含有概念 B 或者同时含有 A 、 B

两个概念的信息均为命中信息,可用下图表示,阴影部分为命中信息。使用“逻辑或”组配技术,可扩大检索范围,能够提高检索信息的查全率。在检索中,可对与检索概念有关的同义词、近义词、相关词等用逻辑或来连接,以避免漏检。

逻辑非:

逻辑非也称逻辑差,用关系词“ not

”或“-” 表示。 A not B (或 A - B

)表示两个概念的排除关系,指记录中含有概念 A

而不含概念 B

的记录为命中信息,可用下图表示,阴影部分为命中信息。使用“逻辑非”组配技术,则剔除了不需要的概念,可提高检索信息的查准率,但这种方式也会排除掉相关信息,影响检索信息的查全率。

复合检索: 使用布尔逻辑组配检索词构成的检索式,逻辑算符 AND 、 OR

、 NOT

的运算次序在不同的检索系统中有不同的规定,往往在检索系统的“帮助”菜单中会有说明。布尔算符的优先执行顺序一般是:逻辑非、逻辑与、逻辑或,但用括号可以规定或改变其执行顺序,如下图所示,三个概念的信息集合中,阴影部分是逻辑表达式(

A and B )not C

的命中信息。三个逻辑算符和括号的配合使用,可将检索词组配成较为复杂的逻辑提问式,以满足复杂概念信息检索的需要。

3.2词位限定检索功能

(Proximity)

该技术主要是通过检索式中的专门符号来规定检索词在结果中的相对位置。布尔算符检索时,只对检索词进行逻辑组配,未限定检索词之间的位置及检索词在记录中的位置关系。在某些情况下,若不限制检索词之间的位置关系则会造成误检,影响查准率。例如检索“生物防治”的文献,若用检索式“biological*control”检索,则会将“抑制生物”(control

biological)的文献也查出来,这显然不是所需文献。因此,在大部分检索系统中设置了位置限定运算符号以确定检索词之间的位置关系,常用的相邻位置算符有(W)、(nW)、(N)、(nN),句子位置算符(S),字段算符(F)、(L)等。但在不同的检索系统所采用的位置运算符是不一样的,功能也有差异,使用时应具体对待。   下表为 Dialog 联机检索系统供的词位限定算符及相应功能

算符

用法

表示的检索含义

W

A(nW)B

A 、B 两词相隔 n 个单词且前后次序不变; n=0 时格式为 A()B 或 A(W)B

N

A(nN)B

A 、B 两词相隔 n 个单词且前后次序不限; n=0 时,格式为 A(N)B

L

A(L)B

A 、B 两词在同一主题词字段中,

A 为主题词, B 为其副主题词

S

A(S)B

A 、B

两词在同一子字段中,即同一语句或同一短语中,词序不限

F

A(F)B

A 、B 两词在同一字段中,字段不限,词序不限

3.3截词检索功能

(Wildcard)

在英语等西方语言中,常常有词语单、复数表示形式不同,英美拼写方式不同,词根相同、含义相近而词尾形式不同等情况,为使检索时不遗漏相关词,提高检索效率,一般信息检索系统都发展了截词技术,利用截词符来屏蔽未输入的字符。截词符根据检索系统的不同而不同,常用截词符有“?”、“ *

”、“ $

”、“!”等,截断方式也有后截、中截、前截等。

截词检索的方式有多种,按截词位置可分为前截词、后截词、前后截词和中间截词;按截断字符数的不同,可分为有限截断和无限截断。   前截词:

也称左截词或后方一致。截词符位于词干的前边,允许检索词的前端有若干变化形式,如 ?computer 可检索 computer 、 minicomputer 、 microcomputer 等结果。   后截词:

也称右截词或前方一致。截词符位于词干的后边,允许检索词尾部有若干变化。

如computer?可检索

computer 、 computers 、 computerize 、 computerized 、 computerization 等结果。   前后截词:

词干的前后各有一个截词符,允许检索词的前端和尾部各有若干变化形式。如 ?computer?可检索 computer 、 computers 、 computerize 、 computerized 、 computerization 、 minicomputer 、 minicomputers 、 microcomputer 、 microcomputers 等结果。   中间截词: 也称“通用字符检索法”,截词符作为通用字符位于检索词的中间,而词的前后方一致,凡前后方一致的词,都能检出,通常用在英美对某些词的不同拼写法。如:

defen*e 可同时检出

defence 和 defense 的结果。

截词检索技术能提高检索的查全率。不同数据库使用的截词符号也不同,如 DIALOG 系统用“?”,

BRS 系统用“ $”, ORBIT

系统用“ #

”等。网络信息检索工具中绝大多数都支持截词功能,有的是自动截词,有的是在一定条件下才能截词。在允许截词的检索工具中,一般是指右截词,部分支持中间截词,左截词比校罕见。

3.4短语检索功能(Phrase)

也称精确检索功能,常用“”表示。当把一个短语作为一个整体进行检索时,在短语的两端加上双引号。

如“gene express” 只能检出

gene

express的结果,而不会检出express

human gene、gene

constructs to express等结果。

3.5限定字段检索功能

(Field)

文献数据库的每条记录通常都由多个代表不同信息内容的字段组成,几乎所有机检系统中均设置了字段限定检索的功能,以满足用户特定检索某一字段信息的要求。限定字段检索即指定检索词在记录中出现的字段,检索时,计算机只对限定字段进行匹配运算,以提高检索效率和查准率。不同数据库和不同种类文献记录中所包含的字段数目不尽相同,字段名称也有区别。在一些网络数据库中,字段名称通常放置在下拉菜单中,用户可根据需要选择不同的检索字段进行检索。数据库中常见的字段和代码见下表。

基本字段

辅助字段

字段名称

英文全称

缩写

字段名称

英文全称

缩写

题目

Title

TI

记录号

Document Number

DN

文摘

Abstract

AB

作者

Author

AU

叙词

Descriptor

DE

作者单位

Corporate Source

CS

标题词

Identifier

ID

期刊名称

Journal

JN

出版年份

Publishing Year

PY

出版国

Country

CO

文献类型

Document Type

DT

文献性质

Treatment Code

TR

语种

Language

LA

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/282708.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C# 基于.NET6的CM+Fody+HC入门实战项目(经典)

概述上期我们概述了CMFodyHC,如果之前没有阅读,可以先了解下:C# 为什么说CMFodyHC是WPF开发的最强组合?今天基于最新的VS版本、最新的CM框架版本,.NET基于6.0,搭建了一个WPF入门学习项目实例,关…

Kong入门学习实践(2)实验环境搭建

【API网关】| 总结/Edison Zhou最近在学习Kong网关,因此根据老习惯,我会将我的学习过程记录下来,一来体系化整理,二来作为笔记供将来翻看。由于我司会直接使用Kong企业版,学习过程中我会使用Kong开源版。本篇&#xff…

我的未来计算机作文,我的未来作文(精选4篇)

我的未来作文(精选4篇)在平平淡淡的日常中,大家总免不了要接触或使用作文吧,作文根据体裁的不同可以分为记叙文、说明文、应用文、议论文。怎么写作文才能避免踩雷呢?以下是小编收集整理的我的未来作文,仅供参考,大家一…

RDS for MySQL Mysqldump常见问题及处理

2019独角兽企业重金招聘Python工程师标准>>> 摘要: RDS for MySQL Mysqldump 常见问题和处理 GTID 特性相关 避免表级锁等待 设置导出字符集 其他导出时需要注意的选项 举例 RDS for MySQL 不支持的选项 RDS for MySQL 逻辑备份 1. GTID 特性相关 MySQ…

《ASP.NET Core 6框架揭秘》实例演示[27]:ASP.NET Core 6 Minimal API的模拟实现

Minimal API仅仅是在基于IHost/IHostBuilder的服务承载系统上作了小小的封装而已,它利用WebApplication和WebApplicationBuilder这两个类型提供了更加简洁的API,同时提供了与现有API的兼容。[本文节选《ASP.NET Core 6框架揭秘》第17章]一、基础模型二、…

高性能Server---Reactor模型

无处不在的C/S架构 在这个充斥着云的时代,我们使用的软件可以说99%都是C/S架构的! 你发邮件用的Outlook,Foxmail等你看视频用的优酷,土豆等你写文档用的Office365,googleDoc,Evernote等你浏览网页用的IE,Chrome等(B/S是特殊的C/S)……C/S架构…

springmvc_3(将数据放入map中)

jsp页面 结果 转载于:https://www.cnblogs.com/mohehpc/p/6491376.html

聊聊策略模式

1、简介策略模式就是把各个平等的具体实现进行抽象、封装成为独立的算法类,然后通过上下文和具体的算法类来进行交互。各个策略算法都是平等的,地位是一样的,正是由于各个算法的平等性,所以它们才是可以相互替换的。虽然我们可以动…

张旭升20162329 2006-2007-2 《Java程序设计》第一周学习总结

20162329 2006-2007-2 《Java程序设计》第一周学习总结 教材学习内容总结 通过打书上的代码熟悉了Java编程的基本过程 教材学习中的问题和解决过程 1.因为我的虚拟机不可用所以我在Windows中安装了bash和git,但是由于Windows下bash中没有中文而且我英语又不是很好所…

《图解 HTTP》读书笔记(未完待续)

ARP 协议(Address Resolution Protocol)一种以解析地址的协议,根据通信双方的 IP 地址就可以查出对应的 MAC 地址。MAC( Media Access Control Address)地址是指网卡所属的固定的地址MIME,多部分对象集合&a…

.NET 实现启动时重定向程序运行路径及 Windows 服务运行模式部署

日常工作中有时候会遇到需要将程序直接在服务器上运行,而不依赖于 IIS 托管的情况,直接运行有两种方式,一种是部署为 服务模式,另一种则是 直接启动 .NET 发布之后的 exe 文件以 控制台模式运行,控制台模式运行主要问题…

Unexpected end of JSON input while parsing near错误解决方式(网上的方法)

原本是想创建一个create-react-app来着,但是在创建的中间会出现Unexpected end of JSON input while parsing near... 的错误。 在网上找到了一些方法,首先是清空npm的缓存。 npm cache clean --force 氮素,然并卵。near后面的内容变化了一下…

Xmemcached学习笔记一(安装memcached)

memcached有三种java客户端 第一种:Com.danga 包下面的memcached,需引入jar(本人用的是memcached-2.5.2.jar 文末附上附件需要的可以下载) 第二种:spyMemcached 第三种:XMemcached 据说第三种是使用最简单,最好用的&a…

WrapPanel 实现虚拟化

WrapPanel 实现虚拟化控件名:VirtualizingWrapPanel作者:WPFDevelopersOrg原文链接: https://github.com/WPFDevelopersOrg/WPFDevelopers框架使用大于等于.NET40;Visual Studio 2022;项目使用 MIT 开源许可协议;众…

如何证明 ConcurrentDictionary 字典操作不全是线程安全的

前言最近,看到一篇文章,讲到《ConcurrentDictionary字典操作竟然不全是线程安全的?》。首先,这个结论是正确的,但文中给出的一个证明例子,我觉得是有问题的。相关代码如下:using System.Collect…

16-djongo中间件学习

目录 前戏 我们在前面的课程中已经学会了给视图函数加装饰器来判断是用户是否登录,把没有登录的用户请求跳转到登录页面。我们通过给几个特定视图函数加装饰器实现了这个需求。但是以后添加的视图函数可能也需要加上装饰器,这样是不是稍微有点繁琐。 学完…

Eclipse控制项目的访问名称

Eclipse控制web项目的访问名称 web项目的访问路径(名称)修改 1.点击项目右键-》properties找到Context root 修改成我们需要的名字即可转载于:https://www.cnblogs.com/pypua/articles/7379950.html

计算机一级选择题已做完确认,计算机一级选择题(附答案)

点击蓝字关注我们(1)按照需求功能的不同,信息系统已形成各种层次,计算机应用于管理是开始于:()A)信息处理B)人事管理C)决策支持D)事务处理正确答案:A解析:计算机用于管理,起源于计算机在办公应用中对大量信息、数据的处…

参加51CTO培训,PMP考试通过啦

为什么选择考PMP?先介绍下自己的情况,毕业三年,单位类似于平台,不做技术,常态的工作是文案、商务、市场都会涉及些,对未来也有些迷茫。受前辈点拨可以学一些通用的技能,于是我选择了PMP&#xf…

非涉密计算机检查的通知,关于开展非涉密计算机及可移动存储介质专项清理活动的紧急通知...

关于在全校范围内开展非涉密计算机及可移动存储介质专项清理活动的紧急通知密办字[2009]01号各单位:为有效遏制木马病毒和恶意代码的蔓延趋势,现在校内开展一次非涉密计算机及可移动存储介质的专项清理活动,要求如下:1、所有涉密人…