信息检索系统(Information Retrieval System)是指根据特定的信息需求而建立起来的一种有关信息搜集、加工、存储和检索的程序化系统.其主要目的是为人们提供
信息服务。所以可以说任何具有
信息存储与
信息检索功能的系统都可以称为信息检索系统.信息检索系统可以理解为一种可以向用户提供信息检索服务的系统。
发展
信息检索工具的发展从无到有,经历了手工、自动化、计算机检索、计算机网络检索这4个主要阶段。
1.手工阶段
所谓手工检索工具,信息载体基本上是以纸质为主,其工具本身是某类形式的印刷出版物,以手工进行查阅,从而得到所需的文献。这种方式经历了相当长的历史时期,大约有2 000多年的时间,虽然后期出现了缩微(胶片)型的检索工具,但基本上还是通过手工来完成检索任务手工检索工具种类繁多,功能也比较齐全,各种文摘、题录、书目、索引等都属于手工检索工具。到今天为止,手工检索工具还在发挥着很重要的作用。
2.自动化阶段
随着科学技术的发展,文献量随之增长,特别是到了20世纪三四十年代,自然科学的发展进入了一个前所未有的历史时期,老的学科得到了迅速发展,同时涌现出了很多新的学科,出版的刊物也随之大量增加,文献量急剧增长,依靠原有的手工检索方法往往要花去大量的时间,还不一定得到满意的检索效果。为了提高检索效率,人们开始利用光电技术、
机械技术,设计制造了检索工具。但这种检索工具还没有广泛地推开,就被计算机检索系统所代替了。在我国没有经历这一过程,就直接进入了计算机检索阶段,更确切地说是进入了计算机网络检索阶段。
3.计算机检索阶段
以计算机技术为主的现代信息技术的发展是计算机信息检索进步的基础。1946年第一台电子计算机诞生以后不久,就将其用于了信息检索,开创了现代信息检索的先河。自那以后,出现了一系列信息存储与检索的新理论和新方法,已经逐渐成为一门独立的科学分支。从单机批处理时期(20世纪50年代初至60年代中期),联机检索试用时期(60年代中期至70年代中期),一直到联机服务系统(70年代中期至80年代中期)。信息存储介质也从
磁带、
磁盘到
光盘,发生根本性的变化,其存储模式也从文件形式发展到以
数据库为核心。从系统结构来看,从脱机检索发展到联机检索,基本上是与计算机技术的发展相并行的。
早在20世纪50年代初期,
美国麻省理工学院的P.R.Bagley就开始利用计算机检索进行代码化文摘的可行性研究实验。1954年,美国马里兰州银泉海军军械试验室利用IBM701型电子计算机,将文献号和少量标引词存储在计算机中,进行相关性比较后输出检索结果——文献号,由此诞生了世界上第一个文献信息的自动化检索系统。由于当时的计算机尚处在
电子管时期,用于信息处理有很大的局限,因此无实用系统,而且是脱机检索。
20世纪50年代末到60年代初,由子第2代计算机(
半导体)的软硬件有了发展,文献处理与信息检索的性能增强,信息检索进入到实用化的脱机批处理阶段。1959年,美国的劳恩利用IBM 650型计算机建立了世界上第一个基于KWIC关键词索引的定题检索SDI系统。1961年,美国《化学文摘》社使用计算机编制《化学题录》(Chemical Title),并发行《化学题录》机读磁带版。自此以后,计算机信息存取在世界范围内正式进入到实际应用与生产型开发的新时期。1967年以后,美国《化学文摘》社整个系列的新出版物都通过机读数据库进行生产了。1963年,美国系统发展公司受国防部委托开始研制ORBIT计算机存取系统并获得成功。1964年,美国国家医学图书馆也开始使用计算机编制世界医学文献的检索刊物《医学索引》(Index Medics)并投入使用。
到了20世纪60年代后期,由于第3代
集成电路计算机的诞生与高密度
海量存储器硬磁盘及磁盘机的问世,以及数字通信技术和分组交换公用
数据通信网的普及,使计算机信息存取从脱机批处理进入到联机检索阶段。最早的联机信息存取系统是美国洛克希德(Lockheed)公司研究试验室研制的CONVERS系统,该系统经过不断试验与改进以后,于1966年改名为DIALOG,1967年开始为
NASA提供常规检索服务。
目标
狭义地讲,信息检索系统的目标是使特定的信息用户能够在特定的时间和地点、以特定的方式和方法获得特定的信息,从而满足其信息需求。换句话说,在用户给出查询后,信息检索系统的首要目标就是检索出可能对用户有用或相关的信息。广义地讲,信息检索系统的目标是将作者表达的思想与用户对该思想的需求进行匹配,即在信息创造者或生成者与该信息的用户之间建起桥梁。
职能
(1)存储职能。把有关信息的学科内容特征和外部特征著录下来,按一定次序排列组织起来,以便于查找各类信息资源。
(2)检索职能。提供一定的检索手段,使人们按照一定的检索方法,及时、准确、全面地查找出所需信息资源。
(3)报道职能。揭示某一时期、某一范围信息资源的发展状况。通过检索系统对信息资源的报道,了解学科的历史、现有水平和未来发展趋势。
分类
1、按照检索的功能划分.
可以分为书目检索系统和事实数据检索系统,书目检索系统主要是对某一研究课题的相关义献进行检索,其结果是获得一批相关文献的线索,其检索作业的对象是检索工具。事实数据检索系统用于各种事实或数据的检索.如查找某一词的解释,某人、某时间、某地名、某企业及其产品情况等.其结果是获得直接的、可供参考的答案。进行事实数据检索时.使用各种参考工具.如字典、
百科全书、
年鉴、
手册、
名录或者相应的
数据库。
2、 按照检索的手段划分
可以分为手工检索系统和计算机检索系统。手工检索系统是以手工方式存储和检索信息的系统。检索时使用各种纸质工具.检索入口少、速度慢、效率低。计算机检索系统是用
计算机进行信息存储和检索的系统,检索时使用各种数据库,检索灵活、检索入口多、速度快、效率高。由于计算机检索具有速度快、效率高、数据内容新、范围广、数量大、操作简便、检索时不受国家和地理位置的限制等特点,已成为人们获取信息的主要手段之一。
结构
1.物理结构
信息检索系统的物理结构是信息检索所用的硬件资源(如计算机、网络)、系统软件(如Windows系列软件)及信息资源集合(数据库)的总和。
2.逻辑结构
信息检索系统的逻辑结构指系统所包括的功能模块或子系统及其相互关系。包括信息资源选择与采集子系统、信息标引子系统、词表管理子系统、数据库创建与维护子系统、提问处理子系统和用户检索接口子系统。