“古籍数字化”是指利用
现代信息技术对古籍文献进行加工处理,使其转化为
电子数据形式,通过光盘、网络等介质保存和传播。古籍数字化是对古籍或古籍内容的再现和加工,属于古籍整理的范畴,是古籍整理的一部分。
我国古籍数字化经历了数据库版、光盘版、网络版三个建设阶段。数据库版古籍包括
书目数据库和全文数据库两种形式。光盘版古籍一般有图像版、全文版和图文版三种类型。网络版古籍主要是将数字化的古籍资源在网络上有偿或无偿发布,供互联网用户使用,这是目前古籍数字化的主要目标。
古籍的数字化最早是从计算机技术发达的美国开始的。20 世纪 70 年代末,OCLC 和RLIN 先后推出了《朱熹大学章句索引》、 《王阳明传习录索引》、《
戴震原善索引》等数据库。到 20 世纪 80 年代以后,中国的台湾、香港和大陆才相继开始了中文古籍数字化项目。
台湾地区从20世纪80年代开始研发大型古籍资源库。1984 年,台湾中央研究院开始的“史籍自动化计划”,计划开发《
二十五史(全文资料库)》全文数据库。后在其基础上逐渐增加《阮刻十三经注疏》等项目扩展成为包括多种经典古籍在内的“瀚典全文检索系统”。 1989 年,台湾中央研究院提出了“数字典藏计划”,古籍数字化包括善本古籍、金石拓片、古籍附图、台湾地方文献及期刊报纸等。1993 年,元智大学罗凤珠教授最早开发出“《
红楼梦》网络教学研究数据中心”、《
全唐诗》、《
全宋词》古籍资源库。其后,台湾汉学研究中心制作的“善本丛刊影像先导系统”、中华电子佛典协会的“在线藏经阁”都有一定的影响。
1989 年起,香港中文大学中国文化研究所开展有关中国传世典籍数据库的研究工作,中国文化研究所还正式成立“古文献数据库中心”(CHANT Center),并先后推出《先秦两汉古籍逐字索引丛刊》及《汉达古籍数据库检索系统》。
从 20 世纪 80 年代起,大陆地区开始出现了古籍数字化的工作,但是研究和成果少。直至进入 90 年代以后,随着我国计算机的普及网络技术的介入,才有了古籍数字化的雏形。90 年代中期以后,国家图书馆制订了一个庞大的古籍特藏文献数字化计划,如碑砧菁华、西夏碎金、敦煌遗珍、数字方志以及
甲骨文、
永乐大典等。
北京大学《中国基本古籍光盘库》,计划收录古籍1万种 。迪志文化出版有限公司、
上海人民出版社推出了
文渊阁《四库全书》全文检索版。书同文数字化技术有限公司推出了《
四部丛刊》的全文检索版。国学公司推出了《
国学宝典》等系列产品。截止 2004 年底,网上可见的中文古籍数据库约 70 多个。北京大学主持的 CALIS 项目及南京大学图书馆 CANAL项目古籍子项目已取得阶段性成果。