排检法
组织方法
排检法是指对一定数量的文献或其他信息记录或文献实体按某一标识及规则进行排序,并按同一标识及规则进行查检的组织方法。排检法应用十分广泛,如检索工具的编制和检索系统的建立,工具书的编制,文献的排架,电话簿、电码本、字符集的编制,各种名单的编排,等等。常用的排检法有分类排检法、字顺排检法、号码排检法、时序排检法、地序排检法等。派生索引法 利用已有的目录、索引,选编专题目录、索引的方法。
汉字排检法简介
汉字单字或词组进行排序,以便查检的方法。又称汉字检字法。汉字排检法除用于词典百科全书等工具书的编排外,还普遍用于字顺目录、索引以及文书档案中各种名称等的排序。在印刷排版、电子计算机汉字信息处理等方面也具有重要作用。
中国汉代以前尚未出现正规的检字法。当时的字书均按汉字的意义排列。东汉许慎编著的《说文解字》首创部首检字法。梁代顾野王《玉篇》,辽代僧人行均编《龙龛手鉴》,北宋司马光等编《类编》,金代韩孝彦编《四声篇海》,明代梅膺祚《字汇》,先后对部首法进行了改进。直至清代 《康熙字典》 以及近现代《中华大字典》、《辞源》、《辞海》等都以部首法作为主要检字法。在部首查字法盛行时,人们又根据汉语的声韵调关系编列排检汉字,其中以三国魏李登的《声类》为最早,当时的声韵调都是用汉字来代替的。尔后又出现一种作为辅助部首检字法的笔画法,并在此基础上产生依汉字起笔分类,以及将笔画、笔形相结合的检字法。 近代西方文化输入中国后, 受西文字典及其排序方法的影响,曾出版了多种以罗马字拼音编制的字典。20世纪20~30年代新检字法蓬勃发展,先后出现了高梦旦的改良部首方案、林玉堂的汉字索引制、杜定友的汉字形位排检法。沈祖荣和胡庆生的12种笔画检字法、王云五的四角号码法等。据蒋一前《中国检字法沿革史略》统计,至1933年共有检字法77种。1958年以后,由于汉语拼音方案公布,遂产生多种汉语拼音排检法。1961年11月,由文化部、教育部、中国文字改革委员会、中国科学院语言研究所联合组成汉字查字法整理工作组,于1964年4月提出4种标准草案推荐使用,即改良部首查字法、四角号码查字法、 笔形查字法、 拼音字母查字法。80年代,汉字排检法研究与电子计算机技术相结合,已研制出各种汉字信息处理方法及汉字编码技术。汉字排检法已有数百种,但多数因使用不便而被淘汰;即使较为通用的几种也优劣并存,须在实践中不断完善。汉字排检法可分为 3种类型:义序排检法、形序排检法和音序排检法。
形序法
形序法又称形序排检法,是按汉字形体结构的某些共同特点进行排检汉字的方法,包括部首法、笔画法、笔形法等。
部首法
部首法实际上是对汉字偏旁的分类,即将相同偏旁的合体字归为一部,每部统属的字,列于该部之首的偏旁即为“部首”。再按部首笔画来排检汉字的一种查字法。部首溯源于许慎编《说文解字》,字体以小篆为准共列540个部首。随着汉字形体的改革与发展, 部首几经归并为214个,并经《康熙字典》采用后遂得通行, 故亦称为“康熙字典部首”。旧版《辞源》、《辞海》及《中华大字典》等辞书,都采用这种方法。解放后新编辞书对康熙字典部首又进行了多次改革。《新华字典》简化为189个,《现代汉语词典》减为188个。 《辞海(1979年版)》在214个部首的基础上进行删并、分立、 改立或新增加为250个部首。1982 年中国文字改革委员会和上海辞书出版社又将其重新调整为200个,并据此编成《汉语大字典》、《汉语大词典》。
部首法不仅用于编排字、词典正文,而且也广泛用来编排字词典的辅助索引和各种目录、索引等检索工具。如《现代汉语词典》、《四角号码新词典》等都分别为正文编有部首索引。利用部首来查检不辨音义的字词,务必掌握各辞书的定部原则。例如《康熙字典》、《说文解字》、《汉语大辞典》等的部首即“以义定部”的原则。更多地体现了汉字为表意体系文字特点,如六书中的象形、指事、会意、形声都是造字之法,从中可辨别本义。如象形之日、月;指事之上、下;形声之江、河;“信”从人、从言是为会意等。1979年版《辞海》则按“字形定部”。同是一个“相”字,以义归部定“目”部;以字形定部取“木”部。对各辞书的定部原则可通过其“编辑凡例”或“部首查字法查字说明”等来了解其具体方案。请参见本章附录:①《辞海部首查字法说明》;②《辞海部首笔形索引》;③《汉语大辞典部首总表》;④《汉语大辞典部首排检说明》。
笔画法、笔顺法
笔画法是按汉字笔画数之多少为序来排检汉字的查字法。这在工具书很多,诸如《中国人名大辞典》、《马克思主义辞典》、《室名别号索引》等等。其他一些工具书也编有笔画索引,如《辞海·经济分册》、《中国历代人名辞典》、《经济管理大辞典》以及《辞源》的《难检字表》等。
笔画法原理简单,使用却困难。这是由汉字笔画结构多种多样,书写体与印刷体笔画又多有不同,而且每一笔画下所包括的字数又很不平衡所决定的。如《辞海(1979年版)》在8—15 画下的笔画数内各含单字1000个以上,均给查字带来诸多不便。
笔顺法是按照汉字的笔形顺序排字的方法。汉字的基本笔形有点、横、坚、撇、捺、折(、— │'└ ),书写起笔只用(、—│')5种笔形。有的只用第一笔(起笔)笔形; 有的用各笔的顺序排列,而且笔顺也不一致。其中有用4 笔的,其笔顺即有“元亨利贞”(─、 '│)、“江山千古”(、│'─)和“寒来暑往”(、─│')的起笔顺序排的;《汉语大辞典》的《部首总表》及其条目单字的排列则采用“─│'、乙”为序。而《辞海(1979年版)》的《笔画查字表》却用“—│'、 ”的起笔笔形为序。
用部首法和笔画法、笔顺法编排的工具书各有优缺点。在使用前除需通读各工具书的有关编排说明外,还应充分利用其为正文所编的各种辅助索引,以弥补单一途径检索上的不足。
号码查字法
号码法是形体法的一种变形。它把汉字分解为各种笔形,并用阿拉伯数字作为代码,然后将其联成一组数字,再依数字大小为序排列汉字。这种方法的优点是忠码位置固定,检索快;缺点是笔形取号不易掌握。号码法有多种,其中使用最为广泛的有四角号码法,其他诸如中国字庋撷法、三角号码法等则使用甚少。
四角号码法
四角号码法是根据方块汉字的特点而发明的一种查字法。分别以不同代码代表汉字四个角的笔形并联成为四位数的号码,再依号码大小为序排列汉字即成为四角号码查字法。四角号码查字法,具有不论部首、不数笔画,不知读音也能见字知码和按号查字的特点。但其取号规则繁琐,笔形辨认不准取号也颇周折。
四角号码最初由王云五提出,称为“四角号码检字法”,1928年编成《四角号码学生字典》。1964年做了修改,改称“四角号码查字法”,亦称为“新四角号码法”。目前一些工具书或用新法或用旧法编排正文或辅助索引。诸如《四角号码新词典》、《现代汉语词典》的正文以及《中国丛书综录》第三册“子目书名索引”和“子目著者索引”即用新法编排;《辞源》的辅助索引则用旧法编排。
四角号码法把汉字笔形分为10种,分别用0到9作为代码。其口诀是:
横1 竖2 3点捺,叉4 插5 方框6;
7角 8八 9是小,点下有横变0头。
取号时,依汉字的左上角、右上角;左下角、右下角的顺序分别取其笔形代码并联成一组,即为该字的四角号码。为便于排列,对号码相同的字还要取第五角作为“附角”号码写于未位数的下方以示区别。如“经”字的号码为27112。新旧法对取角规则有所不同, 如“天”字旧号码为10430;新号码为10804。《四角号码新词典》、《现代汉语词典》等均附有“新旧四角号码对照表”可供参考。具体取角配号方法请参见本章附录:⑤《四角号码查字法》;⑥《新“四角号码查字法”和旧“四角号码检字法”比较,主要修改的项目》的影印件。
中国字庋撷法
中国字庋撷法,为原燕京大学引得编纂处于30年代为编制我国古籍索引时所采用的排检法。“庋撷”(guǐ xiè)二字意为放入取出。该法以“中国字庋撷”代表汉字的五种形体结构,并用Ⅰ—Ⅴ为代码;再拆“庋撷”二字的笔形分为10种,用0—9作为代码。其取号原理与四角号码法相似,但代码有别。如把“庋”字的笔画笔形分拆为“、— / 十 又”5种笔形,分别用“0、1、2、3、4”作为代码;把“撷”字的笔画笔形分拆为“才、纟、厂、目、八”5种笔形, 分别用“5、6、7、8、9”作为代码。 并根据该字的形体结构来定其取号先后次序。如“中”字体依次为左上、右下、左下、右下;“国”字体先为外部左上、右上,后为里面左上、右下;“字”字体先为上半部左上、右下,后为下半部左上、右下;“庋”字体先为左斜边的右上、左下,后为右下部的左上、右下;“撷”字体先为左半部的左上、右下;后为右半部的左上、右下。取得号码后,再算该字有几个方格,然后把方格数加在号码之后,无方格的加0,超过9个方格的仍为9。取号顺序及其号码组成为如下格式:依字体取得的号码/四角笔形号码、方格数的顺序。如“回”、“田”、“夕”三个字的号码分别为“Ⅱ/88881”、“Ⅱ/888304”、“Ⅰ/28220”。
这种排检法十分繁琐,不便推广使用。自从燕京大学引得编纂处以此法编成60多种古籍索引以后,为解决使用上的困难,近年部分影印出版这些引得时,都增加了四角号码检字和汉语拼音检字。亦可先利用笔画查出各字的庋撷号码后,再查索引正文。
起笔笔形代码法
这是起笔笔形法的号码化。它把汉字起笔笔形分为横、直、点、撇、角,并分别用“1、2、3、4、5”作为代码。 将书名每个字的起笔连成5位数的号码(超过5个字的书名也只取5个号码, 书名中有非汉字的则用0作为代码)。决定起笔的原则是先上后下, 先左后右;先外后内。这种检字法仅为《全国总书目》于1954年以前书名索引所采用。
音序排检法
音序排检法是按照字音及表示读音的音符顺序排列汉字的方法。包括汉语拼音字母排检法、注音字母排检法、韵部排检法等。其优点比较精确、简捷,缺点是不知读音就无法查字。日文工具书用《五十音图》音序排检法。
汉语拼音字母排检法
此法以《汉语拼音方案》的字母表顺序排列字头,同一字母的再逐一类比,定其先后,如《汉语主题词表》;同音字再按声调(阴平、阳平、上声、去声)排列。目前多数中文工具书和索引都采用汉语拼音字母排检法排列正文条目。如《现代汉语词典》、《新华字典》等。《中国大百科全书》的条目编排还辅以笔画笔形。
注音字母排检法
注音字母是由汉字偏旁改造而成的40个字母,其中分声母24个、韵母16个。它以北京语音为标准音,1958年前后出版的字(词)典大多数都以注音字母注明其读音,如《新华字典》1956年、1959年版和《同音字典》等。目前台湾省出版的工具书仍然采用。其方法是先声母、后韵母,同声同韵的字母按阴、阳、上、去四声的次序排列。
韵部排检法
韵部排检法也称“声韵法”,是我国古代按音韵排列汉字的一种方法。按韵部编排的字典称为“韵书”。我国在不同的历史时期有不同的韵部。宋代《广韵》分206个韵部;为《集韵》所沿用。 自宋以来流行的平水韵(《平水新刊礼部韵略》)将其删并为106韵, 从而成为文人作诗用韵的规范。一些主要工具书也按平水韵编排,如清代编的《佩文韵府》、《经籍纂诂》以及现代编的《辞通》等都按词目的未字分韵编排。《九史同姓名略》则按条目首字分韵编排。
利用韵部编排的工具书来查字词,可通过新印本所附的索引先查出该字的韵后,再按韵部去查。如新印本《佩文韵府》和《辞通》都编有首字四角号码和笔画索引。亦可先利用有关的字典查出该字的韵后,间接来查。
分类排检法
分类排检法,是按照知识或文献内容性质或学科体系等加以系统排检的方法。为古今中外检索工具书和参考工具书主要编排方法之一。如书目、索引、类书、政书、年鉴、手册等,既有按一定的分类体系单独编排的;也有与时序、地序排检法配合使用的。
按事物性质分类排检法
古代字书《尔雅》开 了按事物性质分类编排的先河。后来成为古代类书、政书的主要编纂体例;现代出版的一些手册、年鉴等也有采用这种方法进行编排。
古代类书、政书的列类是传统认知结构的产物。它以儒家文化为核心,沿用了《尔雅》所建立的“天、地、人、事、物”分类体系。对其所辑录的事、文编排次序,先列天地帝王、次为典章制度、后及其他事物的编序方法,无不反映了敬天尊君观念。例如《艺文类聚》列类42部以及《古今图书集成》设置的历象、明伦、理学、经济、博物6编31典,其类目均统属于天、地、人、事、物的框架之内。 由于人们认知事物的局限性,同在事物往往被分散于各类,而且类目概念模糊混乱。如《古今图书集成》的“经济汇编”、“方舆汇编”、“博物汇编”均摘有古代经济史料。这不仅类目概念与当代的认识存在极大的差别,而且同一性质的事物或文献也不能集中归类,都给检索造成诸多不便。这是需要注意的。
四部分类法
四部分类法是我国古代书目分类体系之一。它把古代图书分为经、史、子、集四大部类,每一大部类下再分为若干类、类下再分目。如四部书目分类体系的集大成者《四库全书总目提要》即在四部之下分为44类。当代所编的《中国丛书综录》第二册《子目分类目录》亦按经、史、子、集四部编排。《中国古籍善本书目》则分为经、史、子、集、丛书5部48类。
时序地序及其他
时序法
又称时序排列法。这是一种按时间先后次序编排文献资料的方法。年表、历表、大事记以及记载人物生平事迹的年谱等工具书,都采用这种编排方法。如《中国历史纪年表》、《中华人民共和国经济大事记(1949年10月—1984年9月)》以及《中国财政金融年表》等, 均严格以时间先后为序编排资料。只需按年索事,一查便得。个人生卒年表、年谱及其著述目录,或采用顺时序法或采用逆时序法进行编排。时序法便于理清事物发展的脉络,从中可查考某些带有规律性的知识记录。但利用按时序法编排的工具书如“生卒年表”或“年谱”来查考人物资料时,需要辅以人名索引才能使用。例如利用《历代人物年里碑传综表》,即先查人名字顺索引后查所需的人物事迹。
地序法
地序法是按照地理区域编排文献资料的方法。主要用于编制地图集、地方资料等工具书,以及各类图书中凡涉及世界各国和国内各地区的,也都采用地序法。如《中国名胜词典》、《中国地方志联合目录》、《中国边疆图籍录》和《欧洲金融年鉴》以及《中图法》等分类法中的《地区复分表》均按地序法编排有关资料。这些工具书多数附有地名索引,以便在不知地名所属地域时,按地名查找。此外,还有一些采用其他方法编排的工具书,如《历代职官表》(清)纪昀等编,上海古籍出版社1989年影印本。其所列的76个表即以清代官制为纲,逐级排列各政权机构的职官。所附官名索引,是按官名查检的工具书。
汉字编码法是供计算机信息处理用的方法。其中五笔字型即由查字法发展而来的一种汉字输入法。它根据汉字的字型结构,从中选定130个部首作为字根,加以分类、编码,并将其排在25个英文键位上。通过字根的组合,可以打出汉字或词组,从而达到见字知码、操作方便、快速输入的目的。五笔字型输入技术已在中内外得到广泛的推广和使用。
文献检索工具和参考工具书的排检方法是人们长期治学经验的总结,也是我们进行经济文献检索时务必掌握的一项基本技能。各种排检方法均有各自的优缺点。因此,一些工具书除以某种排检法为主排列正文外,往往又辅以其他排检方法。例如《辞海(1979年版)》就是综合运用各种排检法的典型。其正文为形序法:单字按部首;部首相同的单字数笔画;笔画相同的单字按起笔笔形;以外文字母和阿拉伯数字带头的词条则集中排在正文之后。书未附有《汉字拼音索引》收入《辞海》中的全部单字,从而增加了新的检索途径。
参考资料
最新修订时间:2024-08-21 23:36
目录
概述
汉字排检法简介
参考资料