汉字信息处理
计算机对汉字信息进行输入输出和加工处理的技术
汉字信息处理是计算机直接对汉字信息进行输入输出和加工处理的技术。
简介
计算机直接对汉字信息进行输入输出和加工处理的技术。汉字字种繁多,字型复杂,汉字的信息处理与通用的字母数字类信息处理有很大差异,突出表现在汉字输入输出技术和汉字处理系统的软件方面。但是,汉字信息在信息结构、交换、信息加工等方面与西文信息加工又存在共性。
因此,在汉字信息处理中多采用与西文信息处理兼容的途径,以便充分利用已取得的计算机信息处理技术资源。同时,汉字信息处理还包括研究适合汉字特点的操作系统和汉字计算机语言。
信息的加工和处理传统的二进制计算机所处理的字符数字类信息代码种类较少,一般一个字符的代码长度不超过7个二进制位,如ASCⅡ码、EBCD码等,它们代表的字符数不多于128~256个。而汉字字符种类多达数万。为利用传统的计算机技术处理汉字信息,将通用字符按一定规则组合,作为汉字的代码。最流行的作法是双字节代码表示法,如中国的汉字传输码国家标准(GB23121-80)和日本的国家标准(JIS6226)规定,均利用两个ASCⅡ码(不包括其中的控制码)表示一个汉字。因此,在汉字信息处理系统中,首要的问题是确定每个汉字同一组通用代码集合的对应关系。这样,在输入设备接收汉字信息后,即按对应关系将其转换为可由一般计算机处理的通用字符代码,然后再利用传统计算机的信息处理技术对这些代码信息的组合进行处理,如信息的比较、分类合并、检索、存储、传输和交换等。处理后的代码组合,再通过汉字输出设备,按照同样的对应关系转换为汉字字形库的相应序号,控制汉字输出设备将处理后的汉字信息直观地显示或打印出来。用于汉字信息加工处理的硬件与通用信息处理的计算机硬件类似或相同。其软件有对汉字信息进行处理的操作系统、汉字 BASIC语言、汉字FORTRAN语言、汉字COBOL语言、汉字文件系统和数据库,以及汉字的文本编辑、字处理、通信传输、事务处理等。
发展
汉字信息处理设备汉字信息处理设备从结构上可分为联机型和脱机(独立)型两种。联机型由汉字终端和主机组成。汉字终端完成汉字信息的输入,具备人-机汉字对话的功能。它将汉字按转换规则变成通用字符信息组合,送到主机内进行加工处理。主机一般采用通用计算机。在硬件方面与通用机无多少差别。在软件方面,采取的处理方法不同,方式上也有不同。一般采用代码转换方式或预编译方式,以解决汉字代码中出现的与原软件系统不兼容而造成的某些障碍。脱机型设备一般是一台独立的汉字微型计算机,它完成汉字的输入输出、存储和信息处理,汉字信息处理的原理和方法与联机型类同,只是汉字输入输出代码的转换和处理都在系统内部分层次完成。独立型汉字处理设备的典型代表是汉字个人计算机(即一种单用户使用的微型计算机)。在具有汉字处理功能的个人计算机上。增设一个高集成度的存储器,作为汉字字形库,使用点阵密度较高的打印输出设备,并配备可显示汉字的屏幕。这种系统具备一整套汉字处理软件,其成本和设备体积均与普通个人计算机相近。
汉字信息处理技术已在企业管理、机关事务处理、情报资料管理、军事指挥等方面得到应用。微电子技术的发展和硬件性能价格比的提高,使汉字信息处理的技术水平和实用程度越来越接近西文信息处理。凡是西文信息处理系统所具备的功能,如灵活的编辑、制表、各类计算机的语言、大型的数据库、网络交换等,汉字信息处理系统也已具备。其成本也与西文信息处理系统相接近。
参考资料
《计算机信息处理技术》.百度知道.2016-09-08
最新修订时间:2024-05-21 13:42
目录
概述
简介
参考资料