汉字,又称中文、中国字,别称方块字,是
汉语的记录符号,属于
表意文字的词素音节文字。世界上最古老的文字之一,已有6000年左右的历史。在形体上逐渐由图形变为笔画,象形变为象征,复杂变为简单;在造字原则上从表形、表意到形声。除极个别汉字外(如瓩、兛、兣、呎、嗧等),都是一个汉字一个音节。汉字是
中华优秀传统文化的重要载体。
汉字源流
汉字起源说
从仓颉造字的古老传说到公元前1000多年前
甲骨文的出现,历代中国学者一直致力于揭开汉字起源之谜。关于汉字起源的说法,历来各家有不同主张,其中比较有影响力的说法有:结绳说、
八卦说、
刻契说、
仓颉造字说、刻划说和图画说。
结绳说:在文字产生之前,古人们靠结绳记事、认事,此举起到了帮助人们记忆的作用。《
周易·系辞下》:“上古结绳而治,后世圣人易之以书契,百官以治,万民以察。”
汉代郑玄注:“结绳为约,事大,大结其绳;事小,小结其绳。”《
庄子·胠箧》篇云:“昔者容成氏、大庭氏、伯皇氏、中央氏、栗陆氏、骊畜氏、轩辕氏、
赫胥氏、尊卢氏、祝融氏、伏羲氏、神农氏,当是时也,民结绳而用之。”又如《
周易正义》引《虞郑九家义》: “古者无文字,其有约誓之事,事大大结其绳,事小小结其绳。结之多少,随物众寡;各执以相考,亦足以相治也。”
东汉以后,不少人把汉字起源附会于结绳。
八卦说:关于
八卦的起源说法并不统一,有摹象说、星象说、数说和
杨雄的“亥”为物之源说等等。《周易·系辞》云:“古者庖牺氏之王天下也,仰则观象于天,俯则观法于地,观鸟兽之文与地之宜,近取诸身,远取诸物,于是始作八卦,以通
神明之德,以类万物之情。”这段话提到八卦源自庖牺氏对自然
客观世界的摹象,这与“依类象形”而作的汉字的起源是相似的。孔安国《
尚书》序(属伪作,但年代甚古)里说:“古者庖牺氏之王天下也,始画八卦,造
书契,以代结绳之政,由是文籍生焉。”把八卦和书契(文字)的作用相提并论,把汉字的起源与八卦联系起来。
仓颉造字说:相传
仓颉是
黄帝时期的
史官,汉字的创造者。黄帝是古代中原部落联盟的领袖,由于社会进入较大规模的部落联盟阶段,联盟之间外交事务日益频繁,故迫切需要建立一套各盟联共享的交际符号,于是搜集及整理共享文字的工作便交在史官仓颉的手上了。
“仓颉造字说”在
战国时即已流行。《
吕氏春秋·君守》说:“
仓颉作书,
后稷作稼。”到了秦汉时代,这种传说更加盛行。
汉许慎《说文解字序》:“
黄帝之史仓颉,见鸟兽
蹄迒之迹,知分理之可相别异也,初造书契。”和“仓颉之初作书,盖依类象形,故谓之文。其后形声相益,即谓之字。文者,物象之本;字者,言孳乳而寖多也。”现代学者认为,成系统的文字工具不可能完全由一个人创造出来,仓颉如果确有其人,应该是文字整理者或颁布者。
刻契说:刻契是古人在结绳记事后又一种帮助记忆的实物记事法,多作契约用,比结绳记事进步多了。所谓“刻契”就是在木条上或竹条上刻上刻痕。《
释名·释
书契》:“契,刻也,刻识其数也。”《周易·系辞》郑玄注:“书之于木,刻其侧为契,各持其一,后以相符合。”郑玄又在《
周礼·质人》注里说:“书契,取予
市物之券也。其券之象书两札,刻其侧。”《
列子·说符篇》:“宋人有游于道,得人遗契者,归而藏之,密数其齿。”所说的“齿”即是
质契上所刻的齿痕。这种刻契具有记事记数的作用,可以作为
契约的凭证,也可以用来传递信息。刻契的一些符号与某些汉字形体相似。如“一、二、三、
亖、𠄡”与汉字数字“一、二、三、四、五”的古文字别无二致。宋末元初
戴侗提出“书始于契,契以记数”而“各如其数”,认为“刻识其数”的契刻是原始文字的一个源头。
刻划说:
郭沫若先生立足于
半坡陶符与
殷商甲骨文的比较考察,认为早期的文字可以从结构上分为“刻划”和“图画”两大系统,“刻划系统是结绳、契木的演进,为数不多,这一系统应该在图形系统之前”。从半坡发现的刻划符号来看,有的是数字,有的是单字。许多现代学者认为它已有固定的音形义,当为汉字之源头。
郑州大学博士生导师
王蕴智认为:中国最早的刻划符号出土在河南舞阳
贾湖遗址,距今已有8000多年的历史。 对这些原始材料做一番全面的整理,从而爬梳排比出商代文字之前汉字发生、发展的一些头绪。 然而情况并不那么简单,除了已有
郑州商城遗址、
小双桥遗址(该遗址先后发现10余例商代早期
朱书陶文)的小宗材料可以直接和殷墟文字相比序之外,其它商以前的符号则零星分散,彼此缺环较多,大多数符号且与商代文字构形不合。还有一些符号地域色彩较重、背景复杂。
据悉,从考古发掘的出土文字资料来看,中国至少在
虞夏时期已经有了正式的文字,如考古工作者曾经在
山西襄汾陶寺遗址所出的一件扁陶壶上,发现有毛笔朱书的“文”字。这些符号都属于早期文字系统中的基本构形,可惜这样的出土文字信息迄今仍然稀少。大约在距今六千年的半坡遗址等
仰韶文化遗址的陶器外壁,已经出现刻划符号,共达五十多种。它们整齐规划,并有一定规律性,具备简单文字的特征,可能是我国文字的萌芽。
图画说:关于汉字的起源,历史上曾盛行“河图洛书说”。《
周易·系辞上》:“河出图,洛出书,圣人则之。”《
竹书纪年》指出:“黄帝轩辕五十年秋七月庚申,凤鸟至,帝祭于洛水”沈约注:“龙图出河,龟书出洛,赤文篆字,以授轩辕。”《河图·玉版》:“仓颉为帝,南巡狩,发阳虚之山,临于元扈洛之水,灵龟负书,丹甲青文,以授之。”部分近现代学者认为,汉字真正起源于原始图画。一些出土文物上刻划的图形,很可能与文字有渊源关系。汉字主要起源于记事的象形性图画,象形字是汉字体系得以形成和发展的基础。
沈兼士先生在1927年提出了汉字起源于记事的图画这一观点,认为在古汉字之前还有一个“文字画”的起源阶段。
沈兼士《从古器款识上推导六书以前之文字画》:“盖于
六书文字时期以前,应尚有一阶段,为六书文字之导源,今姑定名为‘文字画时期’”。文字画是向文字进化的记事性图画,具有亦画亦字的特点,初步具备了文字记录信息的可识性功能。关于记事
图画与记词文字的联系与区别,沈兼士先生讲得尤为精辟:“文字画为摹写事物之图象,而非代表言语之符号,虽为
象形字之母型,而不得径目为六书象形指事之文。”
在距今约四五千年的大汶口文化遗址晚期和良渚文化遗址的陶器上,发现有更整齐规则的图形刻划,是早期的
图形文字。
汉字演变
经历阶段
汉字主要起源于记事的象形性图画,象形字是汉字体系得以形成和发展的基础。后来的演变经历了几千年的漫长历程,经历了
甲骨文、
金文、
篆书、
隶书、
楷书、
草书、
行书等阶段,使用楷书,但仍未完全定型。
甲骨文
甲骨文主要指殷墟甲骨文,是中国商代后期(前14~前11世纪)王室用于占卜记事而刻(或写)在龟甲和兽骨上的文字。
发现有大约15万片甲骨,4500多个单字。这些甲骨文所记载的内容极为丰富,涉及到商代社会生活的诸多方面,不仅包括政治、军事、文化、社会习俗等内容,而且涉及天文、历法、医药等科学技术。从甲骨文已识别的约1500个单字来看,它已具备了“象形、会意、形声、指事、转注、假借”的造字方法,展现了中国文字的独特魅力。中国商代和西周早期(约公元前16~前10世纪)以龟甲、兽骨为载体的文献。
金文
金文是指铸刻青铜器上的文字,也叫
钟鼎文,始于殷商时期。商周是青铜器的时代,青铜器的礼器以鼎为代表,乐器以钟为代表,“钟鼎”是青铜器的代名词。所以,钟鼎文或金文就是指铸在或刻在青铜器上的铭文。
所谓青铜,就是铜和锡的合金。中国在夏代就已进入
青铜时代,铜的冶炼和铜器的制造十分发达。因为周以前把铜也叫金,所以铜器上的铭文就叫作“金文”或“吉金文字”;又因为这类铜器以钟鼎上的字数最多,所以过去又叫作“钟鼎文”。
金文应用的年代,上自商代的早期,下至秦灭六国,约1200多年。金文的字数,据
容庚《金文编》记载,共计3722个,其中可以识别的字有2420个。
铜器上的铭文,字数多少不等。所记内容也很不相同。其主要内容大多是颂扬祖先及王侯们的功绩,同时也记录重大历史事件。如著名的
毛公鼎有497个字,记事涉及面很宽,反映了当时的社会生活 。
大篆
大篆为汉字
书体的一种。相传为
周宣王时
史籀所作,故亦名籀文或
籀书。 秦时称为大篆,与小篆相区别。大篆起于
西周晚年,
春秋战国时期行于
秦国。字体与秦篆相近,但字形的构形多重叠。代表为今存的
石鼓文,以周宣王时的太史籀所书而得名。他在原有文字的基础上进行了改革,因刻于
石鼓上而得名,是流传最早的刻石文字,为石刻之祖。
小篆
小篆也叫“秦篆”。秦朝
李斯受命统一文字,这种文字就是小篆。通行于秦代。形体偏长,匀圆齐整,由大篆衍变而成。东汉许慎《说文解字·叙》称:“
秦始皇帝初兼天下……罢其不与
秦文合者。”李斯作《
仓颉篇》,中车府令
赵高作《爰历篇》,太史令胡毋敬作《博学篇》,“皆取史籀大篆,或颇省改,所谓小篆者也。”今存《
琅琊台刻石》、 《
泰山刻石》残石,即小篆代表作。
秦权上刻制的小篆,据说是李斯在秦始皇统一中国后,推行“书同文,
车同轨”,
统一度量衡的政策,由宰相李斯负责,在秦国原来使用的大篆
籀文的基础上,进行简化,取消其他六国的异体字,创制的统一文字汉字书写形式。一直在中国流行到西汉末年,才逐渐被隶书所取代。但由于其字体优美,始终被书法家所赞美。又因为其笔画复杂,形式奇古,而且可以随意添加曲折,印章刻制上,尤其是需要防伪的官方印章,一直采用篆书,直到封建王朝覆灭,近代新防伪技术出现。康熙字典上对所有的字还注有小篆写法。
隶书
隶书基本是由篆书演化来的,主要将篆书圆转的笔划改为方折,书写速度更快,在木简上用漆写字很难画出圆转的笔划。
隶书强化了汉字的记号功能,削弱了象形功能,对汉字的改变很大,成为古今文字的分水岭。隶书为后来的派生出
草书、
楷书、
行书奠定了基础。
隶书分
秦隶(
古隶)和
汉隶(
今隶)。隶书的出现,隶书是汉字中常见的一种庄重的字体,书写效果略微宽扁,横画长而直画短,讲究“
蚕头燕尾”、“一波三折”。
楷书
楷书又称
正书,或
真书,始于东汉。其特点是:形体方正,笔画平直,可作楷模,故名。
初期楷书仍残留极少的隶笔,结体略宽,横画长而直画短。在传世的魏晋帖中,如
锺繇的《
宣示表》、《
荐季直表》、
王羲之的《
乐毅论》《
黄庭经》等,可为代表作。观其特点,正如
翁方纲所说:“变隶书之波画,加以点啄挑,仍存古隶之横直”。
楷书到唐代发展到高峰,楷书的名家很多,如“
欧体”(唐·
欧阳询)、“虞体”(唐·
虞世南)、“
颜体”(唐·
颜真卿)、“
柳体”(唐·
柳公权)、“
赵体”(宋元·
赵孟頫)等。
楷书到了宋代,出现了“宋体”,现代印刷的宋体、黑体、仿宋等字体都属于“楷书”。
草书
草书是为书写便捷而产生的一种字体。始于汉初,当时通行的是草隶,即草率的隶书,后逐渐发展,形成一种具有艺术价值的章草。至汉末,相传张芝脱去了章草中保留的隶书笔画形迹,上下字之间的笔势,往往牵连相通,偏旁相互假借,成为今草,即一般所称草书,字的体势一笔而成。到唐代的
张旭、
怀素,宋代的
米芾将今草写得更加放纵,笔势连绵回绕,字形变化繁多,成为狂草。草书为书法家所常用。
章草笔划省变有章法可循。代表作如三国时期吴国皇象《急就章》的松江本。
今草不拘章法,笔势流畅。代表作如晋代王羲之《初月》、《得示》等帖。
狂草出现于唐代,以张旭、怀素为代表,笔势狂放不羁,成为完全脱离实用的艺术创作,从此草书只是书法家临摹的书法作品。代表作如张旭《肚痛帖》、怀素《自叙帖》。
行书
行书大约是在东汉末年产生的,是介于楷书、草书之间的一种字体,可以说是楷书的草化或草书的楷化。它是为了弥补楷书的书写速度太慢和草书的难于辨认而产生的。笔势不像草书那样潦草,也不要求楷书那样端正。楷法多于草法的叫“
行楷”。草法多于楷法的叫“
行草”。代表人物:“二王”:
王羲之,
王献之。
考古发现
中国考古界先后发布了一系列较
殷墟甲骨文更早、与文字起源有关的出土资料。
贾湖刻符经碳14物理测定,距今约7762年(±128年)历史;七千年前的
双墩刻符、六千年前的
半坡陶符、五千多年前
青墩遗址刻符、连字成句的
庄桥坟遗址文字、
大汶口陶尊符号、尧舜时代的
陶寺遗址朱文。早期的刻划符号与
骨刻文就是丰富的文字系统,后期的属于初步成熟阶段。这些考古发现可能是汉字起源的重要线索,也可能是各种文字发展的不同源流。
大约在距今六千年的半坡遗址等
仰韶文化遗址的陶器外壁,已经出现刻划符号,共达五十多种。它们整齐规划,并有一定规律性,具备简单文字的特征,可能是汉字的萌芽。
20世纪80年代初,在河南
登封夏文化遗址发掘出的陶器上,发现了更完备的文字。当时被学者们确认的迄今为止我国有确切时代的最早的文字。汉字知识
汉字是世界上最古老的文字之一,至少有数千年的历史,现存最早的原始文字是记事性图画和刻符,可识的成熟汉字系统是商代的
甲骨文。
汉字是表意文字,一个汉字通常表示汉语里的一个
词或一个
语素,这就形成了音、形、义统一的特点。汉字是由
笔画构成的方块状字,所以又叫方块字。如“车”“上”“明”等,“车”“上”“明”用字的形体来直接表达语言里的词义;“问”既能表意又能表音,“门”表音,“口”表意。
汉字由最原始的石刻字符在几千年的演变过程中形成了“
汉字七体”,即:
甲骨文、
金文、
篆书、
隶书、
草书、
楷书、
行书。
发现年代最早的成体系汉字是约公元前14世纪至前11世纪的
殷墟甲骨文,其使用主体是商王室贵族。与此同时,陕西
周原发现的先周甲骨文,在行款、用词上虽与殷墟略有差异,但文字上却属同一个系统。二者可能具有共同的源头,承继自龙山——
二里头文化遗产,其年代与文献中的夏和早商大致重合。汉字真正意义上的创制应该就在这一时期。文献上,《
尚书·多士》讲“惟殷先人,有册有典,殷革夏命”;《
国语·
晋语》也有“阳人有夏、商之嗣典”的记载;《
清华简·尹至》通过伊尹之口描绘夏桀“虐德,暴童,亡典。”可见,在周人的记忆里,夏代便已存在文字书写的典册。此外,甲骨文本身也透出不少信息。比如,甲骨文语序固定,语法结构、书写规则统一,已经是成熟的文字系统;甲骨文中不少象形字,如鬲、酉等更接近前甲骨文时代的考古遗存。这些线索都与文献中的“夏典”时代吻合。
传播
西周王朝建立后,“
封建亲戚,以藩屏周”的分封制成为重要的政治制度,周人分封的地理空间已相当辽阔:北至琉璃河
燕国,南至随州叶家山
曾国,东至山东
齐国,都出土过不少周初铜器,与商代相较,出土
金文的数量与地点都大为增加。值得注意的是,西周初年诸侯国青铜器形制大多与周
王畿相同,器形、纹饰、工艺上看不出明显差异,尤其是铭文书法,不少甚至可视为一人所书。可以看出,伴随着大分封,周人及其制度、文化实现了跨区域流动,汉字从中原四向流布,在中华大地上实现了一次大规模传播。
东周以降,“诸侯力政,不统于王”。春秋中期开始,东土列国文字开始变异,形体结构与书写风格都与西周文字渐行渐远。到战国时代,各国文字面貌出现了较大分化,形成了“言语异声,文字异形”的局面。这一方面是由于长期政治上不统一,各国文字逐渐萌生了各自的地域色彩;另一方面,随着社会发展、文字使用阶层扩大,新产生的俗写字、新造字等也往往只在各区系内通行。至战国中期,汉字基本形成
齐、
燕、
晋、
楚、
秦五系面貌。
秦的统一结束了
春秋以来的列国纷争,也同时终结了
分封制与
世卿世禄制的传统。“书同文”的政策“罢其不与秦文合者”,告别了
战国时代的“文字异形”。除了文字形体的统一,秦的文字政策也包括用字习惯的规范。湖南里耶出土的秦代更名木方,很可能移录自朝廷的诏令,从中可见秦代“书同文”的具体措施:正字用与正字形并重。大一统国家的形成是“书同文”政策在全国推行的保证;与此相应,统一的文字也推进了社会与思想的整合,有力保障了官僚科层制的有序展开,成为国家权威的象征。
数量
汉字的数量并没有准确数字,大约将近十万个,日常所使用的汉字只有几千字。据统计,1000个常用字能覆盖约92%的书面资料,2000字可覆盖98%以上,3000字则已到99%,简体与繁体的统计结果相差不大。
关于汉字的数量,根据古代的字书和词书的记载,可以看出其发展情况。
秦代的《
仓颉》、《
博学》、《爰历》三篇共有3300字;汉代
扬雄作《训纂篇》有5340字,到
许慎作《
说文解字》就有9353字了;据唐代
封演《闻见记·文字篇》所记,晋吕忱作《
字林》有12824字,
后魏杨承庆作《字统》有13734字,南朝时
顾野王所撰的《
玉篇》据记载共收16917字,在此基础上修订的《
大广益会玉篇》则据说有22726字;唐代孙强增字本《玉篇》有22561字。宋代
司马光修《
类篇》多至31319字,宋朝官修的《
集韵》中收字53525个,曾经是收字最多的一部书;1915年欧阳博存等编著的《
中华大字典》有48000多字;1959年日本诸桥辙次主编的《
大汉和辞典》有49964字;1971年
张其昀主编的《
中文大辞典》有49888字;1990年徐仲舒主编的《
汉语大字典》有54678字;1994年冷玉龙等编著的《
中华字海》有85000字。台湾地区教育主管机关编撰的《
异体字字典》第五版,内容含正字与异体字,共106230字,是收录较多汉字的字典。蓝德康和
松冈荣志主编的《汉字海》是至2020年世界上收录汉字最多的
工具书,正文收列字头单字102434个,附录收列字头单字11112个。
历史上出现过的汉字总数有8万多(也有6万多的说法),其中多数为
异体字和
罕用字。绝大多数异体字和罕用字已被规范掉,除古文之外一般只在人名、地名中偶尔出现。此外,继第一批简化字后,还有一批“
二简字”,已被废除,但仍有少数字在社会上流行。
如果学习和使用汉字真的需要掌握七八万个汉字的音形义的话,那汉字将是世界上没人能够也没人愿意学习和使用的文字了。但是《中华字海》一类字书里收录的汉字绝大部分是“死字”,也就是历史上存在过而书面语里已经废置不用的字。据统计,
十三经(《
易经》、《
尚书》、《
公羊传》、《
论语》、《
孟子》等13部典籍)全部字数为589283个字,其中不相同的单字字数为6544个字。因此,实际上人们日常使用的汉字不过六千多而已。
在汉字
计算机编码标准中,最大的
汉字编码是台湾地区的CNS11643,5.0版全字库可供查询的字共87,047个汉字、10771个拼音文字及894个符号。台港民间通用的
大五码收录繁体汉字13053个。GB18030是中华人民共和国现时最新的内码字集,GBK收录汉字简体、繁体及20912个,而早期的GB2312收录简体汉字6763个。Unicode的中日韩统一表意文字基本字集则收录汉字20902个,总数亦高达七万多字。
初期的汉字系统字数不足,很多事物以
通假字表示,使文字的表述存在较大歧义。为完善表述的明确性,汉字经历了逐步复杂、字数大量增加的阶段。汉字数量的过度增加又引发了汉字学习的困难,单一汉字能表示的意义有限,于是有许多单一的汉语意义是用汉语词语表示,例如常见的双字词。汉语书写的发展多朝向造新词而非造新字。
殷墟的甲骨文及更早、与汉字起源有关的出土资料,这些资料主要是指原始社会晚期及有史社会早期在陶器上面的刻画或彩绘符号,另外还包括少量的刻写在甲骨、玉器、石器等上面的符号,可以说,它们共同为解释汉字的起源提供了新的依据。
造字方法
汉字的造字法是古人根据汉字的结构和造字规律,归纳总结出来的造字方法。
汉字造字法有六种,又称“六书”---象形、指事、形声、会意、假借和转注。“六书”最早出现在《
周礼》,只是没有说明具体内容。东汉的许慎在《说文解字》一书中对“六书”的进行了完善,近现代的学者在《
说文解字》基础上进行了很多改进,有三书说、四书说等,但“六书”依然是被广泛认可的造字法。
象形:象形:描画事物的形象的造字法,如“日、月、山、水、人、木、火、口、目、田”等就是描绘其图案来造字,后来逐渐演化变成如今的造型。象形造字法是人类最本能的造字方法。
指事:在象形字的基础上加象征符号来造字,比如“刃(刀锋的那边加一点)、本(树根加一点)、甘(舌头加一点)、亦(由“大”张开手臂的人,胳肢窝下加两点,指胳肢窝)”。
用纯象征的符号造字也属于指事造字法,比如“一、二、三、五、七、十、上、下”,用纯象征符号造字就属于记号字。
形声:由表示意义的形旁和表示读音的声旁两部分组成的造字法。形旁是汉字对事物进行归类的表义部件,声旁表示该字的读音,比如:
左形右声:证、抖、城、构、伟;右形左声:战、励、刚、彰、瓴;上形下声:芳、岗、晨、笼、雾;
下形上声:想、熬、袋、劈、汞;外形内声:圆、厘、匪、闺、匈。
例如“鸠”字的形旁“鸟”;声旁“九”则只取其音,不取其义。
会意:是用两个或两个以上符号组成新字的造字法(不同于形旁和声旁组成的形声字),比如:
“日”和“月”组成“明”字;
“人”和“言”组成“信”字,表替人带话而不加改变为值得信赖;
“人”和“木”组成“休”,表示人在树下休息……
有些会意字是两个或几个同样的字重叠组成的。比如:
两个“人”组成“从”,三个“人”组成“众”;
两个“木”组成“林”,三个“木”组成“森”;
两个“口”组成“吕”,三个“口”组成“品”等。
假借:借用读音不同的字和形旁来组字的造字法,假借字和形声字关系密切,只是声旁的表音功能丧失了。比如:
兑dui---shuo说 tuo脱 yue悦阅
告gào---gù梏牿 hú鹄 jiào窖 kù酷
且qie---cu粗殂 ju跙沮狙疽龃雎 qu蛆 zu祖 阻组诅俎 zhu租助 zui咀
者zhe---du都赌堵睹 chu褚储 shu暑署 zhu猪诸煮箸渚著 tu屠 xv绪
占zhan---dian玷 nian拈鲇黏 zhen砧 tie贴帖
……
转注:字的意义发生变化而转作它用,其本义用另一个字来注解和代替。转注不是一种造字法,是与造字密切相关的用字法,转注字都是两字一对,比如:
其--箕:“其”本义是“簸箕”的象形,后来转做虚词,“其”的原始义用“箕”字代替;
斤--斧:“斤”原始义为“斧”,后来转做量词“斤”,原始义用“斧”字代替;
莫--暮:“莫”原始义是“暮-太阳落在草下”之会意,后来转做虚词,原始义用“暮”字代替;
要--腰:“要”原始义是“人体腰部”之象形,后来转做动词,原始义用“腰”字代替;
益--溢:“益”原始义是“水从皿中溢出”的会意,后转做益处之义,本义用“溢”字代替;
自--鼻:“自”原始义是“鼻子”之象形,后来转做代词或介词,原始义用“鼻”字代替。
……
总结以上六书——“象形”和“指事”是纯正的“造字法”,一般用于独体字;“形声”、“会意”和“假借”是“组字法”,一般用于合体字;转注是“用字法”。总而言之,以上原理是古代文字学学者们群策群力归纳出来的文字学理论,其所含的汉字构成法则,并非一人独创,是人们在使用过程中长期演化而成,是一代又一代集体智慧的结晶。
字形
汉字因形状方正,有“
方块字”的别称,从结构上来看,汉字有以下特色:
规整的字体(如
楷书、
宋体、隶书、篆书等)书写下的汉字是一种方块字,每个字占据同样的空间。汉字包括
独体字和
合体字,独体字不能分割,如“文”、“中”等;合体字由基础部件组合构成,占了汉字的90%以上。合体字的常见组合方式有:上下结构,如“笑”、“尖”;左右结构,如“词”、“科”;
半包围结构,如“同”、“趋”;全包围结构,如“团”、“回”;上中下结构,如“赢”;左中右结构,如“斑”;“品”字形结构,如“品”。汉字的基础部件包括独体字、
偏旁部首和其他不成字部件。
汉字的最小构成单位是笔画,笔画也具有一定的含义,如横画(一),可表示地平线(如旦字中的一横)等。
书写汉字时,笔画的走向和出现的先后次序,即“笔顺”,是比较固定的。基本规则是,先横后竖,先撇后捺,从上到下,从左到右,先外后内,先外后内再封口,先中间后两边。不同书写体汉字的笔顺可能有所差异。
从字体上分,可将各类汉字的字体分为三大类型。第一类是从宋代活字印刷发展起来的宋体、
黑体(包括粗、细
等线体)等;第二类是由书法演变而来的字体,如楷体、
仿宋体、行楷、
隶体、魏体、
舒体、颜体、瘦金体以及钢笔书写的字体等;第三类是属于美术字体,如综艺、美黑、琥珀、水柱等。其他字体多是属于以上三类字体的变异,例如:由宋体演变的大标宋、小标宋、报宋、长宋、中宋、
姚体等;由黑体演变而成的大黑、平黑、粗黑、等线体(包括粗、中、细等线体,后又演变出粗、准、细圆体)等;由楷体、仿宋体等演变而来的中楷和细仿宋等;由黑体和宋体演变而来的美黑;由隶体演变而来的隶变体等。
笔画最少的汉字只有一划。有的字在书面上没有,只在民间流传“biang”是笔画较多的汉字,有56笔,异体字共有45笔,繁体字共有59笔。“biangbiang面”是源于陕西的一种面,也是一家面馆的品牌,还在使用这个字,流传不广,2006方才流行,声称只能在康熙字典中查到“biang”字写法。事实上,在康熙字典中查不到“biang”字的写法。
关于biang,有一个字谜:
一点飞上天,黄河两道弯,八字大张口,言字往里走 。
东一扭,西一扭。左一长,右一长,中间坐了个马大王。
心字底,月字旁,打个勾勾挂麻糖,
推个车车逛咸阳。
日文汉字有一个字有84画之多,日语读作“たいと”(Tai-To),Unicode 1.13.0的中日韩统一表意文字扩展区G已收入此字,编码为3106C,是2020年已知笔画最多的汉字。
注音
汉字是汉语的书写文字,每个字代表一个音节。中国大陆现今以普通话作为标准读音,普通话的音节由一个声母、一个
韵母及声调确定,实际用到1300多个音节。由于汉字数目庞大,因而有明显的
同音字现象;同时还有同一字多音的情形,称为多音字。这一情况在汉语各种方言中是普遍存在的。
有学者经研究认为:汉朝之前,一个汉字发音为两个音节,次要音节和主要音节。由于汉字本身不表音,自汉朝到20世纪汉字在数量上、写法上虽有变迁,但无法看出发音的变化。必须进行专门的研究才能推测它们在
上古汉语和
中古汉语的发音。汉字在日语中的读音有“音读”和“训读”之分,往往一个字有很多读法,原因来自中国不同时期传入日本的发音。
在近现代,为了表示一些外国制单位曾广泛创造并使用
多音节汉字,如“
浬”(海里)、“
嗧”(加仑)、“
瓩”(千瓦)等。但是在大陆地区由于官方废除已基本不使用,台湾仍在使用,一般人也明了其意思。
最早的注音方法是读若法和直注法。读若法就是用音近的字来注音,许慎的《说文解字》就采用这种注音方法,如“埻,射臬也,读若准”。直注法就是用另一个汉字来表明这个汉字的读音,如“女为说己者容”中,使用“说者曰悦”来进行注音。
以上两种方法都有先天上不完善的地方,有些字没有同音字或是同音字过于冷僻,这就难以起到注音的作用,例如“袜音韈”等。
魏晋时期发展出了
反切法,据传是受使用拼音文字的
梵文影响。汉字的发音可以通过反切法进行标注,即用第一个字的声母和第二个字的韵母和声调合拼来注音,使得所有汉字发音都有可能组合出来。如“练,朗甸切”,即“练”的发音是“朗”的声母与“甸”的韵母及声调所拼成。
近代以来,又发展出了汉字形式的
注音符号以及很多拉丁字母注音方法。注音符号仍是台湾地区教学的一部分,中国大陆最为广泛使用的是
汉语拼音。
由于汉字以本身表意为主,注音方面较为薄弱。这个特性使得上下千年的文献,不至于产生如同使用拼音文字的西方一样,用字措辞太悬殊的差距,但也造成推断古代声韵的难度。例如“庞”从“龙”而得声,但
北京话前者读“páng”,后者为“lóng”。如何解释这样的差异,就是
音韵学所探讨的课题。需要注意的还有声调:阴平,阳平,上声,去声,轻声(元音āáǎàa ōóǒòo ēéěèe īíǐìi ūúǔùu ǖǘǚǜü)
词语
语素是汉文表意的最小单位,类比于英语的“词汇”和“词组”的总称。绝大多数汉字可以独立构成语素,比如“我”,类比于英语中的单一字母构成的词汇,比如“I”。
白话文大多数词语都是由两个以上的汉字构成的,不过,和英语中“词汇”和“字母”的关系不同,语素的意思往往和其中各个汉字独立构成语素时的意思有相关性,因此相当程度上简化了记忆。词语包括语素和若干个语素形成的短语。
汉字的高效率,几百个基本象形字,可以合成表示天上地下的各种事物的上万汉字;几千个常用字,又可以轻松组合出数十万词语。
偏旁
偏旁,汉字合体字的组成部分。旧称左为偏,右为旁。今泛称
合体字的左右上下任何一部分为偏旁。在汉字的结构中,偏旁是比
笔画大的构字部件,是构成汉字的基本单位。如“坡”中的“皮”是表示读音的偏旁,“土”是表意的偏旁。
辞典
中国古代称“
字书”,直到《
康熙字典》问世才称“字典”。最早的汉语字 典是东汉许慎编的《
说文解字》。近代大致可分为两类,一类是综合性的,如《
新华字典》;一类是专门性的,如《
异体字字典》。1915年,
中华书局出版了《
中华大字典》。
世界三大汉语词典分别是中国大陆的《
汉语大词典》(共13册,5.6万词条,37万单词)、中国台湾的《
中文大辞典》(共10册,5万词条,40万单词)以及日本的《
大汉和辞典》(共13册,4.9万词条,40万单词)。汉字是记录汉语的文字,它已有六千年左右的历史,是世界上最古老的文字之一。
“最中国”汉字“和”:
2008年北京奥运会开幕式上,几百名演员扮演的活字印刷字模通过不断变幻,用大篆、小篆、楷书三种不同字体展现了同一个汉字――“和”。这一幕让人津津乐道,而这个包含“和谐”“和平”“和睦”等意义的汉字,再度被评选为“最中国”的汉字。最新一期的《中华遗产》杂志发布了该社组织的“100个最具中华文化意义的汉字”评选结果。“和”字赢得了网上投票的最高票数,也获得了台湾“中央研究院”历史语言研究所研究员
李贞德等专家的大力推荐。
汉字特点
汉字是世界上最古老的文字之一,对周边的影响也是非常巨大的,是其它文字的母字。它是记录事件的书写符号。在形体上逐渐由图形变为由笔画构成的方块形符号,所以汉字一般也叫“方块字”。它由
象形文字(表形文字)演变成兼表音义的
意音文字,但总的体系仍属表意文字。所以,汉字具有集形象、声音和辞义三者于一体的特性。这一特性在世界文字中是独一无二的,因此它具有独特的魅力。汉字是汉民族几千年文化的瑰宝,也是我们终生的良师益友,每个人的精神家园。汉字往往可以引起我们美妙而大胆的联想,给人美的享受。
汉字更是民族灵魂的纽带,在异国他乡谋生,汉字便是一种寄托,哪怕是一块牌匾、一纸小条,上面的方块字会像磁铁般地吸引着你,让你感受到来自祖国的亲切。因为那中国人的情思已经浓缩为那最简单的横竖撇捺。每一笔,都是饱蘸着华夏碧血写就的。在海外,无论你功成名就还是漂泊沦丧,只要有方块字的伴随,你就会有几多慰藉几多寄托,因为无论是象形还是指事,无论是会意还是形声,每一个字都有深远的来历,每一个中国人就是那一撇一捺,已经成为方块字的魂魄。
几千年来,汉字与中华文明相辅相成,协同发展,互相成就。汉字不断,中华文明才会绵延不绝;中华民族生生不息,从根本上保障了汉字的持续和稳定。
相较拼音文字的优点
世界各国使用的文字分为两大类,即非拼音文字(汉字和水书)及拼音文字(其他文字)。当今世界上使用的文字中,汉字和
水书属于非拼音文字。
现今文字中,汉字是从商朝开始使用并演变。传说梵文字母是创造宇宙之神大梵天所创造并授予人类(《
大唐西域记》)其他文字很多都是借用四大字母系统的文字。婆罗米系列字母、
拉丁字母、
斯拉夫字母、
阿拉伯字母被称为世界四大字母体系。
印度、
尼泊尔、
孟加拉国、
缅甸、
老挝、
泰国、
柬埔寨、
中国西藏地区用婆罗米系列字母。英文、法文、意大利文等使用拉丁字母;俄文、保加利亚文、塞尔维亚文等使用基里尔字母(或斯拉夫字母),是
希腊字母改造而成的;拉丁字母也是希腊字母改造而形成的。阿拉伯字母的祖先——阿拉马字母(Aramaic)及希腊字母的祖先——
迦南(Canaanite)字母也不是他们祖先直接创造的,而是借用了小方闪米特人(Semites)的文字(小方闪米特字母)改造而成的。这种字母借用了
苏美尔人(Sume)的
楔形文字,并经过改造而成的。楔形文字是苏美尔人创造的,圣书文字是埃及人创造的,汉字是汉族先民创造的,
中国水族创造的水书,它们都不是拼音文字。四者之中只剩下汉字和水书,其他两者都已经消亡了。
汉语的另一个奇特之处是它的超方言特性及超语言特性。语言学家把中国各地的方言分为八大
方言区。有人说,如果没有汉字,中国早就分裂成几十个国家了。欧洲的意大利语、法语、西班牙语、葡萄牙语和罗马尼亚语之间的差别比中国方言的差距小得多,但是他们绝不愿意承认各自的语言是“
罗曼语”的不同方言,因为它们都是独立的国家。
汉字在世界历史上,作为其它后发明的文字的母字,如越南、朝鲜和日本都曾经用汉字来记录着它们的语言。日本人还使用汉字和
假名的混合文字,使用汉字,还有另一项重大发明,就是写中国字,读日本词。只要其他国家愿意,他们也可以这样做。如果真是这样做了,汉字就成为国际通用的语言符号了,就像
数学符号一样,只表意,不表音。
汉字是世界上使用人数最多的文字。据统计,使用汉字和汉语的人数达到16亿以上。
20世纪初叶,随着
西方文化的传入,有人认为,中国之所以落后,汉字是罪魁祸首,主张将汉字废掉。到了20世纪后半叶,计算机科学急剧发展,又有些人认为汉字阻碍了科学的发展,方块字无法输入电脑,又有一阵要废除汉字的鼓躁。后来,这方面的问题解决了,质疑声也随之消散。
汉字是2020年仍在使用的历史最悠久的文字。能看到而又能认读的最早的汉字是3000多年前的甲骨文。这已是相当成熟、相当系统的汉字了。世界上没有一种文字像汉字那样历尽沧桑,青春永驻。古埃及5000年前的圣书字是人类最早的文字之一。但它后来消亡了,有记载的古埃及文化也被深深地埋藏起来了。苏美尔人的
楔形文字也有5000年的历史。但在公元330年后,它也消亡了。历史上衰亡的著名文字还有
玛雅文、
婆罗米文等等。而汉字不但久盛不衰,独矗世界文字之林,还不断地得以发展,影响也越来越大。
1.优美
它已成为一种艺术——书法艺术。汉字的书法艺术是任何其它文字所无法相比的。 下列的古代书法作品已经成为无价之宝。著名的有
兰亭序、神策军纪圣功德碑、
玄秘塔碑、
祭侄稿等无数作品。
2.辨识度高
人类的眼睛视野总是一个面,而不是一条线,所以线性排列不易辨认;排成方块一目了然。拼音文字=
线形文字;汉字=方块文字。汉字比拼音文字有更高的
阅读效率。
3.易懂,具有关联性
例如,“被”是一个形声字兼会意字。如果从形声字的角度来看,“被”字左边的“衣”字旁表示意义,说明被子是属于衣物一类,右边的“皮”字在造字的时代和“被”的读音相似,表示这个字的读音,但是随着时间的推移,“皮”和“被”的读音变得不一样了,逐渐失去了它表读音的
功能。如果从会意字的角度来看,用皮做的衣物就是“被”。被的最初意义指的是一种小被子,到了后代,在被的本义基础上又引申出“蒙受”等意义。
请比较下面一组中英文的词:
⒋形象,直观达意
汉字是
象形文字,其显著的特点是字形和
字义的联系非常密切,具有明显的直观性和表意性。汉字的表意性使汉字成为世界上单位字符信息量最大的文字,因此容易辨识, 利于联想,这也为加快阅读速度带来极大的便利。
汉字有着区别于世界其他各种语言的根本特点,这就是汉语语法自身的特殊性即意合。无论是
词组合成
句子,还是
单句组合成
复句,首先考虑的因素往往是语意的配合,而不是
语法形式的使用,只要几个负载着重要信息的关键词语在意义上大致搭配得拢,就能言简意赅地达到交际目的,这几个词就可以组合在一起,这就是所谓的“意合”。汉语语法的这一特点,使它结构独特,灵活多变,颇多隐含,着重意念,其意合性、灵活性和简约性是其它语言所不能比拟的。汉语语法的上述特点,有利于我们在阅读中运用意会的方式来进行感知和理解,这对于加快阅读速度就有极大的便利。
5.信息量大
研究表明:汉字作为一个复杂的文字符号系统,其
信息熵很高。研究的基本方法是:逐渐扩大汉字容量,随着汉字容量增大,信息熵的增加趋缓;汉字增加到12370以后,不再使信息熵有明显的增加。我国科学家指出:汉字的容量极限是12366个汉字,汉字静态平均信息熵的值(平均信息量)是9.65
比特。通过数理语言学中著名的
齐普夫定律(ZIPF’SLAW)核算,这是当今世界上信息量最大的文字符号系统。联合国五种工作语言文字的信息熵的比较如下:
法文:3.98比特
西班牙文:4.01比特
英文:4.03比特
俄文:4.35比特
中文:9.65比特
可以看出,拼音文字的信息熵小,差别不大。汉字的信息量最大。
汉字对拼音文字的这种信息熵优势是什么概念?简单的比喻就是十进制数与二进制数的差别。十进制数字系统需要人记忆0-9,10个符号,二进制只需要记忆0和1两个符号。十进制乘除要记忆9X9表,二进制只需要学会与、或、非的简单逻辑。但是,人类在日常生活中为什么不使用
二进制数字系统呢?因为那样很浪费,一个数字“7”表示成二进制就成了“111”,记个大数人不累?反过来,人类为什么不用十六进制,或更高的进制呢?一方面是人脑智力的限制,另一方面,十六进制也未必能大幅度提高信息熵。这种信息熵反映在文字上,就是联合国文件中,中文版本一定是最薄的。这就是汉字字符集信息熵高的优势。
汉字的以上五个方面的特点,无疑会使其在阅读心理方面较拼音文字具有相当大的优势,使汉字的书面语在感知、理解的各个方面都有较高的速度和效率,能够实现阅读速度、理解速度、记忆速度的协调发展,快速阅读,也是中国为何能崛起的天然因素,汉语不失,华夏永存。
计算机输入
中文信息处理由于
打字机键盘在设计时本身没有考虑汉字输入的问题,输入汉字往往比输入拼音文字困难。由于英文是由26个字母
排列组合而成的文字,因此可以简化输入步骤;相比较之下汉字则不能如此,从字形上虽然可以拆解成不同的部分,但是被分成的部首或偏旁数量多,这样不但不能达到简化输入的目的,反而显得更为繁琐,于是从汉字字音上去考虑汉字输入被分成少量的语音元素组合排列,这样可以达到简化输入的步骤。由于是语音输入对汉字的读音必须清楚,某些
生僻字或不知道汉字发音的则会很困难,这在一定程度上限制了汉字的输入。汉字没有经过
中文打字机的普及,直接进入了电脑中文信息处理阶段。在电脑发明初期曾引起汉字能否适应电脑时代的问题,支持
汉字拉丁化的学者甚至以此为理据。
随着各种
中文输入法的出现,汉字的计算机输入、存储、输出技术得到了基本解决,大大提高了中文写作、出版、信息检索等的效率。中文输入法有上千种之多,主要包括表音输入和表形输入两类(即拼音和五笔),也有两者兼之的。汉字的
语音输入、
手写识别和
光学字符识别(OCR)技术也已得到广泛应用。
如收录数千字的
GB 2312(中国大陆),
Big5 及CNS 11643(台湾),HKSCS(香港),JIS(日本),以及收录两万多字的
GBK(中国大陆), 国外标准
Unicode,
ISO 10646等等。在这个过程中,因为技术及其他种种因素,在收录字数,及收录字体等方面或做不同层次的调整。
中国政府为了解决邮政,户籍整理等领域用字的迫切需要,于2000年实行了一个新的汉字编码的国家标准《汉字编码字符集-基本集的扩充》GB 18030-2000,共收汉字27484个。并强制所有在中国大陆地区售卖的计算机产品必须使用这个新官方标准。
汉字编码系统为进行信息交换,各汉字使用地区都制订了一系列汉字
字符集标准。
国标码(“国标”是
中华人民共和国国家标准的简称)在中国大陆使用。GB2312收录6763个汉字,GBK收录20912个汉字,最新的GB18030收录27533个汉字。
BIG5码。收录13053个汉字。在台湾和香港使用的一
字节或两字节编码。
Unicode并不被大陆很好地接受。政府要求在大陆出售的软件必须支持GB18030编码。
在国际通信化和软件设计领域,CJK编码除了收集了中文,还有日本汉字、韩国汉字的汉字集。
汉字规范化
汉字简化
汉字自其诞生以来便经历了
甲骨文、
金文、
篆文,到
隶书、
草书、
楷书、
行书的演变过程。汉字
书体发展的总体形势是通过减省
笔画由繁入简,逐渐简化的,但有时为了使文字更好更明确地表意,也有文字繁化的现象。特别是
造纸术、
印刷术的出现,极大地促进了文化的发展与传播,文字越来越多地被民间人士使用。民间不断出现一些
简笔字,这些字笔画的减省是
约定俗成的,具有一定的群众基础,但由于与当时官方的规范汉字形体不同而被视为
俗体、破体,是不能登大雅之堂的。李海霞的《六朝唐五代石刻俗字研究》,
潘重规编著的《敦煌俗字谱》、《敦煌变文论辑》,
黄征的《
敦煌俗字典》,
张涌泉的《敦煌俗字研究》《
汉语俗字研究》和刘复、 李家瑞编的《
宋元以来俗字谱》列举了大量历史上曾被使用的简笔字,或称
俗字。
太平天国运动给唐宋以来民间通行的简笔字(俗字)以正统地位,在太平天国
玉玺、官方文件和印发的书籍中采用简体字。据不完全统计,太平天国总共使用一百多个简体字,其中80%为后来新中国所采用。
新中国成立后继续
新文化运动和
民国时期未能完成的汉字简化工作,于1956年1月31日通过《
人民日报》全文发表了国务院的《关于公布汉字简化方案的决议》和《
汉字简化方案》,并最终制定出了一个《
简化字总表》,给简体字以法定地位。一九七七年曾推出过《
第二次汉字简化方案(草案)》,由于在试用过程中产生了文字混乱现象以及人们的反对,于是到了1986年,
国务院又宣布“
二简字”停止使用。
异体字整理
异体字是相对于
正体字而言的,是指与规范的汉字形体不同但音义相同的字,即汉字的
俗体、
古体、
或体之类。异体字的出现主要是由于汉字
书体的演变以及民间书写过程中产生的
字形形体变异,它们有别于官方规范的汉字形体。大部分汉字都有异体字形,有的甚至有多种异体写法,这些异体字占了汉字总数相当部分数量。例如:“
㷖”与“照”、“
秊、䄭、年”、“
峯”与“峰”、“
氷”与“冰”分别以“照”、“年”、“峰”、“冰”为正体字。
出于统一文字字形,规范汉字形态的目的,
中华人民共和国文化部和
中国文字改革委员会于1955年12月联合发布了《
第一批异体字整理表》,并于次年2月起实施,该表淘汰了1055个异体字。但在后来颁行的《
简化字总表》和《
现代汉语通用字表》中又恢复了不少曾被淘汰的异体字。
错讹字纠正
错讹字是指传抄、书写过程中字形发生了
讹变的字,即
错别字,其有别于正体字。从广义上讲,因
避讳而故意写错的缺笔字(
避讳字)也属于此类。在使用过程中应尽量书写规范汉字,避免错讹字出现。
造字历史
则天造字
武则天在她临朝称制和登基为皇时曾命人创制过汉字,后世遂称“
则天文字”。一般认为则天文字共有十八字,包括最初由
宗秦客献给
武则天的十二字和后来陆续颁行的六字,这十八个字的创造过程共经过五个不同的阶段,并且各有其政治目的及
文化系统的内在意涵。随着
人亡政息后,这批文字亦因失去时代意义的支撑而随之
见弃,后人遂用回
本字。
科技造字
近现代以来,为了表示一些科技
专有名词造了一批字,这些字大都是依据
形声法和
会意法而造。如:
①为了表示一些西洋制
单位曾广泛创造并使用的
多音节汉字:
浬(海里)、
嗧(加仑)、
瓩(千瓦)、
兛(千克)、
兣(厘克)、
粁(千米)等;
②
化学元素:1.
氖、
氢(旧译“𣱮”)、
氕、
氘、
氚、
氧(旧译“
氱”)、
氦、
氪、
氙、
氨、
氮(旧译“㲷”)、
氟、
氩、
氡、鿫(
⿹气奥);2.矽(“硅”的旧译)、
碳、
碘、
碲、
硒、
砹、鿬(
⿰石田);3.
锂、
镁、
钙、
锰、
镍、
镓、
钇、
錷(“
钆”的旧译)、
锆、
钼、
锝、
铟、
铯、
铼、
铱等。
主要影响
汉字是承载文化的重要工具,当前留有大量用汉字书写的典籍。不同的
方言、甚至
语言都使用汉字作为共同书写体系。在古代
日本、
朝鲜半岛、
越南、
琉球群岛,以及位于婆罗洲的
兰芳共和国,汉字都曾是该国正式文书的系统,因而汉文化在历史上对周边文明的传播分享有着重要作用。
由于汉字和发声的联系不是非常密切,比较容易被其他
民族所借用,如日本、朝鲜半岛和越南都曾经有过不会说汉语,单纯用汉字书写的历史阶段。汉字的这个特点对于维系一个文化圈—一个充满各种互相不能交流的方言群体的民族——发挥了主要的作用。
汉字对周边国家的文化产生过巨大的影响,形成了一个共同使用汉字的
汉字文化圈。如
日本、
越南和
朝鲜半岛、
琉球群岛等。
对日本文字的影响
汉字于公元3世纪经朝鲜半岛辗转传入日本。长期以来,其人民是以汉字作为自己传播思想、表达情感的载体,称汉字为“真名”。五世纪初,日本出现被称为“假名”的借用汉字的标音文字。八世纪时,以汉字标记日本语音的用法已较固定,其标志是《万叶集》的编定,故称“万叶假名”。是为纯粹日语标音文字的基础。日本文字的最终创制是由吉备真备和弘法大师(空海)来完成的。他们俩人均曾长期留居中国唐朝,对汉字有很深的研究。前者根据标音汉字楷体偏旁造成日文“
片假名”,后者采用汉字草体创造日文“
平假名”。尽管自十世纪起,假名文字已在日本盛行,但汉字的使用却并未因此而废止。
二战后 日本开始限制汉字的数量和使用,颁布了《当用汉字表》及《人名用字表》等,其中简化了部分汉字(日本新字体),不过文学创作使用的汉字,并不在限制之列。日本除从中文中传入的汉字外,还创造和简化了一些汉字。现如今,已在世界占据重要地位的日本文字仍保留有一千多个汉字。其中,在2010年重新制定并公布的日语常用汉字表中,共收录了2136个汉字。
对朝鲜半岛文字的影响
公元3世纪左右,汉字传入了朝鲜半岛,朝鲜语/韩语曾经完全使用汉字来书写。相传薛聪在当时发明了
吏读,把朝鲜语用同音或同义的汉字来表示。由于有不少发音都没有对应的汉字,所以朝鲜半岛的人民又运用组字法,把两个或多个汉字合组成为一个新的吏读字。相传后来的契丹文就是受到吏读字的影响。此外尚有
乡札、
口诀等以汉字表记朝鲜语的方法。
1443年,朝鲜世宗大王颁布《
训民正音》,发明了
谚文与汉字一起使用,但当中有不少部件仍然有昔日吏读字的痕迹。现如今的韩国虽禁止在正式场合下使用汉字,并停止了在中小学中教授汉字(但是从2011年开始,韩国的李明博政府已经决定将汉字重新纳入中小学的课程里),不过汉字在民间仍在继续使用,且可以按照个人习惯书写,但是现如今能写一笔漂亮汉字的韩国人越来越少。由于朝鲜语/韩语中使用了大量的汉字词汇,并且重音现象严重,所以在需要严谨表达的场合时仍然会使用汉字。虽然在通常情况下人名、公司机构名称等均使用韩文书写,不过大多数的人名、公司机构均有其对应的汉字名称。
朝鲜民主主义人民共和国于1948年废除了汉字,仅保留了十几个汉字。
对越南文字的影响
公元1世纪汉字便传入了
越南,
越南语也曾完全使用汉字做为书写用文字,并在汉字的基础上创造了
喃字,但是由于书写不便,汉字仍是主要的书写方式。
十世纪以前的越南是中国的郡县。秦、汉、隋、唐莫不在此设官统辖,故受中国文化的影响较深。越南独立后,无论是上层人士的交往,还是学校教育以及文学作品的创作,均以汉字为工具。直至十三世纪,越南才有本国文字——
字喃。字喃是以汉字为基础,用形声、假借、会意等方法创制的表达越南语音的新字。十五世纪时,字喃通行全国,完全取代了汉字(少数人还在用汉字)。
1945年
越南民主共和国成立后废除汉字,使用了称为“
国语字”的拼音文字。越南文已经看不到汉字的痕迹了。
行业标准
2023年6月16日,国家新闻出版署发布《汉字字体使用要求》等10项行业标准。