代数语言学又称做
形式语言学,
数理语言学的一个分支。应用集合论、
数理逻辑、算法理论、图论、格论、
模糊数学等离散的、代数的方法研究
语言现象的学科。
简介
语言学是社会科学里最接近自然科学的学科,也是最容易与数学联系的学科。如今随着语言学的发展,特别是
计算语言学的发展,数学已经成为语言研究的重要工具和手段。“方法”这本书从语言学的角度来讲有关数学问题,特别适合从事语言研究的人阅读。对从事计算语言学研究的人来说,此书实为难能可贵。其中很多的理论,很多的思路,都有助于我们对一些问题的思考更深入,认识更清楚。本书使我们认识到语言学与数学的结合有着必要性和可能性。语言的形式化需要数学,需要使用数学的方法来分析和描述语言;语言又是一个抽象的符号系统,我们可以用数学思想和数学方法来研究这个特殊的符号系统。
基本定义
主要研究如何对语言的形式结构进行严格的数学描述,并据此创立形式化的普遍语法。认为语言拥有一种递归机制和生成功能。也就是说有限的语言单位和规则可以生成无限的句子,并用数学的方法将之公式化,创建普遍语法的数学模型。
应用范围
如何对语言的形式结构进行严格的数学描述,并据此创立形式化的普遍语法。。但是代数语言学对语言结构、语言系统、语言本质的研究是不擅长的。
研究领域
代数语言学的研究领域,目前主要包括以下几个方面:
①建立语言的数学模型,如美国逻辑学家、语言学家N.乔姆斯基、苏联数学家О .С.库拉金娜 、语言学家Y.巴尔-希列尔分别提出了语言的生成性模型 、分析性模型和辨识性模型。
②研究形式语言及其与自动机的关系。乔姆斯基等人发现,一定类型的
形式文法是与一定类型的自动机相对应的,文法是语言的生成程序,而相应的自动机则是该语言的识别程序。
③建立自然语言自动处理各种方法的理论。在人机对话研究中提出了
扩充转移网络、语义网络等方法,在
机器翻译研究中提出了
从属分析法、
预示分析法、
树形分析法等方法,代数语言学要对这些方法进行理论上的研究。
④研究语音、语法、词汇、语义中的模糊现象。
⑤研究语言的句法结构与语义解释之间的关系,如
孟德鸠语法等。
研究意义
随着科学的发展,代数语言学正在不断地开拓新的研究领域。
代数语言学的研究,对于计算机程序语言也有一定的指导意义,因而这门学科也引起了计算机科学家们广泛的注意。
研究方法
代数语言学家应把注意力集中在语言本体的研究上。具体地说,形式语言学研究的是句子表层结构与深层结构之间的关系、句子的生成规律以及转换规则。他们认为,只要找出这些规则,就能把本族语者用以产生所有合乎语法的句子的知识全部显现出来。
代数语言学家的研究对象是句子,而且只局限于符合语法规则的句子。他们要发现的是造句的内在规律。这种规律不是某种语言所特有,而是所有语言共有的特征。形式语言学家应以一个高度理想化的语言使用者作为研究对象和衡量结论正确与否的依据。可见,他们注重的不是实际语料,而是内省语料。
语言学专注于语言表层形式的共性,这种共性来源于初始状态下天赋的语言机制。形式语言学家关心理想化的语言能力和句子的合乎语法性。他们研究语言能力,注重内部语言证据,往往以理想化的句子结构作语料,侧重描述“核心部分”,主要表现在:
1.采用形式化的规则来描写普遍语法。从自然主义的观点出发,他们认为对心智的研究应像自然科学对实体的研究一样,建立在高度抽象化的水平上,并通过构拟模型的方法进行。形式化是实现解释和描写的精密化、明晰化的有效方法,为各门自然科学所采用,因此也为形式语言学家所借鉴。
2.强调语言描写的形式化,反映其力图使语言研究精密化、科学化的努力。形式主义语法理论中的句法自主目的在于分离其他非本质因素的干扰,最大限度地专注于核心问题的研究。将语言能力理想化和采用理想化的语言材料也是基于同样的考虑。