语言代码是
英国教育社会学家伯恩斯坦的术语。指在一定的语言集团中,特定的人群在特定的社会环境下使用的特定的言语。分为限定代码(restricted code)和精制代码(elaborated code)。他认为前者为社会地位和教育程度较低的阶层使用,用词千篇一律,语言成分较简单、不完整,表达不合语法、模糊不清,并不考虑确切地表达一个人的个性和情感,也不包含复合的认知学习。后者为社会地位和教育程度较高的阶层使用,句子较长,结构复杂,语汇丰富,表达详细、明确而有逻辑性,还包括学习概念之间较复杂的关系。这种划分并不意味语言与社会阶层之间在任何情况下都存在必然的联系。
ISO 639是
国际标准化组织为各
语言所订定的
语言代码。ISO 639的标题是Codes for the representation of names of languages(表示语言名称的代码),分为六个部分。
ISO 639-1是
国际标准化组织ISO 639语言代码标准的第一部分。它含有 184 个两字母的
编码,用来标示世界上主要的语言。这些代码在很多地方都被用作语言的简写,例如:
ISO 639-1在 2002年成为正式标准,但在之前的草拟阶段已被使用多年。最后加进ISO 639-1的代码是在2004年10月19日加入的si,代表
僧加罗语。由1995年3月起,RFC 1766推荐使用本标准,而接着在2001年1月起的RFC 3066亦推荐使用本标准。
ISO 639-2:1998 是
国际标准化组织ISO 639语言编码标准的第二部分,为各
语言和
语系所订定的 3 字母语言代码。 ISO639-2 的注册机构是
美国国会图书馆。
ISO 639-2/B 是原本供书籍使用的代码,采用英语的语言名称排列,而并非使用该语言的语言名称排列。例如
德语的 ISO 639-2/B 码是ger, ISO 639-2/T 码是deu;中文(汉语)的 ISO639-2/B 码是chi, ISO639-2/T 码是zho。除英语图书馆编排外,应使用 ISO639-2/T 码。
塞尔维亚语曾用 ISO639-2/B 码scc、克罗地亚语曾用 ISO639-2/B 码scr,但在2008年6月28日的改动中,已被停止使用,改为统一使用 ISO639-2/T 码srp和hrv。
ISO 639-3是个国际语种代号标准,在2007年2月5日出版。它延伸了ISO 639-2里的 Alpha-3 code(三个字母的代号),目标是涵盖所有的语言。所以,它是
ISO 639-1的超集合。 ISO 639-3 是ISO 639-2个别语言的超集合,但是因为 ISO639-3 没有 ISO639-2 的语言集合,所以 ISO 639-3 不是整个 ISO 639-2 的超集合。
自2005年7月30日发布的计划草案,共有 7,602 个语言条目,这些语言的来源有三个:基本资料来自 ISO 639-2 所收录的个别语言,和取自《
民族语》里的现代语言调查资料。