D语言,一种通用
计算机程序语言,威力强大、功能丰富,支持多种编程范式,例如
面向对象,最初由Digital Mars公司就职的Walter Bright于2001年发布,意图改进C++语言。最新D语言被简称为D2。最主要的D语言的实现是DMD。
产生背景
D 语言。它在C++的基础上有一定的扩展,同时还保持了生成高效代码以及直接访问操作系统
API和硬件的能力。
D 很适合于编写从中等规模到团队合作完成、数百万行代码规模的各种程序。
D 易于学习,为编程者提供了各种便利,采用了各种野心勃勃的
编译器优化技术。
D 不是一种
解释型语言,所以不需要
虚拟机。它是给实际的编程者使用的实用的计算机程序语言,帮助程序员快速、可靠地完成易于维护、易于理解的代码。
D 是数十年来实现多种语言
编译器的经验的积累,是用那些语言构造大型工程的尝试的积累。D 从那些语言(主要是 C++ )那里获得了灵感,并使用经验和现实世界中的实用性来驯服它。
自从 C++ 语言被发明以来,许多新的概念加入了 C++ ,但同时维护了于C 的兼容性,包括兼容了原始设计中的所有的弱点。有很多修正这些弱点的尝试,但是兼容性是最大的困扰。同时,C 和 C++ 都在不断引入新的特性。这些新特性必须被小心的加入到现有的结构中,以免重写旧的代码。最终导致了十分复杂的语言规范—— C 标准近 500 页,C++ 标准超过750 页!C++ 实现起来既困难又代价高昂,导致各种实现之间都有差别,因此很难写出完全在不同实现之间可以移植的 C++ 代码。
C++程序员倾向于使用语言中的孤岛来编程,也就是说,他们倾向于十分精通语言中的某个特性而避免使用其他特性。尽管代码通常在
编译器之间是可移植的,但在程序员之间移植就不那么容易了。C++ 的一个长处是它支持很多根本上不同的编程风格——但从长远来看,互相重复和互相冲突的风格会给开发带来妨碍。
C++ 在标准库而不是语言核心中实现了可改变大小的
数组和
字符串拼接等。不在语言核心中实现这些功能造成了几种不太理想的结果。
是否能把 C++ 的能力释放、重新设计并重铸到一门简单、正交并实用的语言中呢? 这种语言是否能做到易于正确实现,并使编译器有能力有效地生成高度优化的代码呢?
现代编译器技术已经取得了很大的进步,有些原来用作原始编译技术的补充的语言特性已经可以被忽略了(一个这样的例子是 C 语言中的‘register’
关键字)。我们可以依赖现代
编译器的优化技术而不是使用语言特性(如同原始的编译器所做的那样)来获得可以接受的代码质量。
主要功能
简述
通过加入已经被证明的能够提高生产力的特性、调整语言特性以避免常见但耗费精力的bug的出现,至少减少软件开发成本10%。
使代码易于在
编译器之间、在机器之间、在操作系统之间移植。
支持多种编程范式,也就是至少支持命令式、结构化、
面向对象和范型编程范式。
对于熟悉 C 或者 C++ 的人来说,学习曲线要短。
提供必要的低级访问能力。
要使 D 的编译器从根本上易于实现(相对于 C++ 来说)。
要同本机的 C 语言应用程序二进制接口相兼容。
语法要做到上下文无关。
对编写国际化的应用程序提供便利的支持。
能够构建轻量级的、独立的程序。
废弃的特征
预处理程序
宏处理是一种扩展语言的简单方法,它可以给语言加入某些语言本不支持的(对于符号调试器不可见的)特征。
条件编译、使用 #include 分层的文本、宏、符号连接等,本质上构成了两种难以区分两种语言的融合体,而不是一种语言。更糟的是(或许是最好的),C 预处理程序是一种十分原始的宏语言。是停下来的时候了,看看预处理程序是用来做什么的,并将这些功能直接设计到语言内部。
多重继承
它是一种拥有饱受争议的价值的复杂特征。它很难用一种高效的方式实现,而且在
编译器实现它时很容易出现各种 bug 。几乎所有的 MI 的功能都能够通过使用
单根继承加接口和聚集的方式实现。而那些只有 MI 才能支持的功能并不能弥补它带来的副作用。
名字空间
当链接独立开发的代码时,可能会发生名字的冲突,名字空间就是解决这个问题的一种尝试。模块的概念更简单并且工作得更好。
标记名字空间。这是 C 的一个糟糕的特征,结构的标记名称位于一个同其它符号不同的
符号表中。C++ 试图合并标记名字空间和正常的名字空间,但同时还要维持对遗留 C 代码的向后兼容性。造成的结果是不可打印。
前向声明
C
编译器在语义上只知道什么东西实在词法上位于当前状态之前的。C++ 进行了一点点扩展,类中的成员可以依赖于它之后声明的类成员。D 更进一步,得到了一个合情合理的结论,前向声明根本就没有存在的必要。函数可以按照一种自然的顺序定义,不用再像 C 那样为了避免前向声明而采用常用的从里到外的顺序定义。
包含文件
造成
编译器运行缓慢的原因之一是编译每个
编译单元时都需要重新解析数量巨大的头文件。包含文件的工作应该采用导入到
符号表中的方式来完成。
在堆栈上创建对象实例
在 D 中,所有的类都通过引用来访问。这样就不需要
复制构造函数、
赋值运算符、复杂的析构语义以及同
异常处理中的堆栈展开的相互作用。内存资源由垃圾收集程序负责释放,其他资源通过使用 D 的 RAII 特征释放。
预处理程序。现代语言不应该需要文本处理,它们应该只需要符号处理。
非
虚成员函数。在 C++ 中,由累得设计者决定一个函数是否应该是
虚函数。在子类中重写一个函数而忘记在父类中将其更新为虚函数是一个常见的(并且非常难以发现的)编码错误。将所有成员函数设置为虚函数,并由
编译器来判断函数是否被重写、并由此将没有被重写的函数转换为非虚函数的做法更为可靠。
任意长度的
位字段。位字段是一种复杂、低效并且很少用到的特征。
支持16位计算机。D 从不考虑混合使用远/近
指针和其它所有用于声称好的16位代码的机制。D 语言的设计假设目标机器至少拥有
32位的平坦内存空间。D 将能够被毫无困难的移植到
64位架构上。
对编译遍数的互相依赖。在 C++ 中,需要一个
符号表和各种的预处理程序命令才能成功的解析一个源文件。这样就使预解析 C++ 源码变得不可能,并且使编写代码分析程序和语法制导的
编辑器的过程十分难以正确实现。
编译器的复杂性。通过降低实现的复杂度,这就更有可能出现多个正确的实现。
‘.’和‘->’之间的区别。这种区别其实很没有必要。‘.’
运算符完全可以起到‘->’所起的
指针解引用的作用。
适合于
不适合于
主要特征
本节列出了一些有趣的 D 的特征。
面向对象编程
类D的
面向对象天性来自于类。采用的继承模型时
单根继承加接口。Object 类为与继承体系的最顶端,所以所有的类都实现了一个通用的功能集合。类通过引用的方式实例化,所以不需要用于在异常后进行清理工作的复杂代码。
运算符重载
类可以通过重载现有的运算符扩展类型系统来支持新类型。例如创建一个 bignumber class ,然后重载 +、-、* 和 / 运算符,这样大数类就可以使用普通的代数运算语法了。
模块
源文件同模块是一一对应的。D 不再“包含”带有声明的文件的文本,而是“导入”该模块。不用担心多次导入一个模块,也不用再把头文件用 #ifndef/#endif 或者 #pragma once 包起来了。
声明 vs 定义
C++ 的函数和类通常需要声明两次——声明位于 .h 头文件中,定义位于 .c源文件中。这个过程易于出错而且冗长繁琐。显然,应该只需要程序员编写一次,而由
编译器提取出声明信息并将它导入到
符号表中。这正是 D 所做的。
示例:
class ABC { int func() { return 7; } static int z = 7; } int q;
不再需要单独定义成员函数、
静态成员、外部声明之类的,也不需要像这样烦人的语法:
int ABC::func() { return 7; } int ABC::z = 7; extern int q;
注记:当然,在 C++ 中,琐碎的函数如 { return 7; } 也可以直接写在声明处,但是复杂的函数就不行了(uframer:虽然从语法上说依然是可以的,但会违反 C++ 接口和实现分离的原则。)。另外,如果有前向引用的话,就必须保证已经声明了被引用的那个函数一个原型。下面的代码在 C++ 中是不合法的:
class Foo { int foo(Bar *c) { return c->bar; } }; class Bar { public: int bar() { return 3; } };
但是等价的 D 代码就可以正常工作:
class Foo { int foo(Bar c) { return c.bar; } } class Bar { int bar() { return 3; } }
D 函数是否被在线化取决于优化程序的设置。
模板
D 模板提供了一种提供范型编程和偏特化能力的简洁的方法。
关联数组
关联数组是索引可以为任意类型的数组,不像普通数组那样必须使用整数作为索引。本质上,关联数组就是散列表。关联数组使构建快速、高效、无错的
符号表变得容易了。
真正的 typedef
C 和 C++ 的 typedef 实际上是类型 别名 ,因为它不会引入新的类型。D 实现了真正的 typedef :
typedef int handle;
实实在在地创造了一个新类型 handle 。D 同样会对 typedef 引入的类型进行类型检查,并且 typedef 也参与
函数重载的决策。例如:
int foo(int i); int foo(handle h);
函数
如你所愿,D 提供常规的对函数的支持,包括
全局函数、
重载函数、函数在线化、成员函数、
虚函数、
函数指针等等。另外,D 还支持:
函数可以嵌套在其他函数内。这对于代码分解、局部性以及函数闭包技术都具有很高的价值。
函数文字量
动态闭包
嵌套函数和类成员函数可以被称为闭包(也被称为委托),它们可使范型编程更为容易并保证
类型安全。
In, Out 和 Inout 参数
这几个
修饰符不只能使函数更为易于理解,还能避免使用
指针而不会影响代码的功能,另外这也会提高
编译器帮助程序员找到编码问题的可能性。
这些修饰符使 D 能够直接同更多的外部 API 对接。也就无需使用“接口定义语言”(IDL)之类的东西了。
数组
数组本身并不带有数组结构的信息,它们必须另外存储和传递。一个经典的例子就是传递给 main(int argc, char *argv[]) 函数的 argc 和 argv 参数。(在 D 中,main 被声明为 main(char[][] args) 。)
数组不是一等公民。当一个数组被传递给函数时,他被转换为
指针,尽管那个原型令人迷惑地声称它是一个数组。当发生类型转换时,所有的数组类型信息也就丢失了。
C数组的大小不可改变。这意味着即使最简单的聚集如
堆栈都必须用一个复杂的类构造。
C
数组没有边界检查,因为它们根本不知道数组边界是多少。
数组声明中的 [] 位于标志符之后。这使得声明如一个指向数组的指针这样的东西都需要复杂难懂语法:
int (*array)[3];
在 D 中,数组的 [] 位于左侧:
int[3] *array; // 声明了一个指向含有 3 个 int 的数组的
指针long[] func(int x); // 声明了一个返回含有 long 数据的数组
显然这更易于理解。
D数组有四种变体:指针、
静态数组、
动态数组和
关联数组。
字符串
在 C 和 C++ 中,对字符串的操作是如此的频繁,而又如此的笨拙,以至于最好还是由语言本身来支持它比较好。现代语言都处理字符串连接、复制等等操作,D 语言也提供了这些支持。字符串是直接由经过改进的
数组来处理的。
资源管理
垃圾收集
D 的
内存分配完全采用垃圾收集。经验告诉我们,C++ 中的很多复杂特征都是用于处理
内存释放的。有了垃圾收集,语言就变得简单多了。
有一种看法认为垃圾收集是给那些懒惰、初级的程序员准备的。我还记得那些对 C++ 的评论,毕竟,没有什么 C++ 能做而 C 不能做的,或者这对汇编来说也一样。
采用垃圾收集可以避免 C 和 C++ 中必需的乏味的、易于出错的内存分配和追踪代码。这不只意味着更少的开发时间和更低的维护费用,还意味着程序运行得更快!
当然,可以在 C++ 中使用垃圾收集程序,我已经在我自己的项目中使用它了。C++ 对垃圾收集程序并不友好,这也造成了 C++ 中垃圾收集的低效。很多
运行时库的代码都不能同来垃圾收集程序一同工作。
显式内存分配
尽管 D 是一种采用垃圾收集的语言,还是可以重写某个类的 new 和 delete 操作以采用一个定制的分配器。
RAII
RAII 是一种管理资源分配和释放的现代软件开发技术。D 以一种可控的、可预测的方式支持 RAII ,它是独立于垃圾收集程序的回收周期的。
性能
轻量级聚集
D 支持简单的 C 风格的结构,既保证了对 C数据结构的兼容性,也是因为有时采用类有杀鸡用牛刀之嫌。
设备驱动程序、高性能系统程序、嵌入式系统和某些特殊的代码需要使用汇编语言完成任务。尽管 D 的实现不一定要实现内联汇编,它也仍被定义为语言的一部分。他可以满足绝大多数使用汇编语言的需要,这样就不需要单独的
汇编程序或者使用
DLL了。
许多的 D 实现同时也实现那些类似于 C 的支持
I/O端口操作、直接访问浮点硬件等内部功能的内函数。
可靠性
现代的语言应该竭尽所能地帮助程序员避免出错。语言提供的帮助有多种形式:从易于使用更为健壮的技术,到有
编译器指出明显出错的代码,到运行时检查。
契约
契约式编程(由 B. Meyer 发明)是一种用于保证程序正确性的革命性的技术。D 版本的 DBC 包括函数先验条件、函数后验条件、雷不变量和断言契约。
单元测试
可以给一个类加入
单元测试,这样
测试程序就能在程序启动时自动运行。这样就能够在每次构建时都验证类是否实现了他所应完成的功能。单元测试构成了源代码的一部分。创建单元测试成为了类开发过程中的自然的一部分,而不是将完成的代码直接抛给测试小组。
单元测试可以使用其它语言完成,但是其结果看起来有一种七拼八凑的感觉,而且你采用的那种语言很可能并不兼容这个概念。
单元测试是 D 的一个主要特征。对于
库函数来说,单元测试已经被证明是十分有效的。它既可以保证函数工作正常,也可以演示如何使用这些函数。
考虑大量的可以从网上下载的 C++ 库和应用程序代码。其中有“几个”是带有验证测试的?更不要奢望单元测试了?少于 1% ?通常的做法是,如果它们能通过编译,我们就假定它是正确的。而且我们不知道变异过程中给出的警告到底是真正的错误还是瞎唠叨。
契约式编程和单元测试使 D 为编写可信赖、健壮的系统程序的最好的语言。单元测试还是我们能够粗略但快速地估计你从未经手的 D 代码片段的质量——如果没有单元测试和契约式编程,没人会干这种事。
调试特征和语句
调试已经成为了语言语法的一部分了。可以在编译时决定是否使用这些代码,再也不用使用宏或者
预处理命令了。调试语法提供了一种持续的、可移植的、易于理解的识别调试代码的方法,使程序员既能够生成带有调试代码的二进制版本,也能够生成没有调试代码的二进制版本。
异常处理
D 采用了更为高级的 try-catch-finally 模型而不是原来的 try-catch 模型。没有必要只是为了利用
析构函数实现 finally 语义而构造一个傀儡对象。
同步
因为多线程编程已经越来越成为主流,所以 D 提供了构建多线程程序的
原语。同步既可以作用在方法上,也可以作用在对象上。
synchronized int func() { . }
同步方法一次只允许一个线程执行。
同步语句将在语句块周围插入一个
互斥体,控制对象或全局的访问。
对健壮性技术的支持
使用动态数组而不是指针
使用对变量的引用而不是指针
使用对对象的引用而不是指针
使用垃圾收集而不是显式内存分配
内建线程同步原语
不再有宏给你的代码来那么一下子
使用内联函数而不是宏
在很大程度上减少了使用指针的需要
整型的大小是明确的
不用再担心 char 类型是否有符号了
不必再分别在源文件和头文件中重复地写声明了
为调试代码提供了显式的解析支持
编译时检查
更强的类型检查
需要进行显式初始化
不允许出现空的(只由‘;’的)循环体
废弃过时的 API
运行时检查
数组边界检查
switch 语句中的未定义 case 语句异常
内存耗尽异常
in、out 和类不变量提供了对契约式编程的支持
兼容性
D 保留了 C 的运算符和它们的优先级、求值的规则和
类型提升规则。这就避免了由于同 C 的语义不同而造成的微妙的难以发现的 bug 的出现。
直接访问 C API
D 不支拥有同 C 类型对应的类型,它还提供了直接访问 C 函数的能力。完全没有必要编写封装函数和参数变换器,也没有必要逐一地复制聚集类型的成员。
支持所有的 C数据类型
使对 C API 或者现有的 C 库代码的接口成为可能。D 支持结构、联合、枚举、
指针和所有的 C99 类型。D 还拥有设置结构成员对齐方式的能力,这样就可以保证同外部导入的
数据格式的兼容。
操作系统异常处理
D 的
异常处理机制将在应用程序中利用底层操作系统提供的异常处理方式。
使用现成的工具
D 生成标准的目标文件格式,这样就能够使用标准的
汇编程序、
链接器、
调试器、
性能分析工具、可执行程序压缩程序和其他的分析程序,还能够同其他语言编写的代码相链接。
项目管理
D 对从同一份源码生成多个版本的程序提供了内建的支持。它替代了 C 预处理程序的 #if/#endif 技术。
废弃
随着代码不停的演进,一些旧的库代码会被更新,更好的版本代替。同时旧的版本必须可用以支持旧的客户代码,旧的版本可以被标记为 废弃的 。可以通过
编译器的一个选项来判断使用废弃版本代码的版本是否是合法的,这样一来负责维护的程序员就可以更为轻松的判断哪里是依赖于已经被废弃的特征的。
没有警告
D编译器不会为可疑的
代码生成警告。代码要么可以被编译器接受,要么不能被编译器接受。这样就不会引起有关哪些警告确实是错误而那些不是的争论,也就没有如何处理它们的争论了。对编译器警告的需求本身就是不好的语言设计的表现。