位段,C语言允许在一个
结构体中以位为单位来指定其成员所占
内存长度,这种以位为单位的成员称为“位段”或称“
位域”( bit field) 。利用位段能够用较少的位数存储数据。
定义
信息的存取一般以
字节为单位。实际上,有时存储一个信息不必用一个或多个字节,例如,“真”或“假”用0或1表示,只需1位即可。在计算机用于过程控制、参数检测或
数据通信领域时,控制信息往往只占一个字节中的一个或几个
二进制位,常常在一个字节中放几个信息。
性质
位段(或称“位域”,Bit field)为一种
数据结构,可以把数据以
位的形式紧凑的储存,并允许程序员对此结构的位进行操作。这种数据结构的好处:
而位域这种数据结构的缺点在于,其内存分配与内存对齐的实现方式依赖于具体的机器和系统,在不同的平台可能有不同的结果,这导致了位段在本质上是不可移植的。
例子
在C语言中,位段的声明和
结构(struct)类似,但它的成员是一个或多个位的字段,这些不同长度的字段实际储存在一个或多个整型变量中。在声明时,位段成员必须是整形或枚举类型(通常是无符号类型),且在成员名的后面是一个冒号和一个整数,整数规定了成员所占用的位数。位域不能是静态类型。不能使用&对位域做取地址运算,因此不存在位域的指针,编译器通常不支持位域的引用(reference)。以下程序则展示了一个位段的声明:
以下程序展示了一个结构体的声明:
第一个声明取自一段文本格式化程序,应用了位段声明。它可以处理256个不同的字符(8位),64种不同字体(6位),以及最多262,144个单位的长度(18位)。这样,在ch1这个字段对象中,一共才占据了32位的空间。而第二个程序利用结构体进行声明,可以看出,处理相同的数据,CHAR2类型占用了48位空间,如果考虑边界对齐并把要求最严格的int类型最先声明进行优化,那么CHAR2类型则要占据64位的空间。
无名位域
如果位域的定义没有给出标识符名字,那么这是无名位域,无法被初始化。无名位域用于填充(padding)内存布局。只有无名位域的比特数可以为0。这种占0比特的无名位域,用于强迫下一个位域在内存分配边界对齐。
实现
通常在大端序系统(如
PowerPC),安排位域从最重要字节(most-significant byte)到最不重要位(least-significant byte),在一个字节内部从最重要位(most-significant bit)到最不重要位(least-significant bit);而在小端序系统(如
x86),安排位域从最不重要字节(least-significant byte)到最重要字节(most-significant byte),在一个字节内部从最不重要位(least-significant bit)到最重要位(most-significant bit)。共同遵从的原则是内存字节地址从低到高,内存内部的比特编号从低到高。
Microsoft Visual C++实现
在一个整数(integer)内的位域从最不重要位(least-significant)向最重要位(most-significant)依次分配。
相邻的两个位域如果基类型(underlying type)的长度相同,在后的位域适合当前内存分配单元且没有跨内存分配边界,那么这两个位域分配到同一个(1、2或4字节的)分配单元。这可以通俗理解为:具有相同的基类型(underlying type)长度的相邻位域尽量装入基类型的同一个对象,如果装得下的话。
应用
1.位段的使用
(1)位段成员的类型必须指定为
unsigned或int类型。
(2) 若某一位段要从另一个字开始存放,可用以下形式定义:
unsigned a:1;
unsigned:0;
unsigned c:3;另一存储单元
a、b、c应连续存放在一个存储单元中,由于用了长度为0的位段,其作用是使下一个位段从下一个存储单元开始存放。因此,只将a、b存储在一个存储单元中,c另存在下一个单元(“存储单元”可能是一个
字节,也可能是2个字节,视不同的
编译系统而异)。
(3) 一个位段必须存储在同一存储单元中,不能跨两个单元。如果第一个单元空间不能容纳下一个位段,则该空间不用,而从下一个单元起存放该位段。
(4) 可以定义无名位段。
(5) 位段的长度不能大于
存储单元的长度,也不能定义位段
数组。
(6) 位段可以用整型格式符输出。
(7) 位段可以在
数值表达式中引用,它会被系统自动地转换成整型数。
(8) 位段定义的第一个位段长度不能为0。
2.STM32F10xxx系列中的应用
bit_word_addr=bit_band_base+(byte_offset×32)+(bit_number×4)
其中:
bit_word_addr是别名
存储器区中字的地址,它映射到某个目标位。
bit_band_base是别名区的起始位。
byte_offset是包含目标位的字节在位段里的序号。
bit_number是目标位所在位置(0~31)。
例如:
0x22006008=0x22000000+(0x300×32)+(2×4)
对0x22006008地址的写操作与对0x20000300字节的位2执行读—改—写操作效果相似。