【c语言学习笔记二十一】位段

在大多数的计算机系统中, 一个字节是由八个更小的, 称作为位的单位组成的。位是比字节更小的单位。位只有两个值, 1 或 0 。因此, 存储在计算机存储器中的一个字节可以看成由八个二进制数字形成的串。

例如, 一个存放值 36 的字节是八个二进制数字的串: 可以表示成 00100100。 存入值24 的字节可以表示成 00010100。

有时, 我们希望不仅对字节进行操作, 也要能对位进行操作。例如, 用布尔真或假条件表示的标志, 在计算机中可用位来表示。

但是, 说明一个用作标志的普通变量至少要用一个字节—8 位, 而在某些计算机系统中则可能是 16 位。 如果我们想在一个很大的表中存储很多标志, 那么 “被浪费” 的内存空间是很可观的。在 C 语言中, 一种方法是用叫做位段的构造类型来定义一个压缩信息的结构。

位段(bit-field)是以位为单位来定义结构体(或联合体)中的成员变量所占的空间。含有位段的结构体(联合体)称为位段结构。采用位段结构既能够节省空间,又方便于操作。

c831.jpg (4023 bytes)

位段的定义格式为:

     type  [var]: digits

其中type只能为int,unsigned int,signed int三种类型(int型能不能表示负数视编译器而定,比如VC中int就默认是signed int,能够表示负数)。位段名称var是可选参数,即可以省略。digits表示该位段所占的二进制位数。

那么定义一个位段结构可以像下面这段代码去定义:

struct node
{
  unsigned int a:4;   //位段a,占4位
  unsigned int :0;   //无名位段,占0位
  unsigned int b:4;   //位段b,占4位
  int c:32;       //位段c,占32位
  int :6;       //无名位段,占6位
};

一.位段的使用

使用位段需注意一下几点:

(1)位段的类型只能是int,unsigned int,signed int三种类型,不能是char型或者浮点型;

(2)位段占的二进制位数不能超过该基本类型所能表示的最大位数,比如在VC中int是占4个字节,那么最多只能是32位;

(3)无名位段不能被访问,但是会占据空间;

(4)不能对位段进行取地址操作;

(5)若位段占的二进制位数为0,则这个位段必须是无名位段,下一个位段从下一个位段存储单元(这里的位段存储单元经测试在VC环境下是4个字节)开始存放;

(6)若位段出现在表达式中,则会自动进行整型升级,自动转换为int型或者unsigned int。

(7)对位段赋值时,最好不要超过位段所能表示的最大范围,否则可能会造成意想不到的结果。

(8)位段不能出现数组的形式。

二.位段结构在内存中的存储方式

对于位段结构,编译器会自动进行存储空间的优化,主要有这几条原则:

1)如果一个位段存储单元能够存储得下位段结构中的所有成员,那么位段结构中的所有成员只能放在一个位段存储单元中,不能放在两个位段存储单元中;如果一个位段存储单元不能容纳下位段结构中的所有成员,那么从剩余的位段从下一个位段存储单元开始存放。(在VC中位段存储单元的大小是4字节).

2)如果一个位段结构中只有一个占有0位的无名位段,则只占1或0字节的空间(C语言中是占0字节,而C++中占1字节);否则其他任何情况下,一个位段结构所占的空间至少是一个位段存储单元的大小;

测试程序:

/*测试位段 201110.12*/ 
#include<iostream>
using namespace std; 

typedef struct node
{
  unsigned int a:1;   //存在一个非0位的位段,则至少占4Byte 
}S; 

typedef struct node1    //在C++中占1字节的空间 ,在C中占0字节 
{
  unsigned int :0;
}S1;

typedef struct node2
{
  unsigned int a:1;
  unsigned int :0;   //下一个位段放在一个新的位段存储单元 ,所以占4+4=8Byte 
  unsigned c:32;     
}S2;

typedef struct node3
{
  unsigned int a:4;
  unsigned int :0;
  int :6;        //这个位段放在一个新的位段存储单元 
  unsigned c:32;    //由于6+32>32,所位段c也放在一个新的位段存储单元,所以占4+4+4=12Byte 
}S3;

typedef struct node4 
{
  unsigned int a:1;
  char b;        //在一个位段存储单元中能够存下所有的成员,所以占4Byte 
  int c:1;
  int d:2;
  unsigned int e:2;
}S4;


int main(int argc, char *argv[])
{
  S4 s4;
  s4.a=1;
  s4.c=1;
  s4.d=2;       
  s4.e=3;
  printf("%d %d %d %d\n",s4.a,s4.c,s4.d,s4.e);
  printf("%d %d %d %d %d\n",sizeof(S),sizeof(S1),sizeof(S2),sizeof(S3),sizeof(S4));
  return 0;
}

执行结果为:

1 -1 -2 3
4 1 8 12 4
请按任意键继续. . .
当打印s4的各个位段时,打印的结果与赋的初始值不同。

由于c只占1位,那么没有数据位,此时进行符号扩展直接在高位添加1,所以打印的结果为-1;

由于d占2位,那么当将2赋给d时,内存中存储的内容为10,此时进行符号扩展,高位补1,则为0XFF FF FF FE,那么其真值则为-2.

发表评论

电子邮件地址不会被公开。 必填项已用*标注