union联合体
一、概念
共用体,也叫联合体,在一个“联合”内可以定义多种不同的数据类型, 一个被说明为该“联合”类型的变量中,允许装入该“联合”所定义的任何一种数据,这些数据共享同一段内存,以达到节省空间的目的。union变量所占用的内存长度等于最长的成员的内存长度。
二、内存占用和赋值问题
它是一个特殊的类,特殊在任意时刻,联合体内只能有一个数据成员可以有值,当给联合中某个成员赋值之后,该联合中的其他成员就变成未定义状态,值也等于当前被赋值的成员的值,没有了实际意义。举例说明:
1、 例1:定义一个联合体如下:
union Token{ char cval; int ival; double dval; };以上代码定义了一个名为Token的联合,该联合中包含了3个数据成员。
Token token; token.cval = 'a'; token.ival = 1; token.dval = 2.5;在任意时刻,联合中只能有一个数据成员的值是有意义的。具体而言:以上代码定义了联合Token的一个变量token,此时token所占内存的数据如下图所示。
红色方框内的数据即为token所占内存数据。因为token中长度最大的变量是double类型,所以token的长度是8个字节。
之后首先为token的变量cval赋值,此时token所占内存的数据如下图所示。
此时,token所占内存的第一个字节的值变为0x61,即字符’a’。 
接下来为token的变量ival赋值,此时token所占内存的数据如下图所示。
此时,token所占内存的前四个字节变为0x00000001,即为数字1。在对token的ival赋值之后,cval的值就变为了0x01,实际上就没有意义了。
最后,为token的变量dval赋值,此时token所占内存的数据如下图所示。
此时,token所占内存的八个字节都有了相应的值。在对token的dval赋值之后,cval的值变为了0x00,而ivale的值变为了0x00000000,都没有了实际意义,也就是之前提到的未定义状态。
2、 例2:写出下面程序的运算结果
int main() { union EXAMPLE { struct { int x, y; }in; int a, b; }e; e.a = 1; e.b = 2; e.in.x = e.a*e.b; e.in.y = e.a + e.b; printf("%d,%d\n", e.in.x, e.in.y); return 0; //输出为:4,8 }分析:
在union中,所有的共用体成员共用一个空间,并且同一时间只能储存其中一个成员变量的值.
e.a=1;
e.b=2;
//现在e只能存储一个成员变量的值e.b=e.a=2
e.in.x=(e.a)*(e.b); //e里的in成员里的x成员=2*2=4
//现在e只能存储一个成员变量的值e.b=e.a=4
e.in.y=(e.a)+(e.b);//e里的in成员里的y成员=4+4=8
e.a=1;
e.b=2;
//现在e只能存储一个成员变量的值e.b=e.a=2
e.in.x=(e.a)*(e.b); //e里的in成员里的x成员=2*2=4
//现在e只能存储一个成员变量的值e.b=e.a=4
e.in.y=(e.a)+(e.b);//e里的in成员里的y成员=4+4=8
三、访问权限
联合可以为其成员指定public、protected和private等访问权限,默认情况下,其成员的访问权限为public
四、为成员指定长度
联合的存储空间至少能够容纳其最大的数据成员。也可以为联合的成员指定长度。通过冒号操作符来实现成员长度的指定。
union U { unsigned short int aa; struct { unsigned int bb : 7;//(bit 0-6) unsigned int cc : 6;//(bit 7-12) unsigned int dd : 3;//(bit 13-15) }; } u;以上代码定义了一个名为U的联合,并且定义了U的变量u。联合U包含两个成员,一个是unsigned short int类型的变量,其大小为2个字节;另一个是一个自定义结构,该自定义结构中包含了3个unsigned int类型的变量。需要注意的是,每个unsigned int类型的变量的大小并不是默认的4个字节,而是通过冒号操作符指定了其大小,该大小的单位是比特。所以,联合u的大小是2个字节。之后,对联合u中的aa进行赋值:
u.aa = 0xE07F;
此时,联合u所占的内存数据如下图所示。
此时,u.bb所处的位置是0-6比特;u.cc所处的位置是7-12比特;u.dd所处的位置是13-15比特,如下图所示:
四、测试大小端
union的一个用法就是可以用来测试CPU是大端模式还是小端模式:
五、c++中的union
#include <iostream> using namespace std; void checkCPU() { union MyUnion{ int a; char c; }test; test.a = 1; if (test.c == 1) cout << "little endian" <<endl; else cout << "big endian" <<endl; } int main() { checkCPU(); return 0; }
上面总结的union使用法则,在C++中依然适用。如果加入对象呢?
#include <iostream> using namespace std; class CA { int m_a; }; union Test { CA a; double d; }; int main() { return 0; }上面代码运行没有问题。如果在类CA中添加了构造函数,或者添加析构函数,就会发现程序会出现错误。由于union里面的东西共享内存,所以不能定义静态、引用类型的变量。由于在union里也不允许存放带有构造函数、析构函数和复制构造函数等的类的对象,但是可以存放对应的类对象指针。编译器无法保证类的构造函数和析构函数得到正确的调用,由此,就可能出现内存泄漏。所以,在C++中使用union时,尽量保持C语言中使用union的风格,尽量不要让union带有对象。