C++从零开始（四）——赋值操作符

本篇是《C++从零开始（二）》的延续，说明《C++从零开始（二）》中遗留下来的关于表达式的内容，并为下篇指针的运用做一点铺垫。虽然上篇已经说明了变量是什么，但对于变量最关键的东西却由于篇幅限制而没有说明，下面先说明如何访问内存。

赋值语句

前面已经说明，要访问内存，就需要相应的地址以表明访问哪块内存，而变量是一个映射，因此变量名就相当于一个地址。对于内存的操作，在一般情况下就只有读取内存中的数值和将数值写入内存（不考虑分配和释放内存），在C++中，为了将一数值写入某变量对应的地址所标识的内存中（出于简便，以后称变量a对应的地址为变量a的地址，而直接称变量a的地址所标识的内存为变量a），只需先书写变量名，后接“=”，再接欲写入的数字（关于数字，请参考《C++从零开始（二）》）以及分号。如下：

a = 10.0f； b = 34；

由于接的是数字，因此就可以接表达式并由编译器生成计算相应表达式所需的代码，也就可如下：

c = a / b * 120.4f；

上句编译器将会生成进行除法和乘法计算的CPU指令，在计算完毕后（也就是求得表达式a / b * 120.4f的值了后），也会同时生成将计算结果放到变量c中去的CPU指令，这就是语句的基本作用（对于语句，在《C++从零开始（六）》中会详细说明）。

上面在书写赋值语句时，应该确保此语句之前已经将使用到的变量定义过，这样编译器才能在生成赋值用的CPU指令时查找到相应变量的地址，进而完成CPU指令的生成。如上面的a和b，就需要在书写上面语句前先书写类似下面的变量定义：

float a； long b；

直接书写变量名也是一条语句，其导致编译器生成一条读取相应变量的内容的语句。即可以如下书写：

a；

上面将生成一条读取内存的语句，即使从内存中读出来的数字没有任何应用（当然，如果编译器开了优化选项，则上面的语句将不会生成任何代码）。从这一点以及上面的c = a / b * 120.4f；语句中，都可以看出一点——变量是可以返回数字的。而变量返回的数字就是按照变量的类型来解释变量对应内存中的内容所得到的数字。这句话也许不是那么容易理解，在看过后面的类型转换一节后应该就可以理解了。

因此为了将数据写入一块内存，使用赋值语句（即等号）；要读取一块内存，书写标识内存的变量名。所以就可以这样书写：a = a + 3；

假设a原来的值为1，则上面的赋值语句将a的值取出来，加上3，得到结果4，将4再写入a中去。由于C++使用“=”来代表赋值语句，很容易使人和数学中的等号混淆起来，这点应注意。

而如上的float a；语句，当还未对变量进行任何赋值操作时，a的值是什么？上帝才知道。当时的a的内容是什么（对于VC编译器，在开启了调试选项时，将会用0xCCCCCCCC填充这些未初始化内存），就用IEEE的real*4格式来解释它并得到相应的一个数字，也就是a的值。因此应在变量定义的时候就进行赋值（但是会有性能上的影响，不过很小），以初始化变量而防止出现莫名其妙的值，如：float a = 0.0f；。

赋值操作符

上面的a = a + 3；的意思就是让a的值增加3.在C++中，对于这种情况给出了一种简写方案，即前面的语句可以写成：a += 3；。应当注意这两条语句从逻辑上讲都是使变量a的值增3，但是它们实际是有区别的，后者可以被编译成优化的代码，因为其意思是使某一块内存的值增加一定数量，而前者是将一个数字写入到某块内存中。所以如果可能，应尽量使用后者，即a += 3；。这种语句可以让编译器进行一定的优化（但由于现在的编译器都非常智能，能够发现a = a + 3；是对一块内存的增值操作而不是一块内存的赋值操作，因此上面两条语句实际上可以认为完全相同，仅仅只具有简写的功能了）。

对于上面的情况，也可以应用在减法、乘法等二元非逻辑操作符（不是逻辑值操作符，即不能a &&= 3；）上，如：a *= 3； a -= 4； a |= 34； a >>= 3；等。

除了上面的简写外，C++还提供了一种简写方式，即a++；，其逻辑上等同于a += 1；。同上，在电脑编程中，加一和减一是经常用到的，因此CPU专门提供了两条指令来进行加一和减一操作（转成汇编语言就是Inc和Dec），但速度比直接通过加法或减法指令来执行要快得多。为此C++中也就提供了“++”和“—”操作符来对应Inc和Dec.所以a++；虽然逻辑上和a = a + 1；等效，实际由于编译器可能做出的优化处理而不同，但还是如上，由于编译器的智能化，其是有可能看出a = a + 1；可以编译成Inc指令进而即使没有使用a++；却也依然可以得到优化的代码，这样a++；将只剩下简写的意义而已。

应当注意一点，a = 3；这句语句也将返回一个数字，也就是在a被赋完值后a的值。由于其可以返回数字，按照《C++从零开始（二）》中所说，“=”就属于操作符，也就可以如下书写：

c = 4 + （ a = 3 ）；

之所以打括号是因为“=”的优先级较“+”低，而更常见和正常的应用是：c = a = 3；

应该注意上面并不是将c和a赋值为3，而是在a被赋值为3后再将a赋值给c，虽然最后结果和c、a都赋值为3是一样的，但不应该这样理解。由于a++；表示的就是a += 1；就是a = a + 1；，因此a++；也将返回一个数字。也由于这个原因，C++又提供了另一个简写方式，++a；。

假设a为1，则a++；将先返回a的值，1，然后再将a的值加一；而++a；先将a的值加一，再返回a的值，2.而a—和—a也是如此，只不过是减一罢了。

上面的变量a按照最上面的变量定义，是float类型的变量，对它使用++操作符并不能得到预想的优化，因为float类型是浮点类型，其是使用IEEE的real*4格式来表示数字的，而不是二进制原码或补码，而前面提到的Inc和Dec指令都是出于二进制的表示优点来进行快速增一和减一，所以如果对浮点类型的变量运用“++”操作符，将完全只是简写，没有任何的优化效果（当然，如果CPU提供了新的指令集，如MMX等，以对real*4格式进行快速增一和减一操作，且编译器支持相应指令集，则还是可以产生优化效果的）。

赋值操作符的返回值

在进一步了解++a和a++的区别前，先来了解何谓操作符的计算（Evaluate）。操作符就是将给定的数字做一些处理，然后返回一个数字。而操作符的计算也就是执行操作符的处理，并返回值。前面已经知道，操作符是个符号，其一侧或两侧都可以接数字，也就是再接其他操作符，而又由于赋值操作符也属于一种操作符，因此操作符的执行顺序变得相当重要。

对于a + b + c，将先执行a + b，再执行（ a + b ） + c的操作。你可能觉得没什么，那么如下，假设a之前为1：

c = （ a *= 2 ） + （ a += 3 ）；

上句执行后a为5.而c = （ a += 3 ） + （ a *= 2 ）；执行后，a就是8了。那么c呢？结果可能会大大的出乎你的意料。前者的c为10，而后者的c为16.

上面其实是一个障眼法，其中的“+”没有任何意义，即之所以会从左向右执行并不是因为“+”的缘故，而是因为（ a *= 2 ）和（ a += 3 ）的优先级相同，而按照“（）”的计算顺序，是从左向右来计算的。但为什么c的值不是预想的2 + 5和4 + 8呢？因为赋值操作符的返回值的关系。

赋值操作符返回的数字不是变量的值，而是变量对应的地址。这很重要。前面说过，光写一个变量名就会返回相应变量的值，那是因为变量是一个映射，变量名就等同于一个地址。C++中将数字看作一个很特殊的操作符，即任何一个数字都是一个操作符。而地址就和长整型、单精度浮点数这类一样，是数字的一种类型。当一个数字是地址类型时，作为操作符，其没有要操作的数字，仅仅返回将此数字看作地址而标识的内存中的内容（用这个地址的类型来解释）。地址可以通过多种途径得到，如上面光写一个变量名就可以得到其对应的地址，而得到的地址的类型也就是相应的变量的类型。如果这句话不能理解，在看过下面的类型转换一节后应该就能了解了。

所以前面的c = （ a += 3 ） + （ a *= 2 ）；，由于“（）”的参与改变了优先级而先执行了两个赋值操作符，然后两个赋值操作符都返回a的地址，然后计算“+”的值，分别计算两边的数字——a的地址（a的地址也是一个操作符），也就是已经执行过两次赋值操作的a的值，得8，故最后的c为16.而另一个也由于同样的原因使得c为10.

现在考虑操作符的计算顺序。当同时出现了几个优先级相同的操作符时，不同的操作符具有不同的计算顺序。前面的“（）”以及“-”、“*”等这类二元操作符的计算顺序都是从左向右计算，而“！”、负号“-”等前面介绍过的一元操作符都是从右向左计算的，如：！-！！a；，假设a为3.先计算从左朝右数第三个“！”的值，导致计算a的地址的值，得3；然后逻辑取反得0，接着再计算第二个“！”的值，逻辑取反后得1，再计算负号“-”的值，得-1，最后计算第一个“！”的值，得0.

赋值操作符都是从右向左计算的，除了后缀“++”和后缀“—”（即上面的a++和a——）。因此上面的c = a = 3；，因为两个“=”优先级相同，从右向左计算，先计算a = 3的值，返回a对应的地址，然后计算返回的地址而得到值3，再计算c = （ a = 3 ），将3写入c.而不是从左向右计算，即先计算c = a，返回c的地址，然后再计算第二个“=”，将3写入c，这样a就没有被赋值而出现问题。又：

a = 1； c = 2； c *= a += 4；

由于“*=”和“+=”的优先级相同，从右向左计算先计算a += 4，得a为5，然后返回a的地址，再计算a的地址得a的值5，计算“*=”以使得c的值为10.

因此按照前面所说，++a将返回a的地址，而a++也因为是赋值操作符而必须返回一个地址，但很明显地不能是a的地址了，因此编译器将编写代码以从栈中分配一块和a同样大小的内存，并将a的值复制到这块临时内存中，然后返回这块临时内存的地址。由于这块临时内存是因为编译器的需要而分配的，与程序员完全没有关系，因此程序员是不应该也不能写这块临时内存的（因为编译器负责编译代码，如果程序员欲访问这块内存，编译器将报错），但可以读取它的值，这也是返回地址的主要目的。所以如下的语句没有问题：

（ ++a ） = a += 34；

但（ a++ ） = a += 34；就会在编译时报错，因为a++返回的地址所标识的内存只能由编译器负责处理，程序员只能获得其值而已。a++的意思是先返回a的值，也就是上面说的临时内存的地址，然后再将变量的值加一。如果同时出现多个a++，那么每个a++都需要分配一块临时内存（注意前面c = （ a += 3 ） + （ a *= 2 ）；的说明），那么将有点糟糕，而且a++的意思是先返回a的值，那么到底是什么时候的a的值呢？在VC中，当表达式中出现后缀“++”或后缀“—”时，只分配一块临时内存，然后所有的后缀“++”或后缀“—”都返回这个临时内存的地址，然后在所有的可以计算的其他操作符的值计算完毕后，再将对应变量的值写入到临时内存中，计算表达式的值，最后将对应变量的值加一或减一。

因此：a = 1； c = （ a++ ） + （ a++ ）；执行后，c的值为2，而a的值为3.而如下：

a = 1； b = 1； c = （ ++a ） + （ a++ ） + （ b *= a++ ） + （ a *= 2 ） + （ a *= a++ ）；

执行时，先分配临时内存，然后由于5个“（）”，其计算顺序是从左向右，

计算++a的值，返回增一后的a的地址，a的值为2

计算a++的值，返回临时内存的地址，a的值仍为2

计算b *= a++中的a++，返回临时内存的地址，a的值仍为2

计算b *= a++中的“*=”，将a的值写入临时内存，计算得b的值为2，返回b的地址

计算a *= 2的值，返回a的地址，a的值为4

计算a *= a++中的a++，返回临时内存的地址，a的值仍为4

计算a *= a++中的“*=”，将a的值写入临时内存，返回a的地址，a的值为16

计算剩下的“+”，为了进行计算，将a的值写入临时内存，得值16 + 16 + 2 + 16 + 16为66，写入c中

计算三个a++欠下的加一，a最后变为19.

上面说了那么多，无非只是想告诫你——在表达式中运用赋值操作符是不被推崇的。因为其不符合平常的数学表达式的习惯，且计算顺序很容易搞混。如果有多个“++”操作符，最好还是将表达式分开，否则很容易导致错误的计算顺序而计算错误。并且导致计算顺序混乱的还不止上面的a++就完了，为了让你更加地重视前面的红字，下面将介绍更令人火大的东西，如果你已经同意上面的红字，则下面这一节完全可以跳过，其对编程来讲可以认为根本没有任何意义（要不是为了写这篇文章，我都不知道它的存在）。

共2页首页上一页 1 2 下一页尾页跳转到页

上一篇：C++从零开始（五）——何谓指针下一篇：C++从零开始（三）——何谓变量