- 表达式由一个或多个运算对象(operand)组成,对表达式求值将得到一个结果(result)
- 字面值和变量是最简单的表达式(expression),其结果就是字面值和变量的值。把一个运算符(operator)和一个或多个运算对象组合起来可以生成较复杂的表达式
4.1基础
- 有几个基础概念对表达式的求值过程有影响,它们涉及大多数(甚至全部)表达式。本节先简要介绍这几个概念,后面的小节将做更详细的讨论。
4.1.1基本概念
- C++定义了一元运算符和二元运算符。作用于一个运算对象的运算符是一元运算符,如取地址符(&)和解引用符(*);作用于两个运算对象的运算符是二元运算符,如相等运算符(=)和乘法运算符(*)。除此之外,还有一个作用于三个运算对象的三元运算符。
- 函数调用也是一种特殊的运算符,它对运算对象的数量没有限制。
- 一些符号既能作为一元运算符也能作为二元运算符。以符号*为例,作为一元运算符时执行解引用操作,作为二元运算符时执行乘法操作。一个符号到底是一元运算符还是二元运算符由它的上下文决定。对于这类符号来说,它的两种用法互不相干,完全可以当成两个不同的符号。
组合运算符和运算对象
- 对于含有多个运算符的复杂表达式来说,要想理解它的含义首先要理解运算符的优先级(precedence),结合律(associativity)以及运算对象的求值顺序
- 例如,下面这条表达式的求值结果依赖于表达式中运算符和运算对象的组合方式:
- 5+10*20/2;
- 乘法运算符(*)是一个二元运算符,它的运算对象有4种可能:10和20、10和20/2、15和20、15和20/2。下一节将介绍如何理解这样一条表达式。
运算对象转换
- 在表达式求值的过程中,运算对象常常由一种类型转换成另外一种类型。例如,尽管一般的二元运算符都要求两个运算对象的类型相同,但是很多时候即使运算对象的类型不相同也没有关系,只要它们能被转换(参见2.1.2节,第32页)成同一种类型即可。类型转换的规则虽然有点复杂,但大多数都合乎情理、容易理解。例如,整数能转换成浮点数,浮点数也能转换成整数,但是指针不能转换成浮点数。让人稍微有点意外的是,小整数类型(如bool、char,short等)通常会被提升(promoted)成较大的整数类型,主要是int。4.11节(第141页)将详细介绍类型转换的细节。
重载运算符
- C++语言定义了运算符作用于内置类型和复合类型的运算对象时所执行的操作。当运算符作用于类类型的运算对象时,用户可以自行定义其含义。因为这种自定义的过程事实上是为已存在的运算符赋予了另外一层含义,所以称之为重载运算符。IO库的>和<运算符以及string对象、vector对象和迭代器使用的运算符都是重载的运算符。
- 我们使用重载运算符时,其包括运算对象的类型和返回值的类型,都是由该运算符定义的;但是运算对象的个数、运算符的优先级和结合律都是无法改变的。
左值和右值
- C++的表达式要不然是右值,要不然就是左值。这两个名词是从C语言继承过来的,原本是为了帮助记忆:左值可以位于赋值语句的左侧,右值则不能。
- std::move 将右值转化为左值进行计算
- 在C++语言中,二者的区别就没那么简单了。一个左值表达式的求值结果是一个对象或者一个函数,然而以常量对象为代表的某些左值实际上不能作为赋值语句的左侧运算对象。此外,虽然某些表达式的求值结果是对象,但它们是右值而非左值。可以做一个简单的归纳:当一个对象被用作右值的时候,用的是对象的值(内容);当对象被用作左值的时候,用的是对象的身份(在内存中的位置)。
- 不同的运算符对运算对象的要求各不相同,有的需要左值运算对象、有的需要右值运算对象;返回值也有差异,有的得到左值结果、有的得到右值结果。一个重要的原则(参见13.6节,第470页将介绍一种例外的情况)是在需要右值的地方可以用左值来代替,但是不能把右值当成左值(也就是位置)使用。当一个左值被当成右值使用时,实际使用的是它的内容(值)。到目前为止,已经有几种我们熟悉的运算符是要用到左值的。
- 赋值运算符需要一个(非常量)左值作为其左侧运算对象,得到的结果也仍然是一个左值。
- 取地址符(参见2.3.2节,第47页)作用于一个左值运算对象,返回一个指向该运算对象的指针,这个指针是一个右值。
- 内置解引用运算符、下标运算符(参见2.3.2节,第48页;参见3.5.2节,第104页)、迭代器解引用运算符、string和vector的下标运算符(参见341节,第95页;参见3.2.3节,第83页;参见3.3.3节,第91页)的求值结果都是左值。
- 内置类型和迭代器的递增递减运算符(参见1.4.1节,第11页:参见3.4.1节,第96页)作用于左值运算对象,其前置版本(本书之前章节所用的形式)所得的结果也是左值。
- 接下来在介绍运算符的时候,我们将会注明该运算符的运算对象是否必须是左值以及其求值结果是否是左值。
- 使用关键字decltype(参见2.5.3节,第62页)的时候,左值和右值也有所不同。如果表达式的求值结果是左值,decltype作用于该表达式(不是变量)得到一个引用类。举个例子,假定p的类型是int*,因为解引用运算符生成左值,所以decltype(*p)的结果是int&。另一方面,因为取地址运算符生成右值,所以decltype(&p)的结果是int**,也就是说,结果是一个指向整型指针的指针。
4.1.2优先级与结合律
- 复合表达式(compoundexpression)是指含有两个或多个运算符的表达式。求复合表达式的值需要首先将运算符和运算对象合理地组合在一起,优先级与结合律决定了运算对象组合的方式。也就是说,它们决定了表达式中每个运算符对应的运算对象来自表达式的哪一部分。表达式中的括号无视上述规则,程序员可以使用括号将表达式的某个局部括起来使其得到优先运算。
- 一般来说,表达式最终的值依赖于其子表达式的组合方式。高优先级运算符的运算对象要比低优先级运算符的运算对象更为紧密地组合在一起。如果优先级相同,则其组合规则由结合律确定。例如,乘法和除法的优先级相同且都高于加法的优先级。因此,乘法和除法的运算对象会首先组合在一起,然后才能轮到加法和减法的运算对象。算术运算符满足左结合律,意味着如果运算符的优先级相同,将按照从左向右的顺序组合运算对象:
- 根据运算符的优先级,表达式3+4*5的值是2 3 ,不是35。
- 根据运算符的结合律,表达式20 -1 5 -3 的值是2 , 不是8。
括号无视优先级与结合律
- 括号无视普通的组合规则,表达式中括号括起来的部分被当成一个单元来求值,然后再与其他部分一起按照优先级组合。例如,对上面这条表达式按照不同方式加上括号就能得到4种不同的结果:
先级与结合律有何影响
- 由前面的例子可以看出,优先级会影响程序的正确性,这一点在3.5.3节(第107页)介绍的解引用和指针运算中也有所体现:
- 如果想访问ia+4位置的元素,那么加法运算两端的括号必不可少。一旦去掉这对括号,*ia就会首先组合在一起,然后4再与*ia的值相加。结合律对表达式产生影响的一个典型示例是输入输出运算,4.8节(第138页)将要介绍IO相关的运算符满足左结合律。这一规则意味着我们可以把几个IO运算组合在一条表达式当中:
- cin>>vl>>v2;//先读入vl,再读入v2
- 4.12节(第147页)罗列出了全部的运算符,并用双横线将它们分割成若干组。同一组内的运算符优先级相同,组的位置越靠前组内的运算符优先级越高。例如,前置递增运算符和解引用运算符的优先级相同并且都比算术运算符的优先级高。表中同样列出了每个运算符在哪一页有详细的描述,有些运算符之前已经使用过了,大多数运算符的细节将在本章剩余部分逐一介绍,还有几个运算符将在后面的内容中提及。
4.1.3求值顺序
- 优先级规定了运算对象的组合方式,但是没有说明运算对象按照什么顺序求值。在大多数情况下,不会明确指定求值的顺序。对于如下的表达式inti=fl()*f2();我们知道fl和f2-定会在执行乘法之前被调用,因为毕竟相乘的是这两个函数的返回值。但是我们无法知道到底fl在f2之前调用还是f2在fl之前调用。对于那些没有指定执行顺序的运算符来说,如果表达式指向并修改了同一个对象,将会引发错误并产生未定义的行为(参见2.1.2节,第33页)。举个简单的例子,<<运算符没有明确规定何时以及如何对运算对象求值,因此下面的输出表达式是未定义的:
- inti=0;cout « i << " ” << ++i << endl; // 未定义的
- 因为程序是未定义的,所以我们无法推断它的行为。编译器可能先求++i的值再求i的值,此时输出结果是11;也可能先求i的值再求++i的值,输出结果是01;甚至编译器还可能做完全不同的操作。因为此表达式的行为不可预知,因此不论编译器生成什么样的代码程序都是错误的。
- 有4种运算符明确规定了运算对象的求值顺序。第一种是323节(第85页)提到的逻辑与(&&)运算符,它规定先求左侧运算对象的值,只有当左侧运算对象的值为真时才继续求右侧运算对象的值。另外三种分别是逻辑或(||)运算符(参见4.3节,第126页)、条件(?:)运算符(参见4.7节,第134页)和逗号(,)运算符(参见4.10节,第140页)。
求值顺序、优先级、结合律
- 运算对象的求值顺序与优先级和结合律无关,在一条形如f()+g()*h()+j()的表达式中:
- 优先级规定,g()的返回值和h()的返回值相乘。
- 结合律规定,f()的返回值先与g()和h()的乘积相加,所得结果再与j()的返回值相加。
- 对于这些函数的调用顺序没有明确规定。如果f、g、h和j是无关函数,它们既不会改变同一对象的状态也不执行IO任务,那么函数的调用顺序不受限制。反之,如果其中某几个函数影响同一对象,则它是一条错误的表达式,将产生未定义的行为。
注意事项
- 1,拿不准的时候最好用括号来强制让表达式的组合关系符合程序逻辑的要求。
- 2,如果改变了某个运算对象的值,在表达式的其他地方不要再使用这个运算对象。
- 第2条规则有一个重要例外,当改变运算对象的子表达式本身就是另外一个子表达式的运算对象时该规则无效。例如,在表达式*++iter中,递增运算符改变iter的值,iter(已经改变)的值又是解引用运算符的运算对象。此时(或类似的情况下),求值的顺序不会成为问题,因为递增运算(即改变运算对象的子表达式)必须先求值,然后才轮到解引用运算。显然,这是一种很常见的用法,不会造成什么问题。先求值再解引用
4 . 2 算术运算符
- 表4.1(以及后面章节的运算符表)按照运算符的优先级将其分组。一元运算符的优先级最高,接下来是乘法和除法,优先级最低的是加法和减法。优先级高的运算符比优先级低的运算符组合得更紧密。上面的所有运算符都满足左结合律,意味着当优先级相同时按照从左向右的顺序进行组合。除非另做特殊说明,算术运算符都能作用于任意算术类型(参见2.1.1节,第30页)以及任意能转换为算术类型的类型。算术运算符的运算对象和求值结果都是右值。如4.11节(第141页)描述的那样,在表达式求值之前,小整数类型的运算对象被提升成较大的整数类型,所有运算对象最终会转换成同一类型。
- 一元正号运算符、加法运算符和减法运算符都能作用于指针。3.5.3节(第106页)已经介绍过二元加法和减法运算符作用于指针的情况。当一元正号运算符作用于一个指针或者算术值时,返回运算对象值的一个(提升后的)副本。一元负号运算符对运算对象值取负后,返回其(提升后的)副本:
- 在2.1.1节(第31页),我们指出布尔值不应该参与运算,-b就是一个很好的例子。对大多数运算符来说,布尔类型的运算对象将被提升为int类型。如上所示,布尔变量b的值为真,参与运算时将被提升成整数值1(参见2.1.2节,第32页),对它求负后的结果是-1。将-1再转换回布尔值并将其作为b2的初始值,显然这个初始值不等于0,转换成布尔值后应该为1。所以,b2的值是真!
- 整数相除结果还是整数,也就是说,如果商含有小数部分,直接弃除
- 运算符%俗称“取余”或 “取模”运算符,负责计算两个整数相除所得的余数,参与取余运算的运算对象必须是整数类型
- C++11新标准则规定商一律向0取整(即直接切除小数部分)
4 .3 逻辑和关系运算符
- 关系运算符作用于算术类型或指针类型,逻辑运算符作用于任意能转换成布尔值的类型。逻辑运算符和关系运算符的返回值都是布尔类型。值为0的运算对象(算术类型或指针类型)表示假,否则表示真。对于这两类运算符来说,运算对象和求值结果都是右值
逻辑与和逻辑或运算符
- 对于逻辑与运算符(&&)来说,当且仅当两个运算对象都为真时结果为真;对于逻辑或运算符(||)来说,只要两个运算对象中的一个为真结果就为真。逻辑与运算符和逻辑或运算符都是先求左侧运算对象的值再求右侧运算对象的值,当且仅当左侧运算对象无法确定表达式的结果时才会计算右侧运算对象的值。这种策略称为短路求值(short-circuitevaluation)
- 对于逻辑与运算符来说,当且仅当左侧运算对象为真时才对右侧运算对象求值。
- 对于逻辑或运算符来说,当且仅当左侧运算对象为假时才对右侧运算对象求值
- 第3章中的几个程序用到了逻辑与运算符,它们的左侧运算对象是为了确保右侧运算对象求值过程的正确性和安全性。例如85页的循环条件:
- index!=s.size()&&!isspace(s[index])
- 首先检查index是否到达string对象的末尾,以此确保只有当index在合理范围之内时才会计算右侧运算对象的值。
- 举一个使用逻辑或运算符的例子,假定有一个存储着若干string对象的vector对象,要求输出string对象的内容并且在遇到空字符串或者以句号结束的字符串时进行换行。使用基于范围的for循环(参见3.2.3节,第81页)处理string对象中的每个元素:
- 输出当前元素后检查是否需要换行。if语句的条件部分首先检查S是否是一个空string,如果是,则不论右侧运算对象的值如何都应该换行。只有当string对象非空时才需要求第二个运算对象的值,也就是检查string对象是否是以句号结束的。在这条表达式中,利用逻辑或运算符的短路求值策略确保只有当s非空时才会用下标运算符去访问它。
- 值得注意的是,s被声明成了对常量的引用(参见2.5.2节,第61页)。因为text的元素是string对象,可能非常大,所以将s声明成引用类型可以避免对元素的拷贝;又因为不需要对string对象做写操作,所以s被声明成对常量的引用。
逻辑非运算符
- 逻辑非运算符(!)将运算对象的值取反后返回,之前我们曾经在3.2.2节(第79页)使用过这个运算符。下面再举一个例子,假设vec是一个整数类型的vector对象,可以使用逻辑非运算符将empty函数的返回值取反从而检查vec是否含有元素:
关系运算符
- 顾名思义,关系运算符比较运算对象的大小关系并返回布尔值。关系运算符都满足左结合律。
- 因为关系运算符的求值结果是布尔值,所以将几个关系运算符连写在一起会产生意想不到的结果:
- 但是这种写法存在两个问题:首先,与之前的代码相比,上面这种写法较长而且不太直接(尽管大家都认为缩写的形式对初学者来说有点难理解);更重要的一点是,如果val不是布尔值,这样的比较就失去了原来的意义。
- 如果val不是布尔值,那么进行比较之前会首先把true转换成val的类型。也就是说,如果val不是布尔值,则代码可以改写成如下形式:if(val==1){/*...*/}
- 正如我们已经非常熟悉的那样,当布尔值转换成其他算术类型时,false转换成0而true转换成1(参见2.1.2节,第32页)。如果真想知道val的值是否是1,应该直接写出1这个数值来,而不要与true比较。
- 进行比较运算时除非比较的对象是布尔类型,否则不要使用布尔字面值true 和 false作为运算对象。
4 . 4 赋值运算符
- 赋值运算的结果是它的左侧运算对象,并且是一个左值。相应的,结果的类型就是左侧运算对象的类型。如果赋值运算符的左右两个运算对象类型不同,则右侧运算对象将转换成左侧运算对象的类型:
- 如果左侧运算对象是内置类型,那么初始值列表最多只能包含一个值,而且该值即使转换的话其所占空间也不应该大于目标类型的空间(参见2.2.1节,第39页)。
- 对于类类型来说,赋值运算的细节由类本身决定。对于vector来说,vector模板重载了赋值运算符并且可以接收初始值列表,当赋值发生时用右侧运算对象的元素替换左侧运算对象的元素。无论左侧运算对象的类型是什么,初始值列表都可以为空。此时,编译器创建一个值初始化(参见3.3.1节,第88页)的临时量并将其赋给左侧运算对象。
赋值运算满足右结合律
- 赋值运算符满足右结合律,这一点与其他二元运算符不太一样:
- int ival, jval; ival = jval = 0; / / 正确:都被赋值为0
- 因为赋值运算符满足右结合律,所以靠右的赋值运算jval=0作为靠左的赋值运算符的右侧运算对象。又因为赋值运算返回的是其左侧运算对象,所以靠右的赋值运算的结果(即jval)被赋给了ival。对于多重赋值语句中的每一个对象,它的类型或者与右边对象的类型相同、或者可由右边对象的类型转换得到(参见4.11节,第141页):
- 因为ival和pval的类型不同,而且pval的类型(int*)无法转换成ival的类型(int),所以尽管这个值能赋给任何对象,但是第一条赋值语句仍然是非法的。与之相反,第二条赋值语句是合法的。这是因为字符串字面值可以转换成string对象并赋给s2,而s2和si的类型相同,所以s2的值可以继续赋给si。
赋值运算优先级较低
- 赋值语句经常会出现在条件当中。因为赋值运算的优先级相对较低,所以通常需要给赋值部分加上括号使其符合我们的原意。下面这个循环说明了把赋值语句放在条件当中有什么用处,它的目的是反复调用一个函数直到返回期望的值(比如42)为止:
- 这个版本的while条件更容易表达我们的真实意图:不断循环读取数据直至遇到42为止。其处理过程是首先将get_value函数的返回值赋给i,然后比较i和42是否相等。如果不加括号的话含义会有很大变化,比较运算符!=的运算对象将是get_value函数的返回值及42,比较的结果不论真假将以布尔值的形式赋值给i,这显然不是我们期望的结果。
- 因为赋值运算符的优先级低于关系运算符的优先级,所以在条件语句中,赋值部分通常应该加上括号。
复合赋值运算符
- 唯一的区别是左侧运算对象的求值次数:使用复合运算符只求值一次,使用普通的运算符则求值两次。这两次包括:一次是作为右边子表达式的一部分求值,另一次是作为赋值运算的左侧运算对象求值。其实在很多地方,这种区别除了对程序性能有些许影响外几乎可以忽略不计。
4 .5 递增和递减运算符
- 递增运算符(++)和递减运算符(一)为对象的加1和减1操作提供了一种简洁的书写形式。这两个运算符还可应用于迭代器,因为很多迭代器本身不支持算术运算,所以此时递增和递减运算符除了书写简洁外还是必须的。递增和递减运算符有两种形式:前置版本和后置版本。到目前为止,本书使用的都是前置版本,这种形式的运算符首先将运算对象加1(或减1),然后将改变后的对象作为求值结果。后置版本也会将运算对象加1(或减1),但是求值结果是运算对象改变之前那个值的副本:
- 这两种运算符必须作用于左值运算对象。前置版本将对象本身作为左值返回,后置版本则将对象原始值的副本作为右值返回。
在一条语句中混用解引用和递增运算符
- 如果我们想在一条复合表达式中既将变量加1或减1又能使用它原来的值,这时就可以使用递增和递减运算符的后置版本。
- 举个例子,可以使用后置的递增运算符来控制循环输出一个vector对象内容直至遇到(但不包括)第一个负值为止:
- 对于刚接触C++和C的程序员来说,*pbeg++不太容易理解。其实这种写法非常普遍,所以程序员一定要理解其含义。
- 后置递增运算符的优先级高于解引用运算符,因此*pbeg++等价于*(pbeg++)。pbeg++把pbeg的值加1,然后返回pbeg的初始值的副本作为其求值结果,此时解引用运算符的运算对象是pbeg未增加之前的值。最终,这条语句输出pbeg开始时指向的那个元素,并将指针向前移动一个位置。
- 这种用法完全是基于一个事实,即后置递增运算符返回初始的未加1的值。如果返回的是加1之后的值,解引用该值将产生错误的结果。不但无法输出第一个元素,而且更糟糕的是如果序列中没有负值,程序将可能试图解引用一个根本不存在的元素。
运算对象可按任意顺序求值
- 大多数运算符都没有规定运算对象的求值顺序(参见4.1.3节,第123页),这在一般情况下不会有什么影响。然而,如果一条子表达式改变了某个运算对象的值,另一条子表达式又要使用该值的话,运算对象的求值顺序就很关键了。因为递增运算符和递减运算符会改变运算对象的值,所以要提防在复合表达式中错用这两个运算符。
- 为了说明这一问题,我们将重写3.4.1节(第97页)的程序,该程序使用for循环将输入的第一个单词改成大写形式:
4.6成员访问运算符
- 点运算符(参见1.5.2节,第21页)和箭头运算符(参见3.4.1节,第98页)都可用于访问成员,其中,点运算符获取类对象的一个成员;箭头运算符与点运算符有关,表达
- 因为解引用运算符的优先级低于点运算符,所以执行解引用运算的子表达式两端必须加上括号。如果没加括号,代码的含义就大不相同了:
- / / 运 行 p 的 size成员,然后解引用size的结果
- *p.size() ; / / 错误:p 是一个指针,它没有名为size的成员
- 这条表达式试图访问对象P的size成员,但是p本身是一个指针且不包含任何成员,所以上述语句无法通过编译。箭头运算符作用于一个指针类型的运算对象,结果是一个左值。点运算符分成两种情况:如果成员所属的对象是左值,那么结果是左值;反之,如果成员所属的对象是右值,那么结果是右值。