3.4迭代器介绍
- 我们已经知道可以使用下标运算符来访问string对象的字符或vector对象的元素,还有另外一种更通用的机制也可以实现同样的目的,这就是迭代器(iterator)。在第II部分中将要介绍,除了vector之外,标准库还定义了其他几种容器。所有标准库容器都可以使用迭代器,但是其中只有少数几种才同时支持下标运算符。严格来说,string对象不属于容器类型,但是string支持很多与容器类型类似的操作。vector支持下标运算符,这点和string-样;string支持迭代器,这也和vector是一样的。类似于指针类型(参见2.3.2节,第47页),迭代器也提供了对对象的间接访问。就迭代器而言,其对象是容器中的元素或者string对象中的字符。使用迭代器可以访问某个元素,迭代器也能从一个元素移动到另外一个元素。迭代器有有效和无效之分,这一点和指针差不多。有效的迭代器或者指向某个元素,或者指向容器中尾元素的下一位置:其他所有情况都属于无效。
3.4.1使用迭代器
- 和指针不一样的是,获取迭代器不是使用取地址符,有迭代器的类型同时拥有返回迭代器的成员。比如,这些类型都拥有名为begin和end的成员,其中begin成员负责返回指向第一个元素(或第一个字符)的迭代器。如有下述语句:
- / / 由编译器决定b 和 e 的类型;参见2.5.2节 (第 61页 )
- // b 表示v 的第一个元素,e 表示v 尾元素的下一位置
- auto b = v.begin () , e = v.end () ; //b 和 e 的类型相同
- end成员则负责返回指向容器(或string对象)“尾元素的下一位置(onepasttheend)”的迭代器,也就是说,该迭代器指示的是容器的一个本不存在的“尾后(offtheend)”元素。这样的迭代器没什么实际含义,仅是个标记而已,表示我们已经处理完了容器中的所有元素。end成员返旧]的迭代器常被称作尾后迭代器(off^the-enditerator)或者简称为尾迭代器(enditerator特殊情况下如果容器为空,则begin和end返回的是同一个迭代器。
- 如果容器为空,则begin和 end返回的是同一个迭代器,都是尾后迭代器。
- 一般来说,我们不清楚(不在意)迭代器准确的类型到底是什么。在上面的例子中,使用auto关键字定义变量b 和 e (参见2.5.2节,第 61页),这两个变量的类型也就是 begin 和 end的返回值类型,第 97页将对相关内容做更详细的介绍。
迭代器运算符
- 表3.6列举了迭代器支持的一些运算。使用==和=来比较两个合法的迭代器是否相等,如果两个迭代器指向的元素相同或者都是同一个容器的尾后迭代器,则它们相等;否则就说这两个迭代器不相等
- iter->mem 等效于 (*item).mem
- 指针类似,也能通过解引用迭代器来获取它所指示的元素,执行解引用的迭代器必须合法并确实指示着某个元素(参见2.3.2节,第48页)。试图解引用一个非法迭代器或者尾后迭代器都是未被定义的行为。举个例子,3.2.3节(第84页)中的程序利用下标运算符把string对象的第一个字母改为了大写形式,下面利用迭代器实现同样的功能:
- 本例和原来的程序一样,首先检查S 是否为空,显然通过检查begin和 end返回的结果 是否一致就能做到这一点。如果返回的结果一样,说明s为空;如果返回的结果不一样, 说明s不为空,此时s 中至少包含一个字符。 我们在if内部,声明了一个迭代器变量it并把begin返回的结果赋给它,这样就得到了指示s 中第一个字符的迭代器,接下来通过解引用运算符将第一个字符更改为大写 形式。
将迭代器从一个元素移动到另外一个元素
- 迭代器使用递增(++)运算符(参见1.4.1节,第11页)来从一个元素移动到下一个元素。从逻辑上来说,迭代器的递增和整数的递增类似,整数的递增是在整数值上“加1”,迭代器的递增则是将迭代器“向前移动一个位置”。
- 因为end返回的迭代器并不实际指示某个元素,所以不能对其进行递增或解 引用的操作
- 和 3.2.3节 (第 84页)的那个程序一样,上面的循环也是遍历s 的字符直到遇到空白字符 为止,只不过之前的程序用的是下标运算符,现在这个程序用的是迭代器。
- 循环首先用s .begin的返回值来初始化it,意味着it指示的是s 中的第一个字符 (如果有的话)。条件部分检查是否已到达s 的尾部,如果尚未到达,则将it解引用的结果传入isspace函数检查是否遇到了空白。每次迭代的最后,执行++it令迭代器平移 一个位置以访问s 的下一个字符。 循环体内部和上一个程序if语句内的最后一句话一样,先解引用it,然后将结果传入 toupper函数得到该字母对应的大写形式,再把这个大写字母重新赋值给it所指示的字符。
- for循环 使用 != 进行比较,<这个支持的没有!= 广泛
迭代器类型
- 就像不知道string和vector的size_type成员(参见3.2.2节,第79页)到底是什么类型一样,一般来说我们也不知道(其实是无须知道)迭代器的精确类型。而实际上,
那些拥有迭代器的标准库类型使用iterator和const_iterator来表示迭代器的类型: - iterator 参考链接
- const_iterator和常量指针(参见2.4.2节,第56页)差不多,能读取但不能修改它所指的元素值。相反iterator的对象可读可写。如果vector对象或string对象是-个常量,只能使用const_iterator;如果vector对象或string对象不是常量,那么既能使用iterator也能使用const_iterator
begin和end运算符
- begin和end返回的具体类型由对象是否是常量决定,如果对象是常量,begin和end返回const_iterator;如果对象不是常量,返回iterator:
- vector<int>v;
- 有时候这种默认的行为并非我们所要。在6.2.3节(第191页)中将会看到,如果对象只需读操作而无须写操作的话最好使用常量类型(比如const_iterator)。为了便于专门得到const_iterator类型的返回值,C++11新标准引入了两个新函数,分别是cbegin和cend:
- auto it3 = v . cbegin () ; // it3 的类型是 vector<int>: : const_iterator
- 类似于begin和end,上述两个新函数也分别返回指示容器第一个元素或最后元素下一位置的迭代器。有所不同的是,不论vector对象(或string对象)本身是否是常量,返回值是const_iterator
结合解引用和成员访问操作
- 解引用迭代器可获得迭代器所指的对象,如果该对象的类型恰好是类,就有可能希望进一步访问它的成员。例如,对于一个由字符串组成的vector对象来说,要想检查其元素是否为空,令it是该vector对象的迭代器,只需检查it所指字符串是否为空就可以了,其代码如下所示:
- (*it).empty()
- 注意,(*it).empty()中的圆括号必不可少,具体原因将在4.1.2节(第121页)介绍,该表达式的含义是先对it解引用,然后解引用的结果再执行点运算符(参见1.5.2节,第20页)。如果不加圆括号,点运算符将由it来执行,而非it解引用的结果:
- 上面第二个表达式的含义是从名为it的对象中寻找其em pty成员,显然it是一个迭代 器,它没有哪个成员是叫empty的,所以第二个表达式将发生错误。
- 为了简化上述表达式,C++语言定义了箭头运算符(->)箭头运算符把解引用和成员访问两个操作结合在一起,也就是说,it->mem和表达的意思相同。例如,假设用一个名为text的字符串向量存放文本文件中的数据,其中的元素或者是一句话或者是一个用于表示段落分隔的空字符串。如果要输出text中第一段的内容,可以利用迭代器写一个循环令其遍历text,直到遇到空字符串的元素为止:
- 我们首先初始化it令其指向text的第-个元素,循环重复执行直至处理完了text的所有元素或者发现某个元素为空。每次迭代时只要发现还有元素并且尚未遇到空元素,就输出当前正在处理的元素。值得注意的是,因为循环从头到尾只是读取text的元素而未向其中写值,所以使用了cbegin和cend来控制整个迭代过程。
某些对vector对象的操作会使迭代器失效
- 3.3.2节 (第 90页)曾经介绍过,虽然vector对象可以动态地增长,但是也会有一些副作用。已知的一个限制是不能在范围for循环中向vector对象添加元素。另外一个限制是任何一种可能改变vector对象容量的操作,比如push_back,都会使该vector对象的迭代器失效。9.3.6节(第315页)将详细解释迭代器是如何失效的。迭代器 是指end 和 cend尾后迭代器
- 谨记,但凡是使用了迭代器的循环体,都不要向迭代器所属的容器添加元素
3.4.2迭代器运算
- 迭代器的递增运算令迭代器每次移动一个元素,所有的标准库容器都有支持递增运算的迭代器。类似的,也能用==和=对任意标准库类型的两个有效迭代器(参见3.4节,第95页)进行比较。string和vector的迭代器提供了更多额外的运算符,一方面可使得迭代器的每次移动跨过多个元素,另外也支持迭代器进行关系运算。所有这些运算被称作迭代器运算>其细节由表3.7列出。
迭代器的算术运算
- 可以令迭代器和一个整数值相加(或相减),其返回值是向前(或向后)移动了若干个位置的迭代器。执行这样的操作时,结果迭代器或者指示原vector对象(或 string 对象)内的一个元素,或者指示原vector对象 (或 string对象)尾元素的下一位置。
- 举个例子,下面的代码得到一个迭代器,它指向某vector对象中间位置的元素:
- auto mid = vi.begin() + vi.size() / 2; / / 计算得到最接近vi中间元素的一个迭代器
- 如果vi有20个元素,vi.size()/2得10,此例中即令mid等于vi.begin()+10。已知下标从0开始,则迭代器所指的元素是vi[10],也就是从首元素开始向前相隔10个位置的那个元素。
- 只要两个迭代器指向的是同一个容器中的元素或者尾元素的下一位置,就能将其相减,所得结果是两个迭代器的距离。所谓距离指的是右侧的迭代器向前移动多少位置就能追上左侧的迭代器,其类型是名为difference_type的带符号整型数。string和vector都定义了difference_type,因为这个距离可正可负,所以difference_type是带符号类型的。
使用迭代器运算
- 使用迭代器运算的一个经典算法是二分搜索。二分搜索从有序序列中寻找某个给定的值。二分搜索从序列中间的位置开始搜索,如果中间位置的元素正好就是要找的元素,搜索完成;如果不是,假如该元素小于要找的元素,则在序列的后半部分继续搜素;假如该元素大于要找的元素,则在序列的前半部分继续搜索。在缩小的范围中计算一个新的中间元素并重复之前的过程,直至最终找到目标或者没有元素可供继续搜索。
- 程序的一开始定义了三个迭代器:beg指向搜索范围内的第一个元素、end指向尾元素的下一位置、mid指向中间的那个元素。初始状态下,搜索范围是名为text的vector<string>的全部范围。
- 循环部分先检查搜索范围是否为空,如果mid和end的当前值相等,说明已经找遍了所有元素。此时条件不满足,循环终止。当搜索范围不为空时,可知mid指向了某个元素,检查该元素是否就是我们所要搜索的,如果是,也终止循环。
- 当进入到循环体内部后,程序通过某种规则移动beg或者end来缩小搜索的范围。如果mid所指的元素比要找的元素sought大,可推测若text含有sought,则必出现在mid所指元素的前面。此时,可以忽略mid后面的元素不再查找,并把mid赋给end即可。另一种情况,如果*mid比soughtZJS>则要找的元素必出现在mid所指兀素的后面。此时,通过令beg指向mid的下一个位置即可改变搜索范围。因为已经验证过mid不是我们要找的对象,所以在接下来的搜索中不必考虑它。
- 循环过程终止时,mid或者等于end或者指向要找的元素。如果mid等于end,说明text中没有我们要找的元素。