👍作者主页:进击的1++
🤩 专栏链接:【1++的C++初阶】
文章目录
- 一,什么是vector?
- 二,构造与析构
- 三,vector迭代器的实现
- 四,vector部分重要接口的实现
一,什么是vector?
vector是一种表示大小可变数组的容器。其本质就是动态数组,与我们前面写过的顺序表是大同小异的。与其他动态序列容器相比,vector的随机访问更加高效。但是,其插入与删除由于需要移动数据的原因,就显得效率较低。接下来我们将从其基本构成,各接口的实现原理以及易发生的问题等方面进行vector的学习!
二,构造与析构
与string不同的是,string一定是字符串,而vector中却可以存储多种类型的数据。这是模板就起了很大的作用。我们暂且将其数据类型叫做T。
vector采用的数据结构非常简单,线性连续空间,它以两个迭代器start,finish分别指向已经被使用了的空间。以end_of_storage来指向整块空间的尾端。
因此,其构造函数如下:
vector():_start(nullptr),_finish(nullptr),end_of_storage(nullptr){}
讲完了构造函数,我们再来讲讲拷贝构造。
先来传统写法的构造函数。
vector(const vector<T>& v){//深拷贝_start = new T[v.capacity()];//弊端:当有vector<vector<T>>这样的结构时,vector<T>进行的是浅拷贝。// //memcpy(_start, v._start, sizeof(T) * v.size());// //改for (size_t i = 0; i < v.size(); i++){_start[i] = v._start[i];}_finish = _start + v.size();end_of_storage = _start + v.capacity();}
这里需要注意的就是我们在注释中提到的,当vector中存储的数据是自定义类型涉及到空间时,如果仅仅使用memcpy,则将会出现两对象指向同一块空间。导致同一块空间被析构两次,就会报错。
在说明解决方法前,我们再补充一段代码
void swap(vector<T>& tmp){std::swap(_start, tmp._start);std::swap(_finish, tmp._finish);std::swap(end_of_storage, tmp.end_of_storage);}
//赋值重载
vector<T>& operator=( vector<T> v)//在传参时就进行了深拷贝{swap(v);return *this;}
有了上述补充代码,我们就可以解决出现的问题了。
解决办法就是,让vector中存储的数据也进行深拷贝,便捷的方法就是利用遍历+其自己的赋值重载(自定义类型)。这样每个vector中的数据(自定义类型)都经过深拷贝,就不会发生同一空间被析构两次的情况。
我们再来学一种用迭代器进行初始化的构造构造。
template <class InputIterator>vector(InputIterator first, InputIterator last):_start(nullptr),_finish(nullptr),end_of_storage(nullptr){while (first != last){push_back(*first);++first;}}
这里的迭代器也是使用了模板,使其能够用各种类型的迭代器进行初始化。
在上面我们讲述了拷贝构造的传统写法,接下来,我们在学习一种现代写法。
vector(const vector<T>& v):_start(nullptr),_finish(nullptr),end_of_storage(nullptr){vector<T> tmp(v.begin(), v.end());swap(tmp);}
其先是利用迭代器初始化构造出一个临时对象。然后将临时对象内的三个成员交换,由于其三个成员类型为迭代器(本质为T*)因此,交换就是原来tmp对象的空间,由*this维护,*this原来的空间则交给了tmp维护,并且,tmp是在函数内定义的,因此出了此函数,其生命周期结束,进行析构。**(要注意的是,在进行交换前,this对象要进行初始化,若不对其初始化,this中的成员是野指针,释放野指针指向的空间是错误的。)
最后,我们来讲一讲析构的实现----超简单的😎😎😎!
直接上代码😏😏😏
~vector(){delete[] _start;_start = nullptr;_finish = nullptr;end_of_storage = nullptr;}
三,vector迭代器的实现
在第二小节我们就提到过其迭代器的本质为T*指针。
其迭代器主要作用就是进行遍历。
演示如下:
void test4(){vector<int> v;v.push_back(1);v.push_back(1);v.push_back(1);v.push_back(1);vector<int>::iterator it = v.begin();while (it!= v.end()){cout << (*it) << endl;++it;}}
除了上述遍历方法,还有一种范围for的遍历方法,其底层的实现就是用的迭代器。演示如下:
void test4(){vector<int> v;v.push_back(1);v.push_back(1);v.push_back(1);v.push_back(1);for (auto e : v){cout << e << " ";}cout <<endl;}
四,vector部分重要接口的实现
reserve的实现
void reserve(size_t n){size_t sz = size();if (n > capacity()){iterator tmp = new T[n];if (_start){for (size_t i = 0; i < size(); i++){tmp[i] = _start[i];}delete[]_start; }_start = tmp;_finish = _start + sz;end_of_storage = _start + n;}}
在文章【1++的C++初阶】之内存管理中,我们有说过new,delete与malloc,free等的一个区别就是,前者能够自动调用构造与析构函数,因此我们在申请空间或者是扩容时,选择用new。当用new进行间接的扩容时,就涉及到了数据的拷贝,解决方法与拷贝构造相同。
resize的实现
void resize(size_t n, T val = T()){if (n > capacity()){reserve(n);}if (n > size() ){while(_finish<_start+n){*_finish = val;++_finish;}}else{_finish = _start + n;}}
resize是调整其容器的大小,当其大小大于开辟空间的大小时,就进行扩容;并且,其还具有初始的功能。
insert实现
iterator insert(iterator pos, T val){size_t len = pos - _start;assert(pos >= begin() && pos <= end());//扩容if (end_of_storage == _finish){reserve(capacity() == 0 ? 4 : capacity() * 2);}//更新pospos = _start + len;//移动数据iterator end = _finish-1;while ( end>= pos){*(end + 1) = *end;end--;}*pos = val;_finish++;return pos;}
insert是将数据插入到pos位置,首先就要判断pos是否合法,然后要判断空间大小是否满足。**这里要注意的是当扩容后,pos就会失效,因为pos原来指向的空间已经不是我们要的空间了,因此,要更新pos。**在插入时,由于是连续的空间,因此要进行数据的移动。返回插入位置的迭代器。
erase的实现
iterator erase(iterator pos){//不考虑缩容//移动数据assert(pos >= _start && pos < _finish);iterator begin = pos;while (begin < _finish){*begin = *(begin + 1);begin++;}_finish--;return pos;}
在有些编译器下,会涉及到缩容,因此与insert一样,会面临迭代器失效的问题,因此要更新pos,但我们的实现不考虑缩容的情况。erase原理与insert相似,都要进行数据的挪动。