std::string在 Windows MSVC和Linux Gcc 中capacity容量扩容策略的分析和对比

1、capacity()作用

在std::string中，capacity()为当前string占用内存字符的长度，表示当前string的容量，可以理解为一个预分配制度，如果当前的string不断进行扩展操作，则不需要每次都进行内存上的分配，提高程序的运行效率。所以capacity的值会大于等于size，而不是代表当前string的实际大小。

2、Gcc分配策略

查看Gcc关于string的capacity的代码，大致如下：

分配通过_M_mutate实现，_M_mutate再调用_M_create，调用实际的分配策略。

_M_mutate():

_M_create()：

_M_max_size()如下：

可以看到，当所要扩容后的capacity如果大于_M_max_size，会抛出异常。这里不展开关注，只需要关注在正常可以扩容的情况下的capacity的变化。如果所要扩容后的capacity大于老的capacity，则进行二倍的的扩展。这就是Gcc的分配策略。

3、MSVC分配策略

MSVC通过_Calculate_growth()完成capacity的扩容处理。代码如下：

_ALLOC_MASK，为15，这个值是在编译期确定的值。

每次capacity分配都会将需要将string的请求长度_Requested与_Alloc_Mask进行或运算，得到一个_Requested加上一个<=15的值_Masked，如果该值大于_Max，则最大分配为_Max，不会像Gcc先抛出异常。

然后将该值与旧值大小的1/2增长进行比较，取两者的较大的值为新的capacity。

4、代码验证

测试思路，先定义一个空的string，查看初始的capacity值，然后做10次扩容测试，查看每次扩容后的capacity情况。

测试代码如下：

#include <iostream>
#include <string>
using namespace std;
int main()
{std::string str;std::cout<<"origin capacity: "<<str.capacity() << " size: "<<str.size()<<std::endl;for (int i = 0; i < 10; i++){auto cap = str.capacity();while(str.size() <= cap){str.append("1");}std::cout<<"capacity: "<<str.capacity() << " size: "<<str.size()<<std::endl;}return 0;
}

4.1 Windows下capacity变化情况

可以看出，一个空的string的capacity初始值系统分配为15，然后再扩容后，后面每次capacity的大小为size/2 + size

4.2 Linux下capacity变化情况

Linux下为一个空的string分配的初始capacity也是15，后面每次进行扩容，都是当前(size/2)*2。

5、横向比对Gcc和MSVC的分配策略

MSVC的扩容要小于Gcc下的扩容大小，这决定了在Linux下string进行不断进行增大时，效率要优于Windows，分配的频率会小于Windows。但是Linux下分配会占用的内存大于Windwos环境，这也可以理解，因为Linux本身运行的程序多为企业级多并发的大程序，利用Linux高资源的特点，可以用空间换时间，获得更快的运行效率。而Windows下运行的多为单机程序，运行的程序不像Linux环境下那么庞大，也不需要极致的空间置换时间，且Wndows的系统资源比较有限，这样可以在保证程序高效运行的情况下，兼顾系统资源在多程序之间的合理分配。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/576875.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！