详解malloc，calloc，realloc原理及其模拟实现

malloc原理

malloc它有一个将可用的内存块连接为一个长长的列表的所谓空闲链表。调用malloc函数时，它沿连接表寻找一个大到足以满足用户请求所需要的内存块。然后，将该内存块一分为二（一块的大小与用户请求的大小相等，另一块的大小就是剩下的字节）。接下来，将分配给用户的那块内存传给用户，并将剩下的那块（如果有的话）返回到连接表上。调用free函数时，它将用户释放的内存块连接到空闲链上。到最后，空闲链会被切成很多的小内存片段，如果这时用户申请一个大的内存片段，那么空闲链上可能没有可以满足用户要求的片段了。于是，malloc函数请求延时，并开始在空闲链上翻箱倒柜地检查各内存片段，对它们进行整理，将相邻的小空闲块合并成较大的内存块。
查询链表的方法：

break指针

Linux维护一个break指针，这个指针指向堆空间的某个地址。从堆起始地址到break之间的地址空间为映射好的，可以供进程访问；而从break往上，是未映射的地址空间，如果访问这段空间则程序会报错。我们用malloc进行内存分配就是从break往上进行的。

First fit：从头开始，使用第一个数据区大小大于要求size的块所谓此次分配的块。首次适配有更好的运行效率。
Best fit：从头开始，遍历所有块，使用数据区大小大于size且差值最小的块作为此次分配的块。最佳适配具有较高的内存使用率。

int brk(void *addr);
void *sbrk(intptr_t increment);

brk将break指针直接设置为某个地址；
而sbrk将break从当前位置移动increment所指定的增量，如果将increment设置为0，则可以获得当前break的地址。

malloc实现：

void* malloc(unsigned size); 在堆内存中分配一块长度为size字节的连续区域，参数size为需要内存空间的长度。

#include <sys/types.h>
#include <unistd.h>typedef struct s_block *t_block;struct s_block {size_t size;          // 数据区大小 t_block next;         // 指向下个块的指针 int free;             // 是否是空闲块 int padding;          // 填充4字节，保证meta块长度为8的倍数 char data[1]          // 这是一个虚拟字段，表示数据块的第一个字节，长度不应计入meta 
};//首次适配
t_block find_block(t_block *last, size_t size) {t_block b = first_block;while(b && !(b->free && b->size >= size)) {*last = b;b = b->next;}return b;
}//如果现有block都不能满足size的要求，
//则需要在链表最后开辟一个新的block。
//这里关键是如何只使用sbrk创建一个struct#define BLOCK_SIZE 24 //由于存在虚拟的data字段，sizeof不能正确计算meta长度，这里手工设置 t_block extend_heap(t_block last, size_t s) {t_block b;b = sbrk(0);if(sbrk(BLOCK_SIZE + s) == (void *)-1)return NULL;b->size = s;b->next = NULL;if(last)last->next = b;b->free = 0;return b;
}//First fit有一个比较致命的缺点，
//就是可能会让很小的size占据很大的一块block，
//此时，为了提高payload，应该在剩余数据区足够大的情况下，将其分裂为一个新的block，void split_block(t_block b, size_t s) {t_block newb;newb = b->data + s;newb->size = b->size - s - BLOCK_SIZE ;newb->next = b->next;newb->free = 1;b->size = s;b->next = newb;
}//由于我们希望malloc分配的数据区是按8字节对齐，
//所以在size不为8的倍数时，我们需要将size调整为大于size的最小的8的倍数：
size_t align8(size_t s) {if(s & 0x7 == 0)return s;return ((s >> 3) + 1) << 3;
}void *first_block=NULL;void *malloc(size_t size) {t_block b, last;size_t s;/* 对齐地址 */s = align8(size);if(first_block) {/* 查找合适的block */last = first_block;b = find_block(&last, s);if(b) {<pre name="code" class="cpp">         /* 如果可以，则分裂 */if ((b->size - s) >= ( BLOCK_SIZE + 8))split_block(b, s);b->free = 0;} else {/* 没有合适的block，开辟一个新的 */b = extend_heap(last, s);if(!b)return NULL;}} else {b = extend_heap(NULL, s);if(!b)return NULL;first_block = b;}return b->data;
}

calloc实现：

void* calloc(size_t numElements, size_t sizeOfElement);
与malloc相似，参数sizeOfElement为单位元素长度（例如：sizeof(int)），numElements为元素个数，即在内存中申请numElements * sizeOfElement字节大小的连续内存空间。并且会把内存初始化为0。

calloc(num, size) 基本上等于 void *p = malloc(num * size); memset(p, 0, num * size); 但理论上 calloc 的实现可避免 num * size 溢出，当溢出时返回 NULL 代表失败，而 malloc(num * size) 可能会分配了一个尺寸溢出后的内存。

由于我们的数据区是按8字节对齐的，所以为了提高效率，我们可以每8字节一组置0，而不是一个一个字节设置。我们可以通过新建一个size_t指针，将内存区域强制看做size_t类型来实现。

void *calloc(size_t number, size_t size) {size_t *news;size_t s8, i;news = malloc(number * size);if(news) {s8 = align8(number * size) >> 3;for(i = 0; i < s8; i++)news[i] = 0;}return news;
}

realloc实现：

void* realloc(void* ptr, unsigned newsize);

使用realloc函数为ptr重新分配大小为size的一块内存空间。下面是这个函数的工作流程：

对ptr进行判断，如果ptr为NULL，则函数相当于malloc(new_size)，试着分配一块大小为new_size的内存，如果成功将地址返回，否则返回NULL。如果ptr不为NULL，则进入2。
查看ptr是不是在堆中，如果不是的话会抛出realloc invalid pointer异常。如果ptr在堆中，则查看new_size大小，如果new_size大小为0，则相当于free(ptr)，将ptr指向的内存空间释放掉，返回NULL。如果new_size小于原大小，则ptr中的数据可能会丢失，只有new_size大小的数据会保存；如果size等于原大小，等于什么都没有做；如果size大于原大小，则查看ptr指向的位置还有没有足够的连续内存空间，如果有的话，分配更多的空间，返回的地址和ptr相同，如果没有的话，在更大的空间内查找，如果找到size大小的空间，将旧的内容拷贝到新的内存中，把旧的内存释放掉，则返回新地址，否则返回NULL。

//为了实现realloc，我们首先要实现一个内存复制方法。
//如同calloc一样，为了效率，我们以8字节为单位进行复制
void copy_block(t_block src, t_block dst) {size_t *sdata, *ddata;size_t i;sdata = src->ptr;ddata = dst->ptr;for(i = 0; (i * 8) < src->size && (i * 8) < dst->size; i++)ddata[i] = sdata[i];
}

void *realloc(void *p, size_t size)
{size_t s;t_block b, newb;void *newp;if (!p)/* 根据标准库文档，当p传入NULL时，相当于调用malloc */return malloc(size);if(valid_addr(p)){s = align8(size);b = get_block(p);if(b->size >= s){if(b->size - s >= (BLOCK_SIZE + 8))split_block(b,s);} else{/* 看是否可进行合并 */if(b->next && b->next->free&& (b->size + BLOCK_SIZE + b->next->size) >= s){fusion(b);if(b->size - s >= (BLOCK_SIZE + 8))split_block(b, s);}else {/* 新malloc */newp = malloc (s);if (!newp)return NULL;newb = get_block(newp);copy_block(b, new);free(p);return(newp);}}return (p);}return NULL;
}

free实现：

如何验证所传入的地址是有效地址，即确实是通过malloc方式分配的数据区首地址
地址应该在之前malloc所分配的区域内，即在first_block和当前break指针范围内；
这个地址确实是之前通过我们自己的malloc分配的。
如何解决碎片问题

//首先我们在结构体中增加magic pointer（同时要修改BLOCK_SIZE）
typedef struct s_block *t_block;struct s_block {size_t size;          // 数据区大小 t_block next;         // 指向下个块的指针 int free;             // 是否是空闲块 int padding;          // 填充4字节，保证meta块长度为8的倍数 char data[1]          // 这是一个虚拟字段，表示数据块的第一个字节，长度不应计入metavoid *ptr;            // Magic pointer，指向data  
};
#define BLOCK_SIZE 24 //我们定义检查地址合法性的函数：
t_block get_block(void *p) 
{char *tmp;tmp = p;return (p = tmp -= BLOCK_SIZE);
}int valid_addr(void *p) 
{if(first_block) {if(p > first_block && p < sbrk(0)) {return p == (get_block(p))->ptr;}}return 0;
}

将block和相邻block合并。为了满足这个实现，需要将s_block改为双向链表。修改后的block结构如下：

 typedef struct s_block *t_block;
struct s_block {size_t size; /* 数据区大小 */t_block prev; /* 指向上个块的指针 */t_block next; /* 指向下个块的指针 */int free; /* 是否是空闲块 */int padding; /* 填充4字节，保证meta块长度为8的倍数 */void *ptr; /* Magic pointer，指向data */char data[1] /* 这是一个虚拟字段，表示数据块的第一个字节，长度不应计入meta */
};
#define BLOCK_SIZE 28

合并方法如下：

t_block fusion(t_block b) {if (b->next && b->next->free) {b->size += BLOCK_SIZE + b->next->size;b->next = b->next->next;if(b->next)b->next->prev = b;}return b;
}

void free(void *p) 
{t_block b;if(valid_addr(p)) {b = get_block(p);b->free = 1;if(b->prev && b->prev->free)b = fusion(b->prev);if(b->next)fusion(b);else {if(b->prev)b->prev->prev = NULL;elsefirst_block = NULL;brk(b);}}
}