FreeRTOS高级篇7---FreeRTOS内存管理分析

原文：http://blog.csdn.net/zhzht19861011/article/details/51606068

内存管理对应用程序和操作系统来说都非常重要。现在很多的程序漏洞和运行崩溃都和内存分配使用错误有关。

FreeRTOS操作系统将内核与内存管理分开实现，操作系统内核仅规定了必要的内存管理函数原型，而不关心这些内存管理函数是如何实现的。这样做大有好处，可以增加系统的灵活性：不同的应用场合可以使用不同的内存分配实现，选择对自己更有利的内存管理策略。比如对于安全型的嵌入式系统，通常不允许动态内存分配，那么可以采用非常简单的内存管理策略，一经申请的内存，甚至不允许被释放。在满足设计要求的前提下，系统越简单越容易做的更安全。再比如一些复杂应用，要求动态的申请、释放内存操作，那么也可以设计出相对复杂的内存管理策略，允许动态分配和动态释放。
FreeRTOS内核规定的几个内存管理函数原型为：

void *pvPortMalloc( size_t xSize ) ：内存申请函数
void vPortFree( void *pv ) ：内存释放函数
void vPortInitialiseBlocks( void ) ：初始化内存堆函数
size_t xPortGetFreeHeapSize( void ) ：获取当前未分配的内存堆大小
size_t xPortGetMinimumEverFreeHeapSize( void )：获取未分配的内存堆历史最小值

FreeRTOS提供了5种内存管理实现，有简单也有复杂的，可以应用于绝大多数场合。它们位于下载包目录...\FreeRTOS\Source\portable\MemMang中,文件名分别为：heap_1.c、heap_2.c、heap_3.c、heap_4.c、heap_5.c。我在《FreeRTOS系列第8篇---FreeRTOS内存管理》这篇文章中介绍了这5种内存管理的特性以及各自应用的场合，今天我们要分析它们的实现方法。
FreeRTOS提供的内存管理都是从内存堆中分配内存的。默认情况下，FreeRTOS内核创建任务、队列、信号量、事件组、软件定时器都是借助内存管理函数从内存堆中分配内存。最新的FreeRTOS版本（V9.0.0及其以上版本）可以完全使用静态内存分配方法，也就是不使用任何内存堆。
对于heap_1.c、heap_2.c和heap_4.c这三种内存管理策略，内存堆实际上是一个很大的数组，定义为：
static uint8_t ucHeap[ configTOTAL_HEAP_SIZE ];
其中宏configTOTAL_HEAP_SIZE用来定义内存堆的大小，这个宏在FreeRTOSConfig.h中设置。
对于heap_3.c，这种策略只是简单的包装了标准库中的malloc()和free()函数，包装后的malloc()和free()函数具备线程保护。因此，内存堆需要通过编译器或者启动文件设置堆空间。
heap_5.c比较有趣，它允许程序设置多个非连续内存堆，比如需要快速访问的内存堆设置在片内RAM，稍微慢速访问的内存堆设置在外部RAM。每个内存堆的起始地址和大小由应用程序设计者定义。

1. heap_1.c

这是5个内存管理策略中最简单的一个，我们称为第一个内存管理策略，它简单到只能申请内存。是的，跟你想的一样，一旦申请成功后，这块内存再也不能被释放。对于大多数嵌入式系统，特别是对安全要求高的嵌入式系统，这种内存管理策略很有用，因为对系统软件来说，逻辑越简单越容易兼顾安全。实际上，大多数的嵌入式系统并不需要动态删除任务、信号量、队列等，而是在初始化的时候一次性创建好，便一直使用，永远不用删除。所以这个内存管理策略实现简洁、安全可靠，使用的非常广泛。我对这个对内存管理策略也情有独钟。
我们可以将第一种内存管理看作是切面包：初始化的内存就像一根完整的长棍面包，每次申请内存，就从一端切下适当长度的面包返还给申请者，直到面包被分配完毕，就这么简单。
这个内存管理策略使用两个局部静态变量来跟踪内存分配，变量定义为：

[objc] view plaincopy  
 print?
 static size_t xNextFreeByte = ( size_t ) 0;  
 static uint8_t *pucAlignedHeap = NULL;  

其中，变量xNextFreeByte记录已经分配的内存大小，用来定位下一个空闲的内存堆位置。因为内存堆实际上是一个大数组，我们只需要知道已分配内存的大小，就可以用它作为偏移量找到未分配内存的起始地址。变量xNextFreeByte被初始化为0，然后每次申请内存成功后，都会增加申请内存的字节数目。
变量pucAlignedHeap指向对齐后的内存堆起始位置。为什么要对齐？这是因为大多数硬件访问内存对齐的数据速度会更快。为了提高性能，FreeRTOS会进行对齐操作，不同的硬件架构对齐操作也不尽相同，对于Cortex-M3架构，进行8字节对齐。
我们来看一下第一种内存管理策略对外提供的API函数。

1.1内存申请：pvPortMalloc()

函数源码为：

[objc] view plaincopy  
 print?
 voidvoid *pvPortMalloc( size_t xWantedSize )  
 {  
 voidvoid *pvReturn = NULL;  
 static uint8_t *pucAlignedHeap = NULL;  
   
   
     /* 确保申请的字节数是对齐字节数的倍数 */  
     #if( portBYTE_ALIGNMENT != 1 )  
     {  
         if( xWantedSize & portBYTE_ALIGNMENT_MASK )  
         {  
             xWantedSize += ( portBYTE_ALIGNMENT - ( xWantedSize & portBYTE_ALIGNMENT_MASK ) );  
         }  
     }  
     #endif  
   
   
     vTaskSuspendAll();  
     {  
         if( pucAlignedHeap == NULL )  
         {  
             /* 第一次使用,确保内存堆起始位置正确对齐 */  
             pucAlignedHeap = ( uint8_t * ) ( ( ( portPOINTER_SIZE_TYPE ) &ucHeap[ portBYTE_ALIGNMENT ] ) & ( ~( ( portPOINTER_SIZE_TYPE ) portBYTE_ALIGNMENT_MASK ) ) );  
         }  
   
   
         /* 边界检查,变量xNextFreeByte是局部静态变量,初始值为0 */  
         if( ( ( xNextFreeByte + xWantedSize ) < configADJUSTED_HEAP_SIZE ) &&  
             ( ( xNextFreeByte + xWantedSize ) > xNextFreeByte ) )  
         {  
             /* 返回申请的内存起始地址并更新索引 */  
             pvReturn = pucAlignedHeap + xNextFreeByte;  
             xNextFreeByte += xWantedSize;  
         }  
     }  
     ( void ) xTaskResumeAll();  
   
   
     #if( configUSE_MALLOC_FAILED_HOOK == 1 )  
     {  
         if( pvReturn == NULL )  
         {  
             extern void vApplicationMallocFailedHook( void );  
             vApplicationMallocFailedHook();  
         }  
     }  
     #endif  
   
   
     return pvReturn;  
 }  

函数一开始会将申请的内存数量调整到对齐字节数的整数倍，所以实际分配的内存空间可能比申请内存大。比如对于8字节对齐的系统，申请11字节内存，经过对齐后，实际分配的内存是16字节（8的整数倍）。
接下来会挂起所有任务，因为内存申请是不可重入的（使用了静态变量）。
如果是第一次执行这个函数，需要将变量pucAlignedHeap指向内存堆区域第一个地址对齐处。我们上面说内存堆其实是一个大数组，编译器为这个数组分配的起始地址是随机的，可能不符合我们的对齐需要，这时候要进行调整。比如内存堆数组ucHeap从RAM地址0x10002003处开始，系统按照8字节对齐，则对齐后的内存堆如图1-1所示：

图1-1：内存堆大小与地址对齐示意图

之后进行边界检查，查看剩余的内存堆是否够分配，检查xNextFreeByte + xWantedSize是否溢出。如果检查通过，则为申请者返回有效的内存指针并更新已分配内存数量计数器xNextFreeByte（从指针pucAlignedHeap开始，偏移量为xNextFreeByte处的内存区域为未分配的内存堆起始位置）。比如我们首次调用内存分配函数pvPortMalloc(20)，申请20字节内存。根据对齐原则，我们会实际申请到24字节内存，申请成功后，内存堆示意图如图1-2所示。

图1-2：第一次分配内存后的内存堆空间示意图

内存分配完成后，不管有没有分配成功都恢复之前挂起的调度器。
如果内存分配不成功，这里最可能是内存堆空间不够用了，会调用一个钩子函数vApplicationMallocFailedHook()。这个钩子函数由应用程序提供，通常我们可以打印内存分配设备信息或者点亮也故障指示灯。

1.2获取当前未分配的内存堆大小：xPortGetFreeHeapSize()

函数用于返回未分配的内存堆大小。这个函数也很有用，通常用于检查我们设置的内存堆是否合理，通过这个函数我们可以估计出最坏情况下需要多大的内存堆，以便合理的节省RAM。
对于第一个内存管理策略，这个函数实现十分简单，源码如下：

[objc] view plaincopy  
 print?
 size_t xPortGetFreeHeapSize( void )  
 {  
     return ( configADJUSTED_HEAP_SIZE - xNextFreeByte );  
 }  

从图1-1和图1-2我们知道，宏configADJUSTED_HEAP_SIZE表示内存堆有效的大小，这个值减去已经分配出去的内存大小，正是我们需要的未分配的内存堆大小。

1.3其它函数

第一个内存管理策略中还有两个函数：vPortFree()和vPortInitialiseBlocks()。但实际上第一个函数什么也不做；第二个函数仅仅将静态局部变量xNextFreeByte设置为0。

2. heap_2.c

第二种内存管理策略要比第一种内存管理策略复杂，它使用一个最佳匹配算法，允许释放之前已分配的内存块，但是它不会把相邻的空闲块合成一个更大的块（换句话说，这会造成内存碎片）。
这个内存管理策略用于重复的分配和删除具有相同堆栈空间的任务、队列、信号量、互斥量等等，并且不考虑内存碎片的应用程序，不适用于分配和释放随机字节堆栈空间的应用程序！
与第一种内存管理策略一样，内存堆仍然是一个大数组，定义为：

[objc] view plaincopy  
 print?
 static uint8_t ucHeap[ configTOTAL_HEAP_SIZE ];  

局部静态变量pucAlignedHeap指向对齐后的内存堆起始位置。地址对齐的原因在第一种内存管理策略中已经说明。假如内存堆数组ucHeap从RAM地址0x10002003处开始，系统按照8字节对齐，则对齐后的内存堆与第一个内存管理策略一样，如图2-1所示：

图2-1：内存堆示大小与地址对齐示意图

2.1内存申请：pvPortMalloc()

与第一种内存管理策略不同，第二种内存管理策略使用一个链表结构来跟踪记录空闲内存块，将空闲块组成一个链表。结构体定义为：

[objc] view plaincopy  
 print?
 typedef struct A_BLOCK_LINK  
 {  
     struct A_BLOCK_LINK *pxNextFreeBlock;   /*指向列表中下一个空闲块*/  
     size_t xBlockSize;                      /*当前空闲块的大小，包括链表结构大小*/  
 } BlockLink_t;  

两个BlockLink_t类型的局部静态变量xStart和xEnd用来标识空闲内存块的起始和结束。刚开始时，整个内存堆有效空间就是一个空闲块，如图2-2所示。因为要包含的信息越来越多，我们必须舍弃一些信息，舍弃的信息可以在上一幅图中找到。

图2-2：内存堆初始化示意图

图2-2中的pvReturn是我自己增加的，用于接下来分析内存申请操作，堆栈初始化并没有这个变量，也没有对其操作的代码。从图2-2中可以看出，整个有效空间组成唯一一个空闲块，在空闲块的起始位置放置了一个链表结构，用于存储这个空闲块的大小和下一个空闲块的地址。由于目前只有一个空闲块，所以空闲块的pxNextFreeBlock指向链表xEnd，而链表xStart结构的pxNextFreeBlock指向空闲块。这样，xStart、空闲块和xEnd组成一个单链表，xStart表示链表头，xEnd表示链表尾。随着内存申请和释放，空闲块可能会越来越多，但它们仍是以xStart链表开头以xEnd链表结尾，根据空闲块的大小排序，小的在前，大的在后，我们在内存释放一节中会给出示意图。
当申请N字节内存时，实际上不仅需要分配N字节内存，还要分配一个BlockLink_t类型结构体空间，用于描述这个内存块，结构体空间位于空闲内存块的最开始处。当然，和第一种内存管理策略一样，申请的内存大小和BlockLink_t类型结构体大小都要向上扩大到对齐字节数的整数倍。
我们看一下内存申请过程：首先计算实际要分配的内存大小，判断申请的内存是否合法。如果合法则从链表头xStart开始查找，如果某个空闲块的xBlockSize字段大小能容得下要申请的内存，则从这块内存取出合适的部分返回给申请者，剩下的内存块组成一个新的空闲块，按照空闲块的大小顺序插入到空闲块链表中，小块在前大块在后。注意，返回的内存中不包括链表结构，而是紧邻链表结构（经过对齐）后面的位置。举个例子，如图2-2所示的内存堆，当调用申请内存函数，如果内存堆空间足够大，就将pvReturn指向的地址返回给申请者，而不是静态变量pucAlignedHeap指向的内存堆起始位置！
当多次调用内存申请函数后（没有调用内存释放函数），内存堆结构如图2-3所示。注意图中的pvReturn仍是我自己增加上去的，pvReturn指向的位置返回给申请者。后面我们讲内存释放时，就是根据这个地址完成内存释放工作的。

图2-3：经过两次内存分配后的内存堆示意图

有了上面的这些基础知识，再看内存申请函数源码就比较简单了，我把需要注意的要点以注释的方式放在源码中，不再单独对这个函数做讲解，值得注意的是函数中使用的一个静态局部变量xFreeBytesRemaining，它用来记录未分配的内存堆大小。这个变量将提供给函数xPortGetFreeHeapSize()使用，以方便用户估算内存堆使用情况。

[objc] view plaincopy  
 print?
 voidvoid *pvPortMalloc( size_t xWantedSize )  
 {  
 BlockLink_t *pxBlock, *pxPreviousBlock, *pxNewBlockLink;  
 static BaseType_t xHeapHasBeenInitialised = pdFALSE;  
 voidvoid *pvReturn = NULL;  
   
   
     /* 挂起调度器 */  
     vTaskSuspendAll();  
     {  
         /* 如果是第一次调用内存分配函数,这里先初始化内存堆,如图2-2所示 */  
         if( xHeapHasBeenInitialised == pdFALSE )  
         {  
             prvHeapInit();  
             xHeapHasBeenInitialised = pdTRUE;  
         }  
   
   
         /* 调整要分配的内存值,需要增加上链表结构体空间,heapSTRUCT_SIZE表示经过对齐扩展后的结构体大小 */  
         if( xWantedSize > 0 )  
         {  
             xWantedSize += heapSTRUCT_SIZE;  
   
   
             /* 调整实际分配的内存大小,向上扩大到对齐字节数的整数倍 */  
             if( ( xWantedSize & portBYTE_ALIGNMENT_MASK ) != 0 )  
             {  
                 xWantedSize += ( portBYTE_ALIGNMENT - ( xWantedSize & portBYTE_ALIGNMENT_MASK ) );  
             }  
         }  
           
         if( ( xWantedSize > 0 ) && ( xWantedSize < configADJUSTED_HEAP_SIZE ) )  
         {  
             /* 空闲内存块是按照块的大小排序的,从链表头xStart开始,小的在前大的在后,以链表尾xEnd结束 */  
             pxPreviousBlock = &xStart;  
             pxBlock = xStart.pxNextFreeBlock;  
             /* 搜索最合适的空闲块 */  
             while( ( pxBlock->xBlockSize < xWantedSize ) && ( pxBlock->pxNextFreeBlock != NULL ) )  
             {  
                 pxPreviousBlock = pxBlock;  
                 pxBlock = pxBlock->pxNextFreeBlock;  
             }  
   
   
             /* 如果搜索到链表尾xEnd,说明没有找到合适的空闲内存块,否则进行下一步处理 */  
             if( pxBlock != &xEnd )  
             {  
                 /* 返回内存空间,注意是跳过了结构体BlockLink_t空间. */  
                 pvReturn = ( voidvoid * ) ( ( ( uint8_t * ) pxPreviousBlock->pxNextFreeBlock ) + heapSTRUCT_SIZE );  
   
   
                 /* 这个块就要返回给用户,因此它必须从空闲块中去除. */  
                 pxPreviousBlock->pxNextFreeBlock = pxBlock->pxNextFreeBlock;  
   
   
                 /* 如果这个块剩余的空间足够多,则将它分成两个,第一个返回给用户,第二个作为新的空闲块插入到空闲块列表中去*/  
                 if( ( pxBlock->xBlockSize - xWantedSize ) > heapMINIMUM_BLOCK_SIZE )  
                 {  
                     /* 去除分配出去的内存,在剩余内存块的起始位置放置一个链表结构并初始化链表成员 */  
                     pxNewBlockLink = ( voidvoid * ) ( ( ( uint8_t * ) pxBlock ) + xWantedSize );  
   
   
                     pxNewBlockLink->xBlockSize = pxBlock->xBlockSize - xWantedSize;  
                     pxBlock->xBlockSize = xWantedSize;  
   
   
                     /* 将剩余的空闲块插入到空闲块列表中,按照空闲块的大小顺序,小的在前大的在后 */  
                     prvInsertBlockIntoFreeList( ( pxNewBlockLink ) );  
                 }  
                 /* 计算未分配的内存堆大小,注意这里并不能包含内存碎片信息 */  
                 xFreeBytesRemaining -= pxBlock->xBlockSize;  
             }  
         }  
   
   
         traceMALLOC( pvReturn, xWantedSize );  
     }  
     ( void ) xTaskResumeAll();  
   
   
     #if( configUSE_MALLOC_FAILED_HOOK == 1 )  
     {   /* 如果内存分配失败,调用钩子函数 */  
         if( pvReturn == NULL )  
         {  
             extern void vApplicationMallocFailedHook( void );  
             vApplicationMallocFailedHook();  
         }  
     }  
     #endif  
   
   
     return pvReturn;  
 }  

2.2内存释放：vPortFree()

因为不需要合并相邻的空闲块，第二种内存管理策略的内存释放也非常简单：根据传入的参数找到链表结构，然后将这个内存块插入到空闲块列表，更新未分配的内存堆计数器大小，结束。因为简单，我们直接看源码。

[objc] view plaincopy  
 print?
 void vPortFree( voidvoid *pv )  
 {  
 uint8_t *puc = ( uint8_t * ) pv;  
 BlockLink_t *pxLink;  
   
   
     if( pv != NULL )  
     {  
         /* 根据传入的参数找到链表结构 */  
         puc -= heapSTRUCT_SIZE;  
   
   
         /* 预防某些编译器警告 */  
         pxLink = ( voidvoid * ) puc;  
   
   
         vTaskSuspendAll();  
         {  
             /* 将这个块添加到空闲块列表 */  
             prvInsertBlockIntoFreeList( ( ( BlockLink_t * ) pxLink ) );  
             /* 更新未分配的内存堆大小 */  
             xFreeBytesRemaining += pxLink->xBlockSize;  
               
             traceFREE( pv, pxLink->xBlockSize );  
         }  
         ( void ) xTaskResumeAll();  
     }  
 }  

我们举一个例子，将图2-3 pvReturn指向的内存块释放掉，假设（configADJUSTED_HEAP_SIZE-40）远大于要释放的内存块大小，释放后的内存堆如图2-4所示：

图2-4：释放内存后，内存堆示意图

从图2-4我们可以看出第二种内存管理策略的两个特点：第一，空闲块是按照大小排序的；第二，相邻的空闲块不会组合成一个大块。
我们再接着引申讨论一下这种内存管理策略的优缺点。通过对内存申请和释放函数源码分析，我们可以看出它的一个优点是速度足够快，因为它的实现非常简单；第二个优点是可以动态释放内存。但是它的缺点也非常明显：由于在释放内存时不会将相邻的内存块合并，所以这可能造成内存碎片。这就对其应用的场合要求极其苛刻：第一，每次创建或释放的任务、信号量、队列等必须大小相同，如果分配或释放的内存是随机的，绝对不可以用这种内存管理策略；第二，如果申请和释放的顺序不可预料，也很危险。举个例子，对于一个已经初始化的10KB内存堆，先申请48字节内存，然后释放；再接着申请32字节内存，那么一个本来48字节的大块就会被分为32字节和16字节的小块，如果这种情况经常发生，就会导致每个空闲块都可能很小，最终在申请一个大块时就会因为没有合适的空闲块而申请失败（并不是因为总的空闲内存不足）！

2.3获取未分配的内存堆大小：xPortGetFreeHeapSize()

函数用于返回未分配的内存堆大小。这个函数也很有用，通常用于检查我们设置的内存堆是否合理，通过这个函数我们可以估计出最坏情况下需要多大的内存堆，以便进行合理的节省RAM。需要注意的是，这个函数返回值并不能函数源码为：

[objc] view plaincopy  
 print?
 size_t xPortGetFreeHeapSize( void )  
 {  
     return xFreeBytesRemaining;  
 }  

局部静态变量xFreeBytesRemaining在内存申请和内存释放函数中多次提到，它用来动态记录未分配的内存堆大小。

3.heap_3.c

第三种内存管理策略简单的封装了标准库中的malloc()和free()函数，采用的封装方式是操作内存前挂起调度器、完成后再恢复调度器。封装后的malloc()和free()函数具备线程保护。
第一种和第二种内存管理策略都是通过定义一个大数组作为内存堆，数组的大小由宏configTOTAL_HEAP_SIZE指定。第三种内存管理策略与前两种不同，它不再需要通过数组定义内存堆，而是需要使用编译器设置内存堆空间，一般在启动代码中设置。因此宏configTOTAL_HEAP_SIZE对这种内存管理策略是无效的。

3.1内存申请：pvPortMalloc()

[objc] view plaincopy  
 print?
 voidvoid *pvPortMalloc( size_t xWantedSize )  
 {  
 voidvoid *pvReturn;  
   
   
     vTaskSuspendAll();  
     {  
         pvReturn = malloc( xWantedSize );  
         traceMALLOC( pvReturn, xWantedSize );  
     }  
     ( void ) xTaskResumeAll();  
   
   
     #if( configUSE_MALLOC_FAILED_HOOK == 1 )  
     {  
         if( pvReturn == NULL )  
         {  
             extern void vApplicationMallocFailedHook( void );  
             vApplicationMallocFailedHook();  
         }  
     }  
     #endif  
   
   
     return pvReturn;  
 }  

3.2 内存释放：vPortFree()

[objc] view plaincopy  
 print?
 void vPortFree( voidvoid *pv )  
 {  
     if( pv )  
     {  
         vTaskSuspendAll();  
         {  
             free( pv );  
             traceFREE( pv, 0 );  
         }  
         ( void ) xTaskResumeAll();  
     }  
 }  

4.heap_4.c

第四种内存分配方法与第二种比较相似，只不过增加了一个合并算法，将相邻的空闲内存块合并成一个大块。
与第一种和第二种内存管理策略一样，内存堆仍然是一个大数组，定义为：

[objc] view plaincopy  
 print?
 static uint8_t ucHeap[ configTOTAL_HEAP_SIZE ];  

4.1 内存申请：pvPortMalloc()

和第二种内存管理策略一样，它也使用一个链表结构来跟踪记录空闲内存块。结构体定义为：

[objc] view plaincopy  
 print?
 typedef struct A_BLOCK_LINK  
 {  
     struct A_BLOCK_LINK *pxNextFreeBlock;   /*指向列表中下一个空闲块*/  
     size_t xBlockSize;                      /*当前空闲块的大小，包括链表结构大小*/  
 } BlockLink_t;  

与第二种内存管理策略一样，空闲内存块也是以单链表的形式组织起来的，BlockLink_t类型的局部静态变量xStart表示链表头，但第四种内存管理策略的链表尾保存在内存堆空间最后位置，并使用BlockLink_t指针类型局部静态变量pxEnd指向这个区域（第二种内存管理策略使用静态变量xEnd表示链表尾），如图4-1所示。
第四种内存管理策略和第二种内存管理策略还有一个很大的不同是：第四种内存管理策略的空闲块链表不是以内存块大小为存储顺序，而是以内存块起始地址大小为存储顺序，地址小的在前，地址大的在后。这也是为了适应合并算法而作的改变。

图4-1：内存堆初始化示意图

从图4-1中可以看出，整个有效空间组成唯一一个空闲块，在空闲块的起始位置放置了一个链表结构，用于存储这个空闲块的大小和下一个空闲块的地址。由于目前只有一个空闲块，所以空闲块的pxNextFreeBlock指向指针pxEnd指向的位置，而链表xStart结构的pxNextFreeBlock指向空闲块。xStart表示链表头，pxEnd指向位置表示链表尾。
当申请x字节内存时，实际上不仅需要分配x字节内存，还要分配一个BlockLink_t类型结构体空间，用于描述这个内存块，结构体空间位于空闲内存块的最开始处。当然，和第一种、第二种内存管理策略一样，申请的内存大小和BlockLink_t类型结构体大小都要向上扩大到对齐字节数的整数倍。
我们先说一下内存申请过程：首先计算实际要分配的内存大小，判断申请内存合法性，如果合法则从链表头xStart开始查找，如果某个空闲块的xBlockSize字段大小能容得下要申请的内存，则将这块内存取出合适的部分返回给申请者，剩下的内存块组成一个新的空闲块，按照空闲块起始地址大小顺序插入到空闲块链表中，地址小的在前，地址大的在后。在插入到空闲块链表的过程中，还会执行合并算法：判断这个块是不是可以和上一个空闲块合并成一个大块，如果可以则合并；然后再判断能不能和下一个空闲块合并成一个大块，如果可以则合并！合并算法是第四种内存管理策略和第二种内存管理策略最大的不同!经过几次内存申请和释放后，可能的内存堆如图4-2所示：

图4-2：经过数次内存申请和释放后，某个内存堆示意图

有了上面的基础，我们再来看一下源码，我把需要注意的要点以注释的方式放在源码中，不再单独对这个函数做讲解。函数中会用到几个局部静态变量在这里简单说明一下：

xFreeBytesRemaining：表示当前未分配的内存堆大小
xMinimumEverFreeBytesRemaining：表示未分配内存堆空间历史最小值。这个值跟xFreeBytesRemaining有很大区别，只有记录未分配内存堆的最小值，才能知道最坏情况下内存堆的使用情况。
xBlockAllocatedBit：这个变量在第一次调用内存申请函数时被初始化，将它能表示的数值的最高位置1。比如对于32位系统，这个变量被初始化为0x80000000（最高位为1）。内存管理策略使用这个变量来标识一个内存块是否空闲。如果内存块被分配出去，则内存块链表结构成员xBlockSize按位或上这个变量（即xBlockSize最高位置1），在释放一个内存块时，会把xBlockSize的最高位清零。

[objc] view plaincopy  
 print?
 voidvoid *pvPortMalloc( size_t xWantedSize )  
 {  
 BlockLink_t *pxBlock, *pxPreviousBlock, *pxNewBlockLink;  
 voidvoid *pvReturn = NULL;  
   
   
     vTaskSuspendAll();  
     {  
         /* 如果是第一次调用内存分配函数,则初始化内存堆,初始化后的内存堆如图4-1所示 */  
         if( pxEnd == NULL )  
         {  
             prvHeapInit();  
         }  
   
   
         /* 申请的内存大小合法性检查:是否过大.结构体BlockLink_t中有一个成员xBlockSize表示块的大小,这个成员的最高位被用来标识这个块是否空闲.因此要申请的块大小不能使用这个位.*/  
         if( ( xWantedSize & xBlockAllocatedBit ) == 0 )  
         {  
             /* 计算实际要分配的内存大小,包含链接结构体BlockLink_t在内,并且要向上字节对齐 */  
             if( xWantedSize > 0 )  
             {  
                 xWantedSize += xHeapStructSize;  
   
   
                 /* 对齐操作,向上扩大到对齐字节数的整数倍 */  
                 if( ( xWantedSize & portBYTE_ALIGNMENT_MASK ) != 0x00 )  
                 {  
                     xWantedSize += ( portBYTE_ALIGNMENT - ( xWantedSize & portBYTE_ALIGNMENT_MASK ) );  
                     configASSERT( ( xWantedSize & portBYTE_ALIGNMENT_MASK ) == 0 );  
                 }  
             }  
   
   
             if( ( xWantedSize > 0 ) && ( xWantedSize <= xFreeBytesRemaining ) )  
             {  
                 /* 从链表xStart开始查找,从空闲块链表(按照空闲块地址顺序排列)中找出一个足够大的空闲块 */  
                 pxPreviousBlock = &xStart;  
                 pxBlock = xStart.pxNextFreeBlock;  
                 while( ( pxBlock->xBlockSize < xWantedSize ) && ( pxBlock->pxNextFreeBlock != NULL ) )  
                 {  
                     pxPreviousBlock = pxBlock;  
                     pxBlock = pxBlock->pxNextFreeBlock;  
                 }  
   
   
                 /* 如果最后到达结束标识,则说明没有合适的内存块,否则,进行内存分配操作*/  
                 if( pxBlock != pxEnd )  
                 {  
                     /* 返回分配的内存指针,要跳过内存开始处的BlockLink_t结构体 */  
                     pvReturn = ( voidvoid * ) ( ( ( uint8_t * ) pxPreviousBlock->pxNextFreeBlock ) + xHeapStructSize );  
   
   
                     /* 将已经分配出去的内存块从空闲块链表中删除 */  
                     pxPreviousBlock->pxNextFreeBlock = pxBlock->pxNextFreeBlock;  
   
   
                     /* 如果剩下的内存足够大,则组成一个新的空闲块 */  
                     if( ( pxBlock->xBlockSize - xWantedSize ) > heapMINIMUM_BLOCK_SIZE )  
                     {  
                         /* 在剩余内存块的起始位置放置一个链表结构并初始化链表成员 */  
                         pxNewBlockLink = ( voidvoid * ) ( ( ( uint8_t * ) pxBlock ) + xWantedSize );  
                         configASSERT( ( ( ( size_t ) pxNewBlockLink ) & portBYTE_ALIGNMENT_MASK ) == 0 );  
   
   
                         pxNewBlockLink->xBlockSize = pxBlock->xBlockSize - xWantedSize;  
                         pxBlock->xBlockSize = xWantedSize;  
   
   
                         /* 将剩余的空闲块插入到空闲块列表中,按照空闲块的地址大小顺序,地址小的在前,地址大的在后 */  
                         prvInsertBlockIntoFreeList( pxNewBlockLink );  
                     }  
                       
                     /* 计算未分配的内存堆空间,注意这里并不能包含内存碎片信息 */  
                     xFreeBytesRemaining -= pxBlock->xBlockSize;  
                       
                     /* 保存未分配内存堆空间历史最小值 */  
                     if( xFreeBytesRemaining < xMinimumEverFreeBytesRemaining )  
                     {  
                         xMinimumEverFreeBytesRemaining = xFreeBytesRemaining;  
                     }  
   
   
                     /* 将已经分配的内存块标识为"已分配" */  
                     pxBlock->xBlockSize |= xBlockAllocatedBit;  
                     pxBlock->pxNextFreeBlock = NULL;  
                 }  
             }  
         }  
   
   
         traceMALLOC( pvReturn, xWantedSize );  
     }  
     ( void ) xTaskResumeAll();  
   
   
     #if( configUSE_MALLOC_FAILED_HOOK == 1 )  
     {   /* 如果内存分配失败,调用钩子函数 */  
         if( pvReturn == NULL )  
         {  
             extern void vApplicationMallocFailedHook( void );  
             vApplicationMallocFailedHook();  
         }  
         else  
         {  
             mtCOVERAGE_TEST_MARKER();  
         }  
     }  
     #endif  
   
   
     configASSERT( ( ( ( size_t ) pvReturn ) & ( size_t ) portBYTE_ALIGNMENT_MASK ) == 0 );  
     return pvReturn;  
 }  

4.2 内存释放：vPortFree()

第四种内存管理策略的内存释放也比较简单：根据传入的参数找到链表结构，然后将这个内存块插入到空闲块列表，需要注意的是在插入过程中会执行合并算法，这个我们已经在内存申请中讲过了。最后是将这个内存块标志为“空闲”、更新未分配的内存堆大小，结束。源代码如下：

[objc] view plaincopy  
 print?
 void vPortFree( voidvoid *pv )  
 {  
 uint8_t *puc = ( uint8_t * ) pv;  
 BlockLink_t *pxLink;  
   
   
     if( pv != NULL )  
     {  
         /* 根据参数地址找出内存块链表结构 */  
         puc -= xHeapStructSize;  
         pxLink = ( voidvoid * ) puc;  
   
   
         /* 检查这个内存块确实被分配出去 */  
         if( ( pxLink->xBlockSize & xBlockAllocatedBit ) != 0 )  
         {  
             if( pxLink->pxNextFreeBlock == NULL )  
             {  
                 /* 将内存块标识为"空闲" */  
                 pxLink->xBlockSize &= ~xBlockAllocatedBit;  
   
   
                 vTaskSuspendAll();  
                 {  
                     /* 更新未分配的内存堆大小 */  
                     xFreeBytesRemaining += pxLink->xBlockSize;  
                     traceFREE( pv, pxLink->xBlockSize );  
                     /* 将这个内存块插入到空闲块链表中,按照内存块地址大小顺序 */  
                     prvInsertBlockIntoFreeList( ( ( BlockLink_t * ) pxLink ) );  
                 }  
                 ( void ) xTaskResumeAll();  
             }  
         }  
     }  
 }  

如图4-2所示的内存堆示意图，如果我们将32字节的“已分配空间2”释放，由于这个内存块的上面和下面都是空闲块，所以在将它插入到空闲块链表的过程在中，会先和“剩余空闲块1”合并，合并后的块再和“剩余空闲块2”合并，这样组成一个大的空闲块，如图4-3所示：

图4-3：内存释放后，会和相邻的空闲块合并

4.3获取当前未分配的内存堆大小：xPortGetFreeHeapSize()

在内存申请和内存释放函数中以及多次提到过变量xFreeBytesRemaining。它就是一个计数器，不能说明内存堆碎片信息。

[objc] view plaincopy  
 print?
 size_t xPortGetFreeHeapSize( void )  
 {  
     return xFreeBytesRemaining;  
 }  

4.4获取未分配的内存堆历史最小值：xPortGetFreeHeapSize()

在内存申请中讲解过变量xMinimumEverFreeBytesRemaining，这个函数很有用，通过这个函数我们可以估计出最坏情况下需要多大的内存堆，从而辅助我们合理的设置内存堆大小。

[objc] view plaincopy  
 print?
 size_t xPortGetMinimumEverFreeHeapSize( void )  
 {  
     return xMinimumEverFreeBytesRemaining;  
 }  

5.heap_5.c

第五种内存管理策略允许内存堆跨越多个非连续的内存区，并且需要显示的初始化内存堆，除此之外其它操作都和第四种内存管理策略十分相似。
第一、第二和第四种内存管理策略都是利用一个大数组作为内存堆使用，并且只需要应用程序指定数组的大小（通过宏configTOTAL_HEAP_SIZE定义），数组定义由内存管理策略实现。第五种内存管理策略有些不同，首先它允许跨内存区定义多个内存堆，比如在片内RAM中定义一个内存堆，还可以在片外RAM再定义内存堆；其次，用户需要指定每个内存堆区域的起始地址和内存堆大小、将它们放在一个HeapRegion_t结构体类型数组中，并需要在使用任何内存分配和释放操作前调用vPortDefineHeapRegions()函数初始化这些内存堆。
让我们看一个例子：假设我们为内存堆分配两个内存块，第一个内存块大小为0x10000字节，起始地址为0x80000000；第二个内存块大小为0xa0000字节,起始地址为0x90000000。HeapRegion_t结构体类型数组可以定义如下：

[objc] view plaincopy  
 print?
 HeapRegion_t xHeapRegions[] =  
  {  
     { ( uint8_t * ) 0x80000000UL, 0x10000 },   
     { ( uint8_t * ) 0x90000000UL, 0xa0000 },   
     { NULL, 0 }                  
  };  

两个内存块要按照地址顺序放入到数组中，地址小的在前，因此地址为0x80000000的内存块必须放数组的第一个位置。数组必须以使用一个NULL指针和0字节元素作为结束，以便让内存管理程序知道何时结束。
定义好内存堆数组后，需要应用程序调用vPortDefineHeapRegions()函数初始化这些内存堆：将它们组成一个链表，以xStart链表结构开头，以pxEnd指针指向的位置结束。我们看一下内存堆数组是如何初始化的，以上面的内存堆数组为例，初始化后的内存堆如图5-1所示（32为平台，sizeof(BlockLink_t)=8字节）。