linux 下c内存管理,linux内存管理之malloc

对于内核的内存管理,像kmalloc,vmalloc,kmap,ioremap等比较熟悉。而对用户层的管理机制不是很熟悉,下面就从malloc的实现入手.( 这里不探讨linux系统调用的实现机制. ) ,参考了《深入理解计算机系统》和一些网上的资料.

首先从http://ftp.gnu.org/gnu/glibc下载glibc库2.21,

通常我们用的bsp或者sdk里面的工具链都是编译好的,而这个是源码,需要自己编译(常用的有定制交叉编译工具链).有时候我们需要添加自定义库.

Linux中malloc的早期版本是由Doug Lea实现的,它有一个重要问题就是在并行处理时多个线程共享进程的内存空间,各线程可能并发请求内存,在这种情况下应该如何保证分配和回收的正确和有效。Wolfram Gloger在Doug Lea的基础上改进使得glibc的malloc可以支持多线程——,在glibc-2.3.x.中已经集成了ptmalloc2,这就是我们平时使用的malloc.

其做法是,为了支持多线程并行处理时对于内存的并发请求操作,malloc的实现中把全局用户堆(heap)划分成很多子堆(sub-heap)。这些子堆是按照循环单链表的形式组织起来的。每一个子堆利用互斥锁(mutex)使线程对于该子堆的访问互斥。当某一线程需要调用malloc分配内存空间时,该线程搜索循环链表试图获得一个没有加锁的子堆。如果所有的子堆都已经加锁,那么malloc会开辟一块新的子堆,对于新开辟的子堆默认情况下是不加锁的,因此线程不需要阻塞就可以获得一个新的子堆并进行分配操作。在回收free操作中,线程同样试图获得待回收块所在子堆的锁,如果该子堆正在被别的线程使用,则需要等待直到其他线程释放该子堆的互斥锁之后才可以进行回收操作。

申请小块内存时会产生很多内存碎片,ptmalloc在整理时需要对子堆做加锁操作,每个加锁操作大概需要5~10个cpu指令,而且程序线程数很高的情况下,锁等待的时间就会延长,导致malloc性能下降。

因此很多大型的服务端应用会自己实现内存池,以降低向系统malloc的开销。和是在glibc和应用程序之间实现的内存管理。Hoard的作者是美国麻省的Amherst College的一名老师,理论角度对hoard的研究和优化比较多,相关的文献可以hoard主页下载到到。从我自己项目中的系统使用来看,Hoard确实能够很大程度的提高程序的性能和稳定性。TCMalloc(Thread-Caching Malloc)是google开发的开源工具──“google-perftools”中的成员。这里有它的和安装方法。这个只是对它历史发展的一个简单介绍,具体改动还需去官网查看.

下面我们就看看malloc:

malloc的全称是memory allocation,中文叫分配,当无法知道内存具体位置的时候,想要绑定真正的内存空间,就需要用到动态的分配内存。

原型为: extern

void *malloc(unsigned int num_bytes)。

具体声明在malloc.h中:

点击(此处)折叠或打开

/* Allocate SIZE bytes of memory. */

extern void *malloc (size_t __size) __THROW __attribute_malloc__ __wur;

返回值:

如果分配成功则返回指向被分配内存的(此存储区中的初始值不确定),否则返回空指针。当内存不再使用时,应使用()函数将内存块释放。函数返回的一定要适当对齐,使其可以用于任何。

注意:

malloc(0)返回不为空。Free(p)后p不为空。

那么malloc到底是从哪里获取的内存呢?

答案是从堆里面获得空间;malloc的应用必然是某一个进程调用,而每一个进程在启动的时候,系统默认给它分配了heap。下面我们就看看进程的内存空间布局:

Anyway, here is the standard segment layout in a

Linux process:(这个是x86 虚拟地址空间的默认布局)

7ea798e59d36ef767ff67b5102705395.png在glibc库中找到malloc.c文件:

点击(此处)折叠或打开

strong_alias (__libc_malloc, __malloc) strong_alias (__libc_malloc, malloc)

即malloc别名为__libc_malloc,__malloc.并且在malloc.c中我们不能找到malloc的直接实现,而是有__libc_malloc:

点击(此处)折叠或打开

/*------------------------ Public wrappers. --------------------------------*/

void *

__libc_malloc (size_t bytes)

{

mstate ar_ptr;

void *victim;

void *(*hook) (size_t, const void *)

= atomic_forced_read (__malloc_hook);

if (__builtin_expect (hook != NULL, 0))

return (*hook)(bytes, RETURN_ADDRESS (0));

arena_lookup (ar_ptr);

arena_lock (ar_ptr, bytes);

if (!ar_ptr)

return 0;

victim = _int_malloc (ar_ptr, bytes);

if (!victim)

{

LIBC_PROBE (memory_malloc_retry, 1, bytes);

ar_ptr = arena_get_retry (ar_ptr, bytes);

if (__builtin_expect (ar_ptr != NULL, 1))

{

victim = _int_malloc (ar_ptr, bytes);

(void) mutex_unlock (&ar_ptr->mutex);

}

}

else

(void) mutex_unlock (&ar_ptr->mutex);

assert (!victim || chunk_is_mmapped (mem2chunk (victim)) ||

ar_ptr == arena_for_chunk (mem2chunk (victim)));

return victim;

}

在这个函数的第一行是关于hook的,我们先看一个定义:

点击(此处)折叠或打开

void *weak_variable (*__malloc_hook)

(size_t __size, const void *) = malloc_hook_ini;

它是gcc  attribute weak的特性,可以查资料进一步了解.这里说明一下由于是弱属性,所以当有具体的实现的时候,就以外部实现为准.

点击(此处)折叠或打开

static void *

malloc_hook_ini (size_t sz, const void *caller)

{

__malloc_hook = NULL;

ptmalloc_init ();

return __libc_malloc (sz);

}

__libc_malloc中首先判断hook函数指针是否为空,不为空则调用它,并返回。glibc2.21里默认malloc_hook是初始化为malloc_hook_ini的。但是我们发现在malloc_hook_ini中把__malloc_hook赋值为NULl,这样就避免了递归调用.

同理在最后部分也有一个__malloc_initialize_hook的:默认为空.

点击(此处)折叠或打开

void weak_variable (*__malloc_initialize_hook) (void) = NULL;

那么ptmalloc_init到底又做了什么工作呢?

点击(此处)折叠或打开

static void

ptmalloc_init (void)

{

if (__malloc_initialized >= 0)

return;

__malloc_initialized = 0;

#ifdef SHARED

/* In case this libc copy is in a non-default namespace, never use brk.

Likewise if dlopened from statically linked program. */

Dl_info di;

struct link_map *l;

if (_dl_open_hook != NULL

|| (_dl_addr (ptmalloc_init, &di, &l, NULL) != 0

&& l->l_ns != LM_ID_BASE))

__morecore = __failing_morecore;

#endif

tsd_key_create (&arena_key, NULL);

tsd_setspecific (arena_key, (void *) &main_arena);

thread_atfork (ptmalloc_lock_all, ptmalloc_unlock_all, ptmalloc_unlock_all2);

const char *s = NULL;

if (__glibc_likely (_environ != NULL))

{

char **runp = _environ;

char *envline;

while (__builtin_expect ((envline = next_env_entry (&runp)) != NULL,

0))

{

size_t len = strcspn (envline, "=");

if (envline[len] != '=')

/* This is a "MALLOC_" variable at the end of the string

without a '=' character. Ignore it since otherwise we

will access invalid memory below. */

continue;

switch (len)

{

case 6:

if (memcmp (envline, "CHECK_", 6) == 0)

s = &envline[7];

break;

case 8:

if (!__builtin_expect (__libc_enable_secure, 0))

{

if (memcmp (envline, "TOP_PAD_", 8) == 0)

__libc_mallopt (M_TOP_PAD, atoi (&envline[9]));

else if (memcmp (envline, "PERTURB_", 8) == 0)

__libc_mallopt (M_PERTURB, atoi (&envline[9]));

}

break;

case 9:

if (!__builtin_expect (__libc_enable_secure, 0))

{

if (memcmp (envline, "MMAP_MAX_", 9) == 0)

__libc_mallopt (M_MMAP_MAX, atoi (&envline[10]));

else if (memcmp (envline, "ARENA_MAX", 9) == 0)

__libc_mallopt (M_ARENA_MAX, atoi (&envline[10]));

}

break;

case 10:

if (!__builtin_expect (__libc_enable_secure, 0))

{

if (memcmp (envline, "ARENA_TEST", 10) == 0)

__libc_mallopt (M_ARENA_TEST, atoi (&envline[11]));

}

break;

case 15:

if (!__builtin_expect (__libc_enable_secure, 0))

{

if (memcmp (envline, "TRIM_THRESHOLD_", 15) == 0)

__libc_mallopt (M_TRIM_THRESHOLD, atoi (&envline[16]));

else if (memcmp (envline, "MMAP_THRESHOLD_", 15) == 0)

__libc_mallopt (M_MMAP_THRESHOLD, atoi (&envline[16]));

}

break;

default:

break;

}

}

}

if (s && s[0])

{

__libc_mallopt (M_CHECK_ACTION, (int) (s[0] - '0'));

if (check_action != 0)

__malloc_check_init ();

}

void (*hook) (void) = atomic_forced_read (__malloc_initialize_hook);

if (hook != NULL)

(*hook)();

__malloc_initialized = 1;

}

而__malloc_initialized在arena.c中默认初始化为:即开始的时候小于0.

点击(此处)折叠或打开

/* Already initialized? */

int __malloc_initialized = -1;

函数开始把它赋值为0,最后初始化完成赋值为1. 所以这个函数完成了malloc的初始化工作.只有第一次调用的时候会用到.

接着是处理_environ即传递过来的环境变量,进行内存分配策略控制,你可以定制内存管理函数的行为,通过调整由mallopt()函数的参数。(默认环境变量为空。)内存分配调整甚至可以不在你的程序中引入mallopt()调用和重新编译它。在你想快速测试一些值或者你没有源代码时,这非常有用。你仅需要做的是在运行程序前,设置合适的环境变量。表1展示mallopt()参数和环境变量的映射关系以及一些额外的信息。例如,如果你希望设置内存消减阈值为64k,你可以运行这个程序:

#MALLOC_TRIM_THRESHOLD=65536 my_prog

937e433d00ba3ab88d523841d56fb878.png

内存调试:连续性检查 ,可以设置变量MALLOC_CHECK_=1#MALLOC_CHECK_=1 my_prog还有一个mtrace使用的例子:点击(此处)折叠或打开

#include

#include

#include

void main(void)

{

char *p;

mtrace();

p=(char *)malloc(100);

if(p ==NULL)

return 0;

memcpy(p,"helllllllllll",20);

printf("....1 %s.....\n",p);

//free(p);

}

运行: #MALLOC_TRACE="1.txt" ./a.out

然后用mtrace查看结果:

点击(此处)折叠或打开

mtrace 1.txt

Memory not freed:

-----------------

Address Size Caller

0x09849378 0x64 at 0x804849e

一些GNU C库提供的标准调试工具可能并不适合你程序的特殊需求。在这种情况下,你可以借助一个外部的内存调试工具(见 Resource)或者在你的库内部作修改。做这件事中只是简单的写三个函数以及将它们与预先定义的变量相关联:

__malloc_hook points to a function to be called when the user calls malloc(). You can do your own checks and accounting here, and then call the real malloc() to get the memory that was requested.

__malloc_hook 指向一个函数,当用户调用malloc()时,这个函数将被调用。你可以在这里做你自己的检查和计数,然后调用真实的malloc来得到被请求的内存。

__free_hook points to a function called instead of the standard free().

__free_hook 指向一个函数,用来替换标准的free()

__malloc_initialize_hook points to a function called when the memory management system is initialized. This allows you to perform some operations, say, setting the values of the previous hooks, before any memory-related operation takes place.

__malloc_initialize__hook 指向一个函数,当内存管理系统被初始化的时候,这个函数被调用。这允许你来实施一些操作,例如,在任何内存相关的操作生效前,设置前面的勾子值。

在其它的内存相关的调用中,Hooks()也有效,包括realloc(),calloc()等等。确保在调用malloc()或free()之前,保存先前的勾子的值,把它们存储起来。如果你不这么做,你的程序将陷入无尽的递归。看看libc info page给的一个内存调试的例子来看看相关细节,最后一点,勾子也被mcheck和mtrace系统使用。在使用所有它们的组合的时候,小心是没错的。而下面的是关于多线程的:

创建线程私有实例 arena_key,该私有实例保存的是分配区( arena )的 malloc_state 实例指针。 arena_key 指向的可能是主分配区的指针,也可能是非主分配区的指针,这里将调用 ptmalloc_init() 的线程的 arena_key 绑定到主分配区上。意味着本线程首选从主分配区分配内存。

然后调用 thread_atfork() 设置当前进程在 fork 子线程( linux 下线程是轻量级进程,使用类似 fork 进程的机制创建)时处理 mutex 的回调函数,在本进程 fork 子线程时,调用 ptmalloc_lock_all() 获得所有分配区的锁,禁止所有分配区分配内存,当子线程创建完毕,父进程调用 ptmalloc_unlock_all() 重新 unlock 每个分配区的锁 mutex ,子线程调用 ptmalloc_unlock_all2() 重新初始化每个分配区的锁 mutex

点击(此处)折叠或打开

tsd_key_create (&arena_key, NULL);

tsd_setspecific (arena_key, (void *) &main_arena);

thread_atfork (ptmalloc_lock_all, ptmalloc_unlock_all, ptmalloc_unlock_all2);

当有多个线程同时申请访问内存的时候,arena_key的main_arena处于保持互斥锁状态,那么为了提高效率即上面的代码,保证了在获取不到主分区的时候,调用arena_get2自动创建次分区state。见代码:

点击(此处)折叠或打开

#define arena_lookup(ptr) do { \

void *vptr = NULL;                         \

ptr = (mstate) tsd_getspecific (arena_key, vptr);             \

} while (0)

点击(此处)折叠或打开

#define arena_lock(ptr, size) do {                     \

if (ptr)                                 \

(void) mutex_lock (&ptr->mutex);                 \

else                                 \

ptr = arena_get2 (ptr, (size), NULL);                 \

} while (0)

在继续之前我们补一下关键的数据结构:

点击(此处)折叠或打开

struct malloc_state

{

/* Serialize access. */

mutex_t mutex;

/* Flags (formerly in max_fast). */

int flags;

/* Fastbins */

mfastbinptr fastbinsY[NFASTBINS];

/* Base of the topmost chunk -- not otherwise kept in a bin */

mchunkptr top;

/* The remainder from the most recent split of a small request */

mchunkptr last_remainder;

/* Normal bins packed as described above */

mchunkptr bins[NBINS * 2 - 2];

/* Bitmap of bins */

unsigned int binmap[BINMAPSIZE];

/* Linked list */

struct malloc_state *next;

/* Linked list for free arenas. */

struct malloc_state *next_free;

/* Memory allocated from the system in this arena. */

INTERNAL_SIZE_T system_mem;

INTERNAL_SIZE_T max_system_mem;

}

还有具体分配的chunk:关于它的注释部分这么就不翻译了,但需要好好看看。

点击(此处)折叠或打开

/*

----------------------- Chunk representations -----------------------

*/

/*

This struct declaration is misleading (but accurate and necessary).

It declares a "view" into memory allowing access to necessary

fields at known offsets from a given base. See explanation below.

*/

struct malloc_chunk {

INTERNAL_SIZE_T prev_size; /* Size of previous chunk (if free). */

INTERNAL_SIZE_T size; /* Size in bytes, including overhead. */

struct malloc_chunk* fd; /* double links -- used only if free. */

struct malloc_chunk* bk;

/* Only used for large blocks: pointer to next larger size. */

struct malloc_chunk* fd_nextsize; /* double links -- used only if free. */

struct malloc_chunk* bk_nextsize;

};

/*

malloc_chunk details:

(The following includes lightly edited explanations by Colin Plumb.)

Chunks of memory are maintained using a `boundary tag' method as

described in e.g., Knuth or Standish. (See the paper by Paul

Wilson ftp://ftp.cs.utexas.edu/pub/garbage/allocsrv.ps for a

survey of such techniques.) Sizes of free chunks are stored both

in the front of each chunk and at the end. This makes

consolidating fragmented chunks into bigger chunks very fast. The

size fields also hold bits representing whether chunks are free or

in use.

An allocated chunk looks like this:

chunk-> +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+

| Size of previous chunk, if allocated | |

+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+

| Size of chunk, in bytes |M|P|

mem-> +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+

| User data starts here... .

. .

. (malloc_usable_size() bytes) .

. |

nextchunk-> +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+

| Size of chunk |

+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+

Where "chunk" is the front of the chunk for the purpose of most of

the malloc code, but "mem" is the pointer that is returned to the

user. "Nextchunk" is the beginning of the next contiguous chunk.

Chunks always begin on even word boundaries, so the mem portion

(which is returned to the user) is also on an even word boundary, and

thus at least double-word aligned.

Free chunks are stored in circular doubly-linked lists, and look like this:

chunk-> +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+

| Size of previous chunk |

+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+

`head:' | Size of chunk, in bytes |P|

mem-> +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+

| Forward pointer to next chunk in list |

+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+

| Back pointer to previous chunk in list |

+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+

| Unused space (may be 0 bytes long) .

. .

. |

nextchunk-> +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+

`foot:' | Size of chunk, in bytes |

+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+

The P (PREV_INUSE) bit, stored in the unused low-order bit of the

chunk size (which is always a multiple of two words), is an in-use

bit for the *previous* chunk. If that bit is *clear*, then the

word before the current chunk size contains the previous chunk

size, and can be used to find the front of the previous chunk.

The very first chunk allocated always has this bit set,

preventing access to non-existent (or non-owned) memory. If

prev_inuse is set for any given chunk, then you CANNOT determine

the size of the previous chunk, and might even get a memory

addressing fault when trying to do so.

Note that the `foot' of the current chunk is actually represented

as the prev_size of the NEXT chunk. This makes it easier to

deal with alignments etc but can be very confusing when trying

to extend or adapt this code.

The two exceptions to all this are

1. The special chunk `top' doesn't bother using the

trailing size field since there is no next contiguous chunk

that would have to index off it. After initialization, `top'

is forced to always exist. If it would become less than

MINSIZE bytes long, it is replenished.

2. Chunks allocated via mmap, which have the second-lowest-order

bit M (IS_MMAPPED) set in their size fields. Because they are

allocated one-by-one, each must contain its own trailing size field.

*/

实际分配的chunk图,空间里如何布局的:

f332d235f6526873db0950a4351ccbe1.png

而空的chunk结构如下图:

c6058b75125c355adcf4b9594fe9b46b.png

因为后边代码就是按照这个结构来操作的.

继续回到__libc_malloc函数,hook处理完之后,Arena_lookup查询arena_key,当然不为空,前面第一次调用hook时已经赋值。(如果多线程下,获取不到main_arena,则分配次分区,这个前面也讨论过)那么获得互斥锁。

进入内存分配的核心函数_int_malloc,它是malloc分配的核心代码和实现.代码挺多,自行分析.

1.判断申请的空间是否在fastbin,如果在则申请返回,否则继续(<64B,一般小字节chunk释放后放在这里)

2.判断申请的空间是否在smallbin(小于512B),如果是申请返回否则在largebin中

3.前两个都不在,那么肯定在largebin,计算索引,继续

4.进入for(;;)后续处理.主要是垃圾回收工作。如果垃圾回收也不行,则进入use_top chunk

5.       use_top  chunk申请,如果没有,则调用sysmalloc扩展heap,如下:

点击(此处)折叠或打开

/*

Otherwise, relay to handle system-dependent cases

*/

else

{

void *p = sysmalloc (nb, av);

if (p != NULL)

alloc_perturb (p, bytes);

return p;

}

对于第一次调用malloc它直接到sysmalloc来扩展heap,自测的例子是先申请200字节的空间.由于程序一开始fast_max为0,所以肯定在smallbins分类中,但是由于初始化,所以

会调用malloc_consolidate来初始化bins,见malloc_init_state(av);:

点击(此处)折叠或打开

/*

Initialize a malloc_state struct.

This is called only from within malloc_consolidate, which needs

be called in the same contexts anyway. It is never called directly

outside of malloc_consolidate because some optimizing compilers try

to inline it at all call points, which turns out not to be an

optimization at all. (Inlining it in malloc_consolidate is fine though.)

*/

static void

malloc_init_state (mstate av)

{

int i;

mbinptr bin;

/* Establish circular links for normal bins */

for (i = 1; i < NBINS; ++i)

{

bin = bin_at (av, i);

bin->fd = bin->bk = bin;   //  链表初始化指向自己

}

#if MORECORE_CONTIGUOUS

if (av != &main_arena)

#endif

set_noncontiguous (av);

if (av == &main_arena)

set_max_fast (DEFAULT_MXFAST);            //  设置fastbin max 为 64B

av->flags |= FASTCHUNKS_BIT;

av->top = initial_top (av);

}

我们进入sysmalloc,一开始判断申请的nb是否大于需要map的阀值,如果大于则进入mmap。一般大于128K,它可以动态调整

点击(此处)折叠或打开

/*

MMAP_THRESHOLD_MAX and _MIN are the bounds on the dynamically

adjusted MMAP_THRESHOLD.

*/

#ifndef DEFAULT_MMAP_THRESHOLD_MIN

#define DEFAULT_MMAP_THRESHOLD_MIN (128 * 1024)

#endif

#ifndef DEFAULT_MMAP_THRESHOLD_MAX

/* For 32-bit platforms we cannot increase the maximum mmap

threshold much because it is also the minimum value for the

maximum heap size and its alignment. Going above 512k (i.e., 1M

for new heaps) wastes too much address space. */

# if __WORDSIZE == 32

# define DEFAULT_MMAP_THRESHOLD_MAX (512 * 1024)

# else

# define DEFAULT_MMAP_THRESHOLD_MAX (4 * 1024 * 1024 * sizeof(long))

# endif

#endi

然后是判断是主分配区或非主分配区,分别不同处理。

这里进入主分配,我们看下部分核心分配代码:

点击(此处)折叠或打开

else /* av == main_arena */

{ /* Request enough space for nb + pad + overhead */

size = nb + mp_.top_pad + MINSIZE;

/*

If contiguous, we can subtract out existing space that we hope to

combine with new space. We add it back later only if

we don't actually get contiguous space.

*/

if (contiguous (av))

size -= old_size;

/*

Round to a multiple of page size.

If MORECORE is not contiguous, this ensures that we only call it

with whole-page arguments. And if MORECORE is contiguous and

this is not first time through, this preserves page-alignment of

previous calls. Otherwise, we correct to page-align below.

*/

size = (size + pagemask) & ~pagemask;

/*

Don't try to call MORECORE if argument is so big as to appear

negative. Note that since mmap takes size_t arg, it may succeed

below even if we cannot call MORECORE.

*/

if (size > 0)

{

brk = (char *) (MORECORE (size));

LIBC_PROBE (memory_sbrk_more, 2, brk, size);

}

if (brk != (char *) (MORECORE_FAILURE))

{

/* Call the `morecore' hook if necessary. */

void (*hook) (void) = atomic_forced_read (__after_morecore_hook);

if (__builtin_expect (hook != NULL, 0))

(*hook)();

}

else

{

由于申请的是200B,8字节对齐为208B,而mp_.top_pad用的默认值为7个pages(0x20000),MINSIZE为16B.后边还需要page对齐,所以需要申请8个page。

下面我们看关键的代码:

点击(此处)折叠或打开

brk = (char *) (MORECORE (size));

这个是什么?

点击(此处)折叠或打开

/* Definition for getting more memory from the OS. */

#define MORECORE (*__morecore)

#define MORECORE_FAILURE 0

void * __default_morecore (ptrdiff_t);

void *(*__morecore)(ptrdiff_t) = __default_morecore;

#include

/*

MORECORE-related declarations. By default, rely on sbrk

*/

/*

MORECORE is the name of the routine to call to obtain more memory

from the system. See below for general guidance on writing

alternative MORECORE functions, as well as a version for WIN32 and a

sample version for pre-OSX macos.

*/

#ifndef MORECORE

#define MORECORE sbrk

#endif

而__default_morecore是:

点击(此处)折叠或打开

/* Allocate INCREMENT more bytes of data space,

and return the start of data space, or NULL on errors.

If INCREMENT is negative, shrink data space. */

void *

__default_morecore (ptrdiff_t increment)

{

void *result = (void *) __sbrk (increment);

if (result == (void *) -1)

return NULL;

return result;

}

libc_hidden_def (__default_morecore)

这里解释下sbrk:

sbrk不是系统调用,是C库函数。系统调用通常提供一种最小功能,而库函数通常提供比较复杂的功能。sbrk/brk是从堆中分配空间,本质是移动一个位置,向后移就是分配空间,向前移就是释放空间,sbrk用相对的整数值确定位置,如果这个整数是正数,会从当前位置向后移若干字节,如果为负数就向前若干字节。在任何情况下,返回值永远是移动之前的位置。sbrk是brk的封装。

默认mp_.sbrk_base为空。所以需要:

点击(此处)折叠或打开

if (mp_.sbrk_base == 0)

mp_.sbrk_base = brk;

av->system_mem默认也为0

点击(此处)折叠或打开

av->system_mem += size;

然后需要做一些调整:

点击(此处)折叠或打开

/*

Otherwise, make adjustments:

* If the first time through or noncontiguous, we need to call sbrk

just to find out where the end of memory lies.

* We need to ensure that all returned chunks from malloc will meet

MALLOC_ALIGNMENT

* If there was an intervening foreign sbrk, we need to adjust sbrk

request size to account for fact that we will not be able to

combine new space with existing space in old_top.

* Almost all systems internally allocate whole pages at a time, in

which case we might as well use the whole last page of request.

So we allocate enough more memory to hit a page boundary now,

which in turn causes future contiguous calls to page-align.

*/

else

{

front_misalign = 0;

end_misalign = 0;

correction = 0;

aligned_brk = brk;

/* handle contiguous cases */

if (contiguous (av))

{

/* Count foreign sbrk as system_mem. */

后面有这么一句:由于correction为0,所以返回当前的值.

点击(此处)折叠或打开

snd_brk = (char *) (MORECORE (correction));

最后来分配空间:

点击(此处)折叠或打开

/* finally, do the allocation */

p = av->top;

size = chunksize (p);

/* check that one of the above allocation paths succeeded */

if ((unsigned long) (size) >= (unsigned long) (nb + MINSIZE))    // size 为top->size  ,为刚申请空间的大小. 我们的例子是0x21000 (8pages)而nb为208B

{

remainder_size = size - nb;// 0x2100 - 208(0xd0)

remainder = chunk_at_offset (p, nb);

av->top = remainder;                                 // 改变top的指针

set_head (p, nb | PREV_INUSE | (av != &main_arena ? NON_MAIN_ARENA : 0));

set_head (remainder, remainder_size | PREV_INUSE);

check_malloced_chunk (av, p, nb);

return chunk2mem (p);

}

av->top是什么值呢?

点击(此处)折叠或打开

/* Adjust top based on results of second sbrk */

if (snd_brk != (char *) (MORECORE_FAILURE))

{

av->top = (mchunkptr) aligned_brk;    //      aligned_brk = brk;  当然如果需要对齐,aligned_brk会偏移一些字节

也就是top就是一个指向heap开始的指针.并转换为struct malloc_chunk 指针.和我们上面的 图就对应起来了。

然后重新设置top指针,和size的标志位,偏移过pre_size和size,就是实际数据地址即return chunk2mem(p);

如果我们紧接着申请了200B后,马上申请16B,由于fastbins虽然设置了max 为64B但是它里面的chunk是free的时候放置进来的,目前为空。

所以继续进入smallbin。同理由于没有free的small chunk 。所以进入top chunk 分配成功:

点击(此处)折叠或打开

use_top:

/*

If large enough, split off the chunk bordering the end of memory

(held in av->top). Note that this is in accord with the best-fit

search rule. In effect, av->top is treated as larger (and thus

less well fitting) than any other available chunk since it can

be extended to be as large as necessary (up to system

limitations).

We require that av->top always exists (i.e., has size >=

MINSIZE) after initialization, so if it would otherwise be

exhausted by current request, it is replenished. (The main

reason for ensuring it exists is that we may need MINSIZE space

to put in fenceposts in sysmalloc.)

*/

victim = av->top;

size = chunksize (victim);

if ((unsigned long) (size) >= (unsigned long) (nb + MINSIZE))

{

remainder_size = size - nb;

remainder = chunk_at_offset (victim, nb);

av->top = remainder;

set_head (victim, nb | PREV_INUSE |

(av != &main_arena ? NON_MAIN_ARENA : 0));

set_head (remainder, remainder_size | PREV_INUSE);

check_malloced_chunk (av, victim, nb);

void *p = chunk2mem (victim);

alloc_perturb (p, bytes);

return p;

}

当然如果我们释放了16B后,有马上申请16B,那么它会直接进入fastbin并申请返回成功。,这里我们知道当第一次使用的时候不论什么bin都是空的,只有当多次使用多次释放的时候才会体会出来它的优势和效率来.

这里附上自己测试的小程序:

点击(此处)折叠或打开

#include

#include

#include

int main(void)

{

char *p,*q;

void * brk;

brk=sbrk(0);

printf("brk is ....%p...\n",brk);

p = (char *)malloc(200);

if(p==NULL)

return 1;

strcpy(p,"hello");

brk=sbrk(100);

printf("111....brk is ....%p...\n",brk);

printf("200,p is %s...\n",p);

q= (char *)malloc(16);

if(q==NULL)

return 1;

strcpy(q,"nihao");

printf("16,q is %s...\n",q);

free(q);

free(p);

p= (char *)malloc(16);

return 0;

}

关于不论fastbin还是smallbin的机制,或许我们记得在《深入理解计算机系统》中,讲到垃圾回收的时候,脚注法。书和代码一起看效果会不错.

内存的延迟分配,只有在真正访问一个地址的时候才建立这个地址的物理映射,这是Linux内存管理的基本思想之一

还有就是:内核默认配置下,进程的栈和mmap映射区域并不是从一个固定地址开始,并且每次启动时的值都不一样,这是程序在启动时随机改变这些值的设置,使得使用缓冲区溢出进行攻击更加困难。当然也可以让进程的栈和mmap映射区域从一个固定位置开始,只需要设置全局变量randomize_va_space值为0,这个变量默认值为1。用户可以通过设置/proc/sys/kernel/randomize_va_space来停用该特性,也可以用如下命令:sudo sysctl -w kernel.randomize_va_space=0

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/354018.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

新生必会的linux命令,jstat命令详解

导读Jstat是JDK自带的一个轻量级小工具。全称“Java Virtual Machine statistics monitoring tool”&#xff0c;它位于java的bin目录下&#xff0c;主要利用JVM内建的指令对Java应用程序的资源和性能进行实时的命令行的监控&#xff0c;包括了对Heap size和垃圾回收状况的监控…

linux 天文软件,新闻|开源新闻速递:天文软件 Stellarium 0.15.0 发布

今日关注Stellarium 0.15.0 发布。这是一款全世界最棒的免费、开源、跨平台的天文软件应用&#xff0c;用户可以通过该软件来观看实时的星星、行星还有星云。最新版本进行了非常多的功能完善&#xff0c;修复了若干bug&#xff0c;新增了许多新特性。比如更新了AstroCalc工具&a…

linux javaweb环境单价,linux(centos)下Java Web环境开发

一、安装jdk百度搜索jdk&#xff0c;进入http://www.oracle.com/technetwork/java/javase/downloads/index.html找到自己需要版本的jdk的Linux压缩包&#xff1b;复制出这个压缩包的下载地址(尽量先点击下载&#xff0c;然后在下载的界面复制出资源的链接)在服务器的合适位置创…

带有Java Util日志记录的Java 8延迟调用

在博客文章“在Log4j2中更好地执行非日志记录器调用”中 &#xff0c;我介绍了可以在Log4j 2中使用的方法&#xff0c;这些方法可以减少或避免在基于指定日志级别实际上根本未记录的日志语句中调用方法。 作为讨论的一部分&#xff0c;我介绍了Log4j 2对使用lambda表达式的基于…

python对象分类

1 python对象分类 所有的Python对象都拥有三个特性&#xff1a;身份&#xff0c;类型和值 身份&#xff1a; 每一个对象都有一个唯一的身份标识自己。任何对象的身份可以使用内建函数id()来得到。这个值可以被认为是该对象的内存地址类型&#xff1a; 对象的类型决定了对象可以…

怎样用u盘linux安装ntp协议,电脑中怎么配置NTP服务

NTP服务器是用来使计算机时间同步化的一种协议&#xff0c;可提供高精准度的时间校正&#xff0c;而且能通过加密确认来防止恶毒的协议攻击。下面让学习啦小编为大家介绍如何在电脑中配置NTP服务来实现局域网内设备的时间同步。电脑中怎么配置NTP服务1、先关闭Windows系统自带的…

SetGID 权限

一、SetGID针对文件的作用 1、只有可执行的二进制程序才能设置SGID权限 2、命令执行者要对该程序拥有 x &#xff08;执行&#xff09;权限 3、命令执行在执行程序的时候&#xff0c;组身份升级为该程序的属组 4、SetGID权限同样只在该程序执行过程中有效&#xff0c;也就是说组…

jsf组件不显示_JSF组件库–质量不只是零缺陷

jsf组件不显示自从我上次查看三个主要JSF组件库的质量以来已经有一段时间了。 在2009年12月&#xff0c;我开始比较RichFaces&#xff0c;Primefaces和ICEfaces的整体软件质量 。 从那时起&#xff0c;事情发生了变化&#xff0c;从现在开始&#xff0c;我想重新评估和更新它。…

linux安装mysql(shell一键安装)

1. 相关文件&#xff08;install_mysql.sh、my.cnf、mysqld相关内容在文中最后面&#xff09; 2. 将上面的文件上传到linux服务器某一目录下 3.给install_mysql.sh赋执行权限 # chmod x instll_mysql.sj 4. 执行install_mysql.sh # ./install_mysql.sh 5. 验证 6. install_mysq…

c语言编译时检查逻辑错误吗,C语言陷阱与技巧20节,自定义“编译时”assert方法,在代码编译阶段检查“逻辑”错误...

在C语言程序开发中&#xff0c;程序员写代码时应该考虑的“面面俱到”&#xff0c;这样才能写出功能稳定的程序。例如&#xff0c;在实现 open() 函数时&#xff0c;先完成它的功能固然是重要的&#xff0c;但是程序员还需要考虑各种“意外”&#xff0c;比如下面这种情况。假设…

影场与属性访问器界面

卡尔迪亚&#xff08;Carl Dea&#xff09;最近跟踪了我的一篇名为“ 保存内存”的博客文章&#xff01; 为属性使用阴影字段 。 在他的博客中&#xff0c;他建议使用一个称为“属性访问器”的接口来消除使用阴影字段所需的大量样板代码。 卡尔还提到他尚未用大量数据测试他的方…

信管家源代码c语言,用队列实现按层次创建二叉树的源代码,最好是C语言

满意答案Dcool2016.08.27采纳率&#xff1a;58% 等级&#xff1a;9已帮助&#xff1a;416人队列&#xff1f;&#xff1f;你每输入一个节点将其存入队列中&#xff0c;再输入它的左孩子&#xff0c;它的左孩子也会入队&#xff0c;我们取的时候应先取该节点的左孩子&#xf…

jboss4 java_JBoss核心Java Web服务

jboss4 java这篇博客文章涉及Web服务。 好吧&#xff0c;更确切地说&#xff0c;它处理JBoss上的“普通” java Web服务。 这意味着我们将创建一个没有任何其他框架&#xff08;例如CXF&#xff0c;Axis等&#xff09;的Web服务。 JBoss它自己提供对Web服务的支持。 因此&#…

Java中的注解是如何工作的?

自Java5.0版本引入注解之后&#xff0c;它就成为了Java平台中非常重要的一部分。开发过程中&#xff0c;我们也时常在应用代码中会看到诸如Override&#xff0c;Deprecated这样的注解。这篇文章中&#xff0c;我将向大家讲述到底什么是注解&#xff0c;为什么要引入注解&#x…

android 广告弹出层,安卓广告活动弹窗控件 android-adDialog

软件介绍android-adDialog&#xff0c;一个简单、强大的广告活动弹窗控件。显示一个默认广告弹窗&#xff0c;支持单广告活动、多广告活动&#xff0c;当弹窗显示多广告是默认显示底部小圆圈&#xff0c;当显示单活动时默认不显示底部小圆圈&#xff1b;默认支持弹窗从上&#…

(企业 / 公司项目)如何使用分布式任务调度框架Quartz集成 和 SpringBoot自带的定时任务集成?

SpringBoot自带的定时任务 首先在你的微服务项目中创建一个新的模块&#xff0c;定时调度模块 pom.xml里面关联公共模块common的依赖其他不需要改变 然后启动类别删&#xff0c;启动项目是否报错&#xff0c;写一个简单的测试类访问路径是否成功 package com.jiawa.train.bat…

在Spring中配置多个View解析器

1.简介 在Spring中&#xff0c;提供了View Resolver来使用模型中可用的数据来解析视图&#xff0c;而无需与JSP&#xff0c;Velocity或Thymeleaf等View技术紧密绑定。 Spring可以根据需要轻松灵活地配置一个或多个View Resolver 。 2. Spring MVC应用程序流程 在继续理解多个V…

android 知识体系

转载于:https://www.cnblogs.com/mamamia/p/8567570.html

android电视root权限获取,电视盒子/ 智能电视如何通过ADB获取ROOT权限?

如何通过adb获取root权限(安卓电视盒和智能电视通用)?Android 系统rom里面最主要的就3个文件&#xff1a;boot.img、system.img、userdata.img其中boot.img 存放着内核以及Android系统的配置信息&#xff0c;比如android系统各文件夹的读写权限&#xff0c;adb 的权限。所以如…

确定活动的热点垃圾收集器

StackOverflow问题查找正在运行哪种类型的垃圾收集 器&#xff0c;jvm的默认垃圾收集器 &#xff0c; 如何通过查看gc日志来查看正在运行的垃圾收集器&#xff1f; &#xff0c;以及如何知道HotSpot jvm的当前GC策略&#xff1f; 和博客文章如何以编程方式获取GC信息表明了人们…