malloc源码分析—_int_malloc
上一章分析了_int_malloc
中的fastbin、smallbin和部分largebin的处理,本章继续往下看余下的代码。最后会对整个_int_malloc
做一个总结。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60
| static void * _int_malloc(mstate av, size_t bytes) {
...
for (;;) { int iters = 0; while ((victim = unsorted_chunks (av)->bk) != unsorted_chunks (av)){ bck = victim->bk; if (__builtin_expect(victim->size <= 2 * SIZE_SZ, 0) || __builtin_expect(victim->size > av->system_mem, 0)) malloc_printerr(check_action, "malloc(): memory corruption", chunk2mem(victim), av); size = chunksize(victim);
if (in_smallbin_range (nb) && bck == unsorted_chunks (av) && victim == av->last_remainder && (unsigned long) (size) > (unsigned long) (nb + MINSIZE)) { remainder_size = size - nb; remainder = chunk_at_offset(victim, nb); unsorted_chunks (av)->bk = unsorted_chunks (av)->fd = remainder; av->last_remainder = remainder; remainder->bk = remainder->fd = unsorted_chunks (av); if (!in_smallbin_range(remainder_size)) { remainder->fd_nextsize = NULL; remainder->bk_nextsize = NULL; }
set_head(victim, nb | PREV_INUSE | (av != &main_arena ? NON_MAIN_ARENA : 0)); set_head(remainder, remainder_size | PREV_INUSE); set_foot(remainder, remainder_size);
check_malloced_chunk (av, victim, nb); void *p = chunk2mem(victim); alloc_perturb(p, bytes); return p; }
unsorted_chunks (av)->bk = bck; bck->fd = unsorted_chunks (av);
if (size == nb) { set_inuse_bit_at_offset(victim, size); if (av != &main_arena) victim->size |= NON_MAIN_ARENA; check_malloced_chunk (av, victim, nb); void *p = chunk2mem(victim); alloc_perturb(p, bytes); return p; }
...
}
...
} }
|
这部分代码的整体意思就是遍历unsortedbin,从中查找是否有符合用户要求大小的chunk并返回。
第一个while循环从尾到头依次取出unsortedbin中的所有chunk,将该chunk对应的前一个chunk保存在bck
中,并将大小保存在size
中。
如果用户需要分配的内存大小对应的chunk属于smallbin,unsortedbin中只有这一个chunk,并且该chunk属于last remainder chunk且其大小大于用户需要分配内存大小对应的chunk大小加上最小的chunk大小(保证可以拆开成两个chunk),就将该chunk拆开成两个chunk,分别为victim
和remainder
,进行相应的设置后,将用户需要的victim
返回。
如果不能拆开,就从unsortedbin中取出该chunk(victim
)。
再下来,如果刚刚从unsortedbin中取出的victim
正好是用户需要的大小nb
,就设置相应的标志位,直接返回该victim
。
继续往下看_int_malloc
函数,为了使整个代码结构清晰,这里保留了外层的for循环和while循环。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66
| static void * _int_malloc(mstate av, size_t bytes) {
...
for (;;) { int iters = 0; while ((victim = unsorted_chunks (av)->bk) != unsorted_chunks (av)){
...
if (in_smallbin_range(size)) { victim_index = smallbin_index(size); bck = bin_at (av, victim_index); fwd = bck->fd; } else { victim_index = largebin_index(size); bck = bin_at (av, victim_index); fwd = bck->fd;
if (fwd != bck) { size |= PREV_INUSE; assert((bck->bk->size & NON_MAIN_ARENA) == 0); if ((unsigned long) (size) < (unsigned long) (bck->bk->size)) { fwd = bck; bck = bck->bk;
victim->fd_nextsize = fwd->fd; victim->bk_nextsize = fwd->fd->bk_nextsize; fwd->fd->bk_nextsize = victim->bk_nextsize->fd_nextsize = victim; } else { assert((fwd->size & NON_MAIN_ARENA) == 0); while ((unsigned long) size < fwd->size) { fwd = fwd->fd_nextsize; assert((fwd->size & NON_MAIN_ARENA) == 0); }
if ((unsigned long) size == (unsigned long) fwd->size) fwd = fwd->fd; else { victim->fd_nextsize = fwd; victim->bk_nextsize = fwd->bk_nextsize; fwd->bk_nextsize = victim; victim->bk_nextsize->fd_nextsize = victim; } bck = fwd->bk; } } else victim->fd_nextsize = victim->bk_nextsize = victim; }
mark_bin(av, victim_index); victim->bk = bck; victim->fd = fwd; fwd->bk = victim; bck->fd = victim;
#define MAX_ITERS 10000 if (++iters >= MAX_ITERS) break; }
...
} }
|
这部分代码的整体意思是如果从unsortedbin中取出的chunk不符合用户要求的大小,就将该chunk合并到smallbin或者largebin中。
首先如果取出的chunk(victim)属于smallbin,就通过smallbin_index
计算需要插入的位置victim_index
,然后获取smallbin中对应位置的链表头指针保存在bck
中,最后直接插入到smallbin中,由于smallbin中的chunk不使用fd_nextsize
和bk_nextsize
指针,插入操作只需要更新bk
和fd
指针,具体的插入操作在后面。这里需解释一下,fd_nextsize
指针指向的是chunk双向链表中下一个大小不同的chunk,bk_nextsize
指向的是chunk双向链表中前一个大小不同的chunk。
如果取出的chunk(victim)属于largebin,通过largebin_index
计算需要插入的位置victim_index
,然后获取largebin链表头指针保存在bck
中。
如果fwd
等于bck
,即bck->fd=bck
,则表示largebin中对应位置上的chunk双向链表为空,直接进入后面的else部分中,代码victim->fd_nextsize = victim->bk_nextsize = victim
表示插入到largebin中的victim是唯一的chunk,因此其fd_nextsize
和bk_nextsize
指针都指向自己。
如果fwd
不等于bck
,对应的chunk双向链表存在空闲chunk,这时就要在该链表中找到合适的位置插入了。因为largebin中的chunk链表是按照chunk大小从大到小排序的,如果victim
的size
小于bck->bk->size
即最后一个chunk的大小,则表示即将插入victim
的大小在largebin的chunk双向链表中是最小的,因此要把victim
插入到该链表的最后。在这种情况下,经过操作后的结果如下所示(因为我手边的画图软件有限,这里就用符号“|”隔出数组,然后从代码中摘除核心的fd_nextsize
和bk_nextsize
指针的修改操作,对照这两个指针的意思,很容易看懂),
1 2 3 4 5
| | fwd(头指针) | fwd->fd | ... | bck | victim(插入到末尾) | fwd->fd->bk_nextsize = victim victim->bk_nextsize->fd_nextsize = victim victim->fd_nextsize = fwd->fd victim->bk_nextsize = fwd->fd->bk_nextsize
|
如果要插入的victim
的size
不是最小的,就要通过一个while循环遍历找到合适的位置,这里是从双向链表头bck->fd
开始遍历,利用fd_nextsize
加快遍历的速度,找到第一个size>=fwd->size
的chunk。如果size=fwd->size
,就只是改变victim
以及前后相应chunk的bk
、fd
指针就行。这里要特别注意,先做一个假设,假设chunk双向链表中A、B、C是三个不同大小的chunk集合,A集合有A0=A1=…,B集合有B0=B1=…,C集合有C0=C1=…,然后构造chunk链表,
| A0 | A1 | A2 | B0 | B1 | B2 | C0 | C1 | C2 |
特别注意,在ptmalloc中,只有A0、B0、C0可以配置fd_nextsize
和bk_nextsize
指针,其他位置是不用配置这两个指针的。因此相同大小的chunk只有最低地址的chunk会设置fd_nextsize
和bk_nextsize
指针。根据这个假设,很容易知道当两个size相等时,为什么要执行fwd = fwd->fd
,因为要保证插入victim的位置是相同大小的chunk的右边,即高地址的地方。插入后的链表如下,
1
| ...| bck | victim | fwd |...
|
链表中所有chunk的fd_nextsize
和bk_nextsize
指针不变。
再往下,如果size
不相等,则直接插入在fwd
的左边,这样也能保证所有的fd_nextsize
和bk_nextsize
指针设置在相同chunk大小的最地地址处(最左边)。插入后的链表如下,
1 2 3 4 5
| ...| bck | victim | fwd |... victim->fd_nextsize = fwd victim->bk_nextsize = fwd->bk_nextsize; fwd->bk_nextsize = victim fwd->bk_nextsize->fd_nextsize = victim
|
再往下,mark_bin
用来标识malloc_state
中的binmap
,标识相应位置的chunk空闲。然后就更改fd
、bk
指针,插入到双向链表中,这个插入操作同时适用于smallbin和largebin,因此放在这里。最后如果在unsortedbin中处理了超过10000个chunk,就直接退出循环,这里保证不会因为unsortedbin中chunk太多,处理的时间太长了。
在这部分代码中,有个size |= PREV_INUSE
是暂时让我比较费解的地方,经过分析后,暂时认为size |= PREV_INUSE
是没必要的,虽然不会产生错误,也不会影响largebin中的排序,并且注释说这行代码能加速排序,但没看出能加速的地方,经过分析这里反而会多出一个无效的指针赋值,希望往后看代码时能解决这里的问题,或者希望有人能解答这行代码的具体作用。
回到_int_malloc
函数中,继续往下看,为了使整个代码结构清晰,这里继续保留了外层的for循环。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61
| static void * _int_malloc(mstate av, size_t bytes) {
...
for (;;) {
...
if (!in_smallbin_range(nb)) { bin = bin_at (av, idx);
if ((victim = first(bin)) != bin && (unsigned long) (victim->size) >= (unsigned long) (nb)) { victim = victim->bk_nextsize; while (((unsigned long) (size = chunksize(victim)) < (unsigned long) (nb))) victim = victim->bk_nextsize;
if (victim != last(bin) && victim->size == victim->fd->size) victim = victim->fd;
remainder_size = size - nb; unlink(av, victim, bck, fwd);
if (remainder_size < MINSIZE) { set_inuse_bit_at_offset(victim, size); if (av != &main_arena) victim->size |= NON_MAIN_ARENA; } else { remainder = chunk_at_offset(victim, nb); bck = unsorted_chunks (av); fwd = bck->fd; if (__glibc_unlikely(fwd->bk != bck)) { errstr = "malloc(): corrupted unsorted chunks"; goto errout; } remainder->bk = bck; remainder->fd = fwd; bck->fd = remainder; fwd->bk = remainder; if (!in_smallbin_range(remainder_size)) { remainder->fd_nextsize = NULL; remainder->bk_nextsize = NULL; } set_head(victim, nb | PREV_INUSE | (av != &main_arena ? NON_MAIN_ARENA : 0)); set_head(remainder, remainder_size | PREV_INUSE); set_foot(remainder, remainder_size); } check_malloced_chunk (av, victim, nb); void *p = chunk2mem(victim); alloc_perturb(p, bytes); return p; } }
...
} }
|
这部分代码的整体意思就是要尝试从largebin中取出对应的chunk了。
这里的idx
是在前面(上一章分析的_int_malloc
函数前面一部分中)根据宏largebin_index
计算的。接下来就要根据idx
获得largebin中的双向链表头指针bin
,然后从bin->bk
开始从尾到头(根据chunk大小从小到大)遍历整个双向链表,找到第一个大于用户需要分配的chunk大小nb
的chunk指针victim
。
找到victim
后,需要将其拆开成两部分,第一部分是要返回给用户的chunk,第二部分分为两种情况,如果其大小小于MINSIZE
,则不能构成一个最小chunk,这种情况下就将拆开前的整个victim
返回给用户;如果大于MINSIZE
,就将拆开后的第二部分remainder
插入到unsortedbin中,然后把第一部分victim
返回给用户。
继续往下看_int_malloc
函数,
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82
| static void * _int_malloc(mstate av, size_t bytes) {
...
for (;;) {
...
++idx; bin = bin_at (av, idx); block = idx2block(idx); map = av->binmap[block]; bit = idx2bit(idx);
for (;;) { if (bit > map || bit == 0) { do { if (++block >= BINMAPSIZE) goto use_top; } while ((map = av->binmap[block]) == 0);
bin = bin_at (av, (block << BINMAPSHIFT)); bit = 1; }
while ((bit & map) == 0) { bin = next_bin(bin); bit <<= 1; assert(bit != 0); }
victim = last(bin); if (victim == bin) { av->binmap[block] = map &= ~bit; bin = next_bin(bin); bit <<= 1; }
else { size = chunksize(victim); assert((unsigned long ) (size) >= (unsigned long ) (nb)); remainder_size = size - nb; unlink(av, victim, bck, fwd); if (remainder_size < MINSIZE) { set_inuse_bit_at_offset(victim, size); if (av != &main_arena) victim->size |= NON_MAIN_ARENA; } else { remainder = chunk_at_offset(victim, nb); bck = unsorted_chunks (av); fwd = bck->fd; if (__glibc_unlikely(fwd->bk != bck)) { errstr = "malloc(): corrupted unsorted chunks 2"; goto errout; } remainder->bk = bck; remainder->fd = fwd; bck->fd = remainder; fwd->bk = remainder;
if (in_smallbin_range(nb)) av->last_remainder = remainder; if (!in_smallbin_range(remainder_size)) { remainder->fd_nextsize = NULL; remainder->bk_nextsize = NULL; } set_head(victim, nb | PREV_INUSE | (av != &main_arena ? NON_MAIN_ARENA : 0)); set_head(remainder, remainder_size | PREV_INUSE); set_foot(remainder, remainder_size); }check_malloced_chunk (av, victim, nb); void *p = chunk2mem(victim); alloc_perturb(p, bytes); return p; } }
...
} }
|
这一部分的整体意思是,前面在largebin中寻找特定大小的空闲chunk,如果没找到,这里就要遍历largebin中的其他更大的chunk双向链表,继续寻找。
开头的++idx
就表示,这里要从largebin中下一个更大的chunk双向链表开始遍历。ptmalloc中用一个bit表示malloc_state
的bins
数组中对应的位置上是否有空闲chunk,bit为1表示有,为0则没有。ptmalloc通过4个block(一个block 4字节)一共128个bit管理bins
数组。因此,代码中计算的block表示对应的idx
属于哪一个block,map
就表是block对应的bit组成的二进制数字。
接下来进入for循环,如果bit > map
,表示该map
对应的整个block
里都没有大于bit
位置的空闲的chunk,因此就要找下一个block
。因为后面的block
只要不等于0,就肯定有空闲chunk,并且其大小大于bit
位置对应的chunk,下面就根据block
,取出block
对应的第一个双向链表的头指针。这里也可以看出,设置map
和block
也是为了加快查找的速度。如果遍历完所有block
都没有空闲chunk,这时只能从top chunk里分配chunk了,因此跳转到use_top
。
如果有空闲chunk,接下来就通过一个while循环依次比较找出到底在哪个双向链表里存在空闲chunk,最后获得空闲chunk所在的双向链表的头指针bin
和位置bit
。
接下来,如果找到的双向链表又为空,则继续前面的遍历,找到空闲chunk所在的双向链表的头指针bin
和位置bit
。如果找到的双向链表不为空,就和上面一部分再largebin中找到空闲chunk的操作一样了,这里就不继续分析了。
继续往下看_int_malloc
,
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41
| static void * _int_malloc(mstate av, size_t bytes) {
...
for (;;) {
...
use_top:
victim = av->top; size = chunksize(victim);
if ((unsigned long) (size) >= (unsigned long) (nb + MINSIZE )) { remainder_size = size - nb; remainder = chunk_at_offset(victim, nb); av->top = remainder; set_head(victim, nb | PREV_INUSE | (av != &main_arena ? NON_MAIN_ARENA : 0)); set_head(remainder, remainder_size | PREV_INUSE);
check_malloced_chunk (av, victim, nb); void *p = chunk2mem(victim); alloc_perturb(p, bytes); return p; } else if (have_fastchunks(av)) { malloc_consolidate(av); if (in_smallbin_range(nb)) idx = smallbin_index(nb); else idx = largebin_index(nb); } else { void *p = sysmalloc(nb, av); if (p != NULL) alloc_perturb(p, bytes); return p; } } }
|
这里就是_int_malloc
的最后一部分了,这部分代码的整体意思分为三部分,首先从top chunk中尝试分配内存;如果失败,就检查fastbin中是否有空闲内存了(其他线程此时可能将释放的chunk放入fastbin中了),如果不空闲,就合并fastbin中的空闲chunk并放入smallbin或者largebin中,然后会回到_int_malloc
函数中最前面的for循环,重新开始查找空闲chunk;如果连fastbin中都没有空闲内存了,这时只能通过sysmalloc
从系统分配内存了,该函数前面几章里已经分析过了一部分了,下一章会再次进入这个函数进行分析。这部分代码很简单,关键函数前面几章都碰到过了,这里就不详细分析了。
总结
下面简单总结一遍_int_malloc
函数的整体思路。
第一步:如果进程没有关联的分配区,就通过sysmalloc
从操作系统分配内存。
第二步:从fastbin查找对应大小的chunk并返回,如果失败进入第三步。
第三步:从smallbin查找对应大小的chunk并返回,或者将fastbin中的空闲chunk合并放入unsortedbin中,如果失败进入第四步。
第四步:遍历unsortedbin,从unsortedbin中查找对应大小的chunk并返回,根据大小将unsortedbin中的空闲chunk插入smallbin或者largebin中。进入第五步。
第五步:从largebin指定位置查找对应大小的chunk并返回,如果失败进入第六步。
第六步:从largebin中大于指定位置的双向链表中查找对应大小的chunk并返回,如果失败进入第七步。
第七步:从topchunk中分配对应大小的chunk并返回,topchunk中没有足够的空间,就查找fastbin中是否有空闲chunk,如果有,就合并fastbin中的chunk并加入到unsortedbin中,然后跳回第四步。如果fastbin中没有空闲chunk,就通过sysmalloc
从操作系统分配内存。
注
本文章装载于此