87cc412c672371ed8609566a362359e4d0936bf3
[mono.git] / mono / metadata / sgen-split-nursery.c
1 /*
2  * sgen-splliy-nursery.c: 3-space based nursery collector.
3  *
4  * Author:
5  *      Rodrigo Kumpera Kumpera <kumpera@gmail.com>
6  *
7  * Copyright 2001-2003 Ximian, Inc
8  * Copyright 2003-2010 Novell, Inc.
9  * Copyright 2011-2012 Xamarin Inc (http://www.xamarin.com)
10  * Copyright (C) 2012 Xamarin Inc
11  *
12  * This library is free software; you can redistribute it and/or
13  * modify it under the terms of the GNU Library General Public
14  * License 2.0 as published by the Free Software Foundation;
15  *
16  * This library is distributed in the hope that it will be useful,
17  * but WITHOUT ANY WARRANTY; without even the implied warranty of
18  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
19  * Library General Public License for more details.
20  *
21  * You should have received a copy of the GNU Library General Public
22  * License 2.0 along with this library; if not, write to the Free
23  * Software Foundation, Inc., 675 Mass Ave, Cambridge, MA 02139, USA.
24  */
25
26 #include "config.h"
27 #ifdef HAVE_SGEN_GC
28
29 #include "metadata/profiler-private.h"
30
31 #include "metadata/sgen-gc.h"
32 #include "metadata/sgen-protocol.h"
33 #include "metadata/sgen-layout-stats.h"
34 #include "utils/mono-memory-model.h"
35
36 /*
37 The nursery is logically divided into 3 spaces: Allocator space and two Survivor spaces.
38
39 Objects are born (allocated by the mutator) in the Allocator Space.
40
41 The Survivor spaces are divided in a copying collector style From and To spaces.
42 The hole of each space switch on each collection.
43
44 On each collection we process objects from the nursery this way:
45 Objects from the Allocator Space are evacuated into the To Space.
46 Objects from the Survivor From Space are evacuated into the old generation.
47
48
49 The nursery is physically divided in two parts, set by the promotion barrier.
50
51 The Allocator Space takes the botton part of the nursery.
52
53 The Survivor spaces are intermingled in the top part of the nursery. It's done
54 this way since the required size for the To Space depends on the survivor rate
55 of objects from the Allocator Space. 
56
57 During a collection when the object scan function see a nursery object it must
58 determine if the object needs to be evacuated or left in place. Originally, this
59 check was done by checking if a forwarding pointer is installed, but now an object
60 can be in the To Space, it won't have a forwarding pointer and it must be left in place.
61
62 In order to solve that we classify nursery memory been either in the From Space or in
63 the To Space. Since the Allocator Space has the same behavior as the Survivor From Space
64 they are unified for this purpoise - a bit confusing at first.
65
66 This from/to classification is done on a larger granule than object to make the check efficient
67 and, due to that, we must make sure that all fragemnts used to allocate memory from the To Space
68 are naturally aligned in both ends to that granule to avoid wronly classifying a From Space object.
69
70 TODO:
71 -The promotion barrier is statically defined to 50% of the nursery, it should be dinamically adjusted based
72 on survival rates;
73 -We apply the same promotion policy to all objects, finalizable ones should age longer in the nursery;
74 -We apply the same promotion policy to all stages of a collection, maybe we should promote more aggressively
75 objects from non-stack roots, specially those found in the remembered set;
76 -Fix our major collection trigger to happen before we do a minor GC and collect the nursery only once.
77 -Make the serial fragment allocator fast path inlineable
78 -Make aging threshold be based on survival rates and survivor occupancy;
79 -Change promotion barrier to be size and not address based;
80 -Pre allocate memory for young ages to make sure that on overflow only the older suffer;
81 -Get rid of par_alloc_buffer_refill_mutex so to the parallel collection of the nursery doesn't suck;
82 */
83
84 /*FIXME Move this to a separate header. */
85 #define _toi(ptr) ((size_t)ptr)
86 #define make_ptr_mask(bits) ((1 << bits) - 1)
87 #define align_down(ptr, bits) ((void*)(_toi(ptr) & ~make_ptr_mask (bits)))
88 #define align_up(ptr, bits) ((void*) ((_toi(ptr) + make_ptr_mask (bits)) & ~make_ptr_mask (bits)))
89
90 /*
91 Even though the effective max age is 255, aging that much doesn't make sense.
92 It might even make sense to use nimbles for age recording.
93 */
94 #define MAX_AGE 15
95
96 /*
97  * Each age has its allocation buffer.  Whenever an object is to be
98  * aged we try to fit it into its new age's allocation buffer.  If
99  * that is not possible we get new space from the fragment allocator
100  * and set the allocation buffer to that space (minus the space
101  * required for the object).
102  */
103
104 typedef struct {
105         char *next;
106         char *end;
107 } AgeAllocationBuffer;
108
109 /* Limits the ammount of memory the mutator can have. */
110 static char *promotion_barrier;
111
112 /*
113 Promotion age and alloc ratio are the two nursery knobs to control
114 how much effort we want to spend on young objects.
115
116 Allocation ratio should be the inverse of the expected survivor rate.
117 The more objects surviver, the smaller the alloc ratio much be so we can
118 age all objects.
119
120 Promote age depends on how much effort we want to spend aging objects before
121 we promote them to the old generation. If addional ages don't somewhat improve
122 mortality, it's better avoid as they increase the cost of minor collections.
123
124 */
125
126
127 /*
128 If we're evacuating an object with this age or more, promote it.
129 Age is the number of surviving collections of an object.
130 */
131 static int promote_age = 2;
132
133 /*
134 Initial ratio of allocation and survivor spaces.
135 This should be read as the fraction of the whole nursery dedicated
136 for the allocator space.
137 */
138 static float alloc_ratio = 60.f/100.f;
139
140
141 static char *region_age;
142 static size_t region_age_size;
143 static AgeAllocationBuffer age_alloc_buffers [MAX_AGE];
144
145 /* The collector allocs from here. */
146 static SgenFragmentAllocator collector_allocator;
147
148 static inline int
149 get_object_age (char *object)
150 {
151         size_t idx = (object - sgen_nursery_start) >> SGEN_TO_SPACE_GRANULE_BITS;
152         return region_age [idx];
153 }
154
155 static inline void
156 set_object_age (char *object, int age)
157 {
158         size_t idx = (object - sgen_nursery_start) >> SGEN_TO_SPACE_GRANULE_BITS;
159         region_age [idx] = age;
160 }
161
162 static void
163 set_age_in_range (char *start, char *end, int age)
164 {
165         char *region_start;
166         size_t region_idx, length;
167         region_idx = (start - sgen_nursery_start) >> SGEN_TO_SPACE_GRANULE_BITS;
168         region_start = &region_age [region_idx];
169         length = (end - start) >> SGEN_TO_SPACE_GRANULE_BITS;
170         memset (region_start, age, length);
171 }
172
173 static inline void
174 mark_bit (char *space_bitmap, char *pos)
175 {
176         size_t idx = (pos - sgen_nursery_start) >> SGEN_TO_SPACE_GRANULE_BITS;
177         size_t byte = idx / 8;
178         int bit = idx & 0x7;
179
180         g_assert (byte < sgen_space_bitmap_size);
181         space_bitmap [byte] |= 1 << bit;
182 }
183
184 static void
185 mark_bits_in_range (char *space_bitmap, char *start, char *end)
186 {
187         start = align_down (start, SGEN_TO_SPACE_GRANULE_BITS);
188         end = align_up (end, SGEN_TO_SPACE_GRANULE_BITS);
189
190         for (;start < end; start += SGEN_TO_SPACE_GRANULE_IN_BYTES)
191                 mark_bit (space_bitmap, start);
192 }
193
194 /*
195  * This splits the fragments at the point of the promotion barrier.
196  * Two allocator are actually involved here: The mutator allocator and
197  * the collector allocator.  This function is called with the
198  * collector, but it's a copy of the mutator allocator and contains
199  * all the fragments in the nursery.  The fragments below the
200  * promotion barrier are left with the mutator allocator and the ones
201  * above are put into the collector allocator.
202  */
203 static void
204 fragment_list_split (SgenFragmentAllocator *allocator)
205 {
206         SgenFragment *prev = NULL, *list = allocator->region_head;
207
208         while (list) {
209                 if (list->fragment_end > promotion_barrier) {
210                         if (list->fragment_start < promotion_barrier) {
211                                 SgenFragment *res = sgen_fragment_allocator_alloc ();
212
213                                 res->fragment_start = promotion_barrier;
214                                 res->fragment_next = promotion_barrier;
215                                 res->fragment_end = list->fragment_end;
216                                 res->next = list->next;
217                                 res->next_in_order = list->next_in_order;
218                                 g_assert (res->fragment_end > res->fragment_start);
219
220                                 list->fragment_end = promotion_barrier;
221                                 list->next = list->next_in_order = NULL;
222                                 set_age_in_range (list->fragment_start, list->fragment_end, 0);
223
224                                 allocator->region_head = allocator->alloc_head = res;
225                                 return;
226                         } else {
227                                 if (prev)
228                                         prev->next = prev->next_in_order = NULL;
229                                 allocator->region_head = allocator->alloc_head = list;
230                                 return;
231                         }
232                 }
233                 set_age_in_range (list->fragment_start, list->fragment_end, 0);
234                 prev = list;
235                 list = list->next;
236         }
237         allocator->region_head = allocator->alloc_head = NULL;
238 }
239
240 /******************************************Minor Collector API ************************************************/
241
242 #define AGE_ALLOC_BUFFER_MIN_SIZE SGEN_TO_SPACE_GRANULE_IN_BYTES
243 #define AGE_ALLOC_BUFFER_DESIRED_SIZE (SGEN_TO_SPACE_GRANULE_IN_BYTES * 8)
244
245 static char*
246 alloc_for_promotion_slow_path (int age, size_t objsize)
247 {
248         char *p;
249         size_t allocated_size;
250         size_t aligned_objsize = (size_t)align_up (objsize, SGEN_TO_SPACE_GRANULE_BITS);
251
252         p = sgen_fragment_allocator_serial_range_alloc (
253                 &collector_allocator,
254                 MAX (aligned_objsize, AGE_ALLOC_BUFFER_DESIRED_SIZE),
255                 MAX (aligned_objsize, AGE_ALLOC_BUFFER_MIN_SIZE),
256                 &allocated_size);
257         if (p) {
258                 set_age_in_range (p, p + allocated_size, age);
259                 sgen_clear_range (age_alloc_buffers [age].next, age_alloc_buffers [age].end);
260                 age_alloc_buffers [age].next = p + objsize;
261                 age_alloc_buffers [age].end = p + allocated_size;
262         }
263         return p;
264 }
265
266 static inline char*
267 alloc_for_promotion (MonoVTable *vtable, char *obj, size_t objsize, gboolean has_references)
268 {
269         char *p = NULL;
270         int age;
271
272         age = get_object_age (obj);
273         if (age >= promote_age)
274                 return major_collector.alloc_object (vtable, objsize, has_references);
275
276         /* Promote! */
277         ++age;
278
279         p = age_alloc_buffers [age].next;
280         if (G_LIKELY (p + objsize <= age_alloc_buffers [age].end)) {
281         age_alloc_buffers [age].next += objsize;
282         } else {
283                 p = alloc_for_promotion_slow_path (age, objsize);
284                 if (!p)
285                         return major_collector.alloc_object (vtable, objsize, has_references);
286         }
287
288         *(MonoVTable**)p = vtable;
289
290         return p;
291 }
292
293 static char*
294 minor_alloc_for_promotion (MonoVTable *vtable, char *obj, size_t objsize, gboolean has_references)
295 {
296         /*
297         We only need to check for a non-nursery object if we're doing a major collection.
298         */
299         if (!sgen_ptr_in_nursery (obj))
300                 return major_collector.alloc_object (vtable, objsize, has_references);
301
302         return alloc_for_promotion (vtable, obj, objsize, has_references);
303 }
304
305 static SgenFragment*
306 build_fragments_get_exclude_head (void)
307 {
308         int i;
309         for (i = 0; i < MAX_AGE; ++i) {
310                 /*If we OOM'd on the last collection ->end might be null while ->next not.*/
311                 if (age_alloc_buffers [i].end)
312                         sgen_clear_range (age_alloc_buffers [i].next, age_alloc_buffers [i].end);
313         }
314
315         return collector_allocator.region_head;
316 }
317
318 static void
319 build_fragments_release_exclude_head (void)
320 {
321         sgen_fragment_allocator_release (&collector_allocator);
322 }
323
324 static void
325 build_fragments_finish (SgenFragmentAllocator *allocator)
326 {
327         /* We split the fragment list based on the promotion barrier. */
328         collector_allocator = *allocator;
329         fragment_list_split (&collector_allocator);
330 }
331
332 static void
333 prepare_to_space (char *to_space_bitmap, size_t space_bitmap_size)
334 {
335         SgenFragment **previous, *frag;
336
337         memset (to_space_bitmap, 0, space_bitmap_size);
338         memset (age_alloc_buffers, 0, sizeof (age_alloc_buffers));
339
340         previous = &collector_allocator.alloc_head;
341
342         for (frag = *previous; frag; frag = *previous) {
343                 char *start = align_up (frag->fragment_next, SGEN_TO_SPACE_GRANULE_BITS);
344                 char *end = align_down (frag->fragment_end, SGEN_TO_SPACE_GRANULE_BITS);
345
346                 /* Fragment is too small to be usable. */
347                 if ((end - start) < SGEN_MAX_NURSERY_WASTE) {
348                         sgen_clear_range (frag->fragment_next, frag->fragment_end);
349                         frag->fragment_next = frag->fragment_end = frag->fragment_start;
350                         *previous = frag->next;
351                         continue;
352                 }
353
354                 /*
355                 We need to insert 3 phony objects so the fragments build step can correctly
356                 walk the nursery.
357                 */
358
359                 /* Clean the fragment range. */
360                 sgen_clear_range (start, end);
361                 /* We need a phony object in between the original fragment start and the effective one. */
362                 if (start != frag->fragment_next)
363                         sgen_clear_range (frag->fragment_next, start);
364                 /* We need an phony object in between the new fragment end and the original fragment end. */
365                 if (end != frag->fragment_end)
366                         sgen_clear_range (end, frag->fragment_end);
367
368                 frag->fragment_start = frag->fragment_next = start;
369                 frag->fragment_end = end;
370                 mark_bits_in_range (to_space_bitmap, start, end);
371                 previous = &frag->next;
372         }
373 }
374
375 static void
376 clear_fragments (void)
377 {
378         sgen_clear_allocator_fragments (&collector_allocator);
379 }
380
381 static void
382 init_nursery (SgenFragmentAllocator *allocator, char *start, char *end)
383 {
384         int alloc_quote = (int)((end - start) * alloc_ratio);
385         promotion_barrier = align_down (start + alloc_quote, 3);
386         sgen_fragment_allocator_add (allocator, start, promotion_barrier);
387         sgen_fragment_allocator_add (&collector_allocator, promotion_barrier, end);
388
389         region_age_size = (end - start) >> SGEN_TO_SPACE_GRANULE_BITS;
390         region_age = g_malloc0 (region_age_size);
391 }
392
393 static gboolean
394 handle_gc_param (const char *opt)
395 {
396         if (g_str_has_prefix (opt, "alloc-ratio=")) {
397                 const char *arg = strchr (opt, '=') + 1;
398                 int percentage = atoi (arg);
399                 if (percentage < 1 || percentage > 100) {
400                         fprintf (stderr, "alloc-ratio must be an integer in the range 1-100.\n");
401                         exit (1);
402                 }
403                 alloc_ratio = (float)percentage / 100.0f;
404                 return TRUE;
405         }
406
407         if (g_str_has_prefix (opt, "promotion-age=")) {
408                 const char *arg = strchr (opt, '=') + 1;
409                 promote_age = atoi (arg);
410                 if (promote_age < 1 || promote_age >= MAX_AGE) {
411                         fprintf (stderr, "promotion-age must be an integer in the range 1-%d.\n", MAX_AGE - 1);
412                         exit (1);
413                 }
414                 return TRUE;
415         }
416         return FALSE;
417 }
418
419 static void
420 print_gc_param_usage (void)
421 {
422         fprintf (stderr,
423                         ""
424                         "  alloc-ratio=P (where P is a percentage, an integer in 1-100)\n"
425                         "  promotion-age=P (where P is a number, an integer in 1-%d)\n",
426                         MAX_AGE - 1
427                         );
428 }
429
430 /******************************************Copy/Scan functins ************************************************/
431
432 #define SGEN_SPLIT_NURSERY
433
434 #define SERIAL_COPY_OBJECT split_nursery_serial_copy_object
435 #define SERIAL_COPY_OBJECT_FROM_OBJ split_nursery_serial_copy_object_from_obj
436
437 #include "sgen-minor-copy-object.h"
438 #include "sgen-minor-scan-object.h"
439
440 void
441 sgen_split_nursery_init (SgenMinorCollector *collector)
442 {
443         collector->is_split = TRUE;
444
445         collector->alloc_for_promotion = minor_alloc_for_promotion;
446
447         collector->prepare_to_space = prepare_to_space;
448         collector->clear_fragments = clear_fragments;
449         collector->build_fragments_get_exclude_head = build_fragments_get_exclude_head;
450         collector->build_fragments_release_exclude_head = build_fragments_release_exclude_head;
451         collector->build_fragments_finish = build_fragments_finish;
452         collector->init_nursery = init_nursery;
453         collector->handle_gc_param = handle_gc_param;
454         collector->print_gc_param_usage = print_gc_param_usage;
455
456         FILL_MINOR_COLLECTOR_COPY_OBJECT (collector);
457         FILL_MINOR_COLLECTOR_SCAN_OBJECT (collector);
458 }
459
460
461 #endif