Merge branch 'master' of github.com:tgiphil/mono
[mono.git] / mono / metadata / sgen-los.c
1 /*
2  * sgen-los.c: Simple generational GC.
3  *
4  * Author:
5  *      Paolo Molaro (lupus@ximian.com)
6  *
7  * Copyright 2005-2010 Novell, Inc (http://www.novell.com)
8  *
9  * Thread start/stop adapted from Boehm's GC:
10  * Copyright (c) 1994 by Xerox Corporation.  All rights reserved.
11  * Copyright (c) 1996 by Silicon Graphics.  All rights reserved.
12  * Copyright (c) 1998 by Fergus Henderson.  All rights reserved.
13  * Copyright (c) 2000-2004 by Hewlett-Packard Company.  All rights reserved.
14  *
15  * THIS MATERIAL IS PROVIDED AS IS, WITH ABSOLUTELY NO WARRANTY EXPRESSED
16  * OR IMPLIED.  ANY USE IS AT YOUR OWN RISK.
17  *
18  * Permission is hereby granted to use or copy this program
19  * for any purpose,  provided the above notices are retained on all copies.
20  * Permission to modify the code and to distribute modified code is granted,
21  * provided the above notices are retained, and a notice that the code was
22  * modified is included with the above copyright notice.
23  *
24  *
25  * Copyright 2001-2003 Ximian, Inc
26  * Copyright 2003-2010 Novell, Inc.
27  *
28  * Permission is hereby granted, free of charge, to any person obtaining
29  * a copy of this software and associated documentation files (the
30  * "Software"), to deal in the Software without restriction, including
31  * without limitation the rights to use, copy, modify, merge, publish,
32  * distribute, sublicense, and/or sell copies of the Software, and to
33  * permit persons to whom the Software is furnished to do so, subject to
34  * the following conditions:
35  *
36  * The above copyright notice and this permission notice shall be
37  * included in all copies or substantial portions of the Software.
38  *
39  * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND,
40  * EXPRESS OR IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF
41  * MERCHANTABILITY, FITNESS FOR A PARTICULAR PURPOSE AND
42  * NONINFRINGEMENT. IN NO EVENT SHALL THE AUTHORS OR COPYRIGHT HOLDERS BE
43  * LIABLE FOR ANY CLAIM, DAMAGES OR OTHER LIABILITY, WHETHER IN AN ACTION
44  * OF CONTRACT, TORT OR OTHERWISE, ARISING FROM, OUT OF OR IN CONNECTION
45  * WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE SOFTWARE.
46  */
47
48 #define LOS_SECTION_SIZE        (1024 * 1024)
49
50 /*
51  * This shouldn't be much smaller or larger than MAX_SMALL_OBJ_SIZE.
52  * Must be at least sizeof (LOSSection).
53  */
54 #define LOS_CHUNK_SIZE          4096
55 #define LOS_CHUNK_BITS          12
56
57 /* Largest object that can be allocated in a section. */
58 #define LOS_SECTION_OBJECT_LIMIT        (LOS_SECTION_SIZE - LOS_CHUNK_SIZE - sizeof (LOSObject))
59 //#define LOS_SECTION_OBJECT_LIMIT      0
60 #define LOS_SECTION_NUM_CHUNKS          ((LOS_SECTION_SIZE >> LOS_CHUNK_BITS) - 1)
61
62 #define LOS_SECTION_FOR_OBJ(obj)        ((LOSSection*)((mword)(obj) & ~(mword)(LOS_SECTION_SIZE - 1)))
63 #define LOS_CHUNK_INDEX(obj,section)    (((char*)(obj) - (char*)(section)) >> LOS_CHUNK_BITS)
64
65 #define LOS_NUM_FAST_SIZES              32
66
67 typedef struct _LOSObject LOSObject;
68 struct _LOSObject {
69         LOSObject *next;
70         mword size; /* this is the object size */
71         guint16 role;
72         int dummy; /* to have a sizeof (LOSObject) a multiple of ALLOC_ALIGN  and data starting at same alignment */
73         char data [MONO_ZERO_LEN_ARRAY];
74 };
75
76 typedef struct _LOSFreeChunks LOSFreeChunks;
77 struct _LOSFreeChunks {
78         LOSFreeChunks *next_size;
79         size_t size;
80 };
81
82 typedef struct _LOSSection LOSSection;
83 struct _LOSSection {
84         LOSSection *next;
85         int num_free_chunks;
86         unsigned char *free_chunk_map;
87 };
88
89 static LOSSection *los_sections = NULL;
90 static LOSObject *los_object_list = NULL;
91 static LOSFreeChunks *los_fast_free_lists [LOS_NUM_FAST_SIZES]; /* 0 is for larger sizes */
92 static mword los_memory_usage = 0;
93 static mword last_los_memory_usage = 0;
94 static mword los_num_objects = 0;
95 static int los_num_sections = 0;
96 static mword next_los_collection = 2*1024*1024; /* 2 MB, need to tune */
97
98 //#define USE_MALLOC
99 //#define LOS_CONSISTENCY_CHECK
100 //#define LOS_DUMMY
101
102 #ifdef LOS_DUMMY
103 #define LOS_SEGMENT_SIZE        (4096 * 1024)
104
105 static char *los_segment = NULL;
106 static int los_segment_index = 0;
107 #endif
108
109 #ifdef LOS_CONSISTENCY_CHECK
110 static void
111 los_consistency_check (void)
112 {
113         LOSSection *section;
114         LOSObject *obj;
115         int i;
116         mword memory_usage = 0;
117
118         for (obj = los_object_list; obj; obj = obj->next) {
119                 char *end = obj->data + obj->size;
120                 int start_index, num_chunks;
121
122                 memory_usage += obj->size;
123
124                 if (obj->size > LOS_SECTION_OBJECT_LIMIT)
125                         continue;
126
127                 section = LOS_SECTION_FOR_OBJ (obj);
128
129                 g_assert (end <= (char*)section + LOS_SECTION_SIZE);
130
131                 start_index = LOS_CHUNK_INDEX (obj, section);
132                 num_chunks = (obj->size + sizeof (LOSObject) + LOS_CHUNK_SIZE - 1) >> LOS_CHUNK_BITS;
133                 for (i = start_index; i < start_index + num_chunks; ++i)
134                         g_assert (!section->free_chunk_map [i]);
135         }
136
137         for (i = 0; i < LOS_NUM_FAST_SIZES; ++i) {
138                 LOSFreeChunks *size_chunks;
139                 for (size_chunks = los_fast_free_lists [i]; size_chunks; size_chunks = size_chunks->next_size) {
140                         LOSSection *section = LOS_SECTION_FOR_OBJ (size_chunks);
141                         int j, num_chunks, start_index;
142
143                         if (i == 0)
144                                 g_assert (size_chunks->size >= LOS_NUM_FAST_SIZES * LOS_CHUNK_SIZE);
145                         else
146                                 g_assert (size_chunks->size == i * LOS_CHUNK_SIZE);
147
148                         num_chunks = size_chunks->size >> LOS_CHUNK_BITS;
149                         start_index = LOS_CHUNK_INDEX (size_chunks, section);
150                         for (j = start_index; j < start_index + num_chunks; ++j)
151                                 g_assert (section->free_chunk_map [j]);
152                 }
153         }
154
155         g_assert (los_memory_usage == memory_usage);
156 }
157 #endif
158
159 static void
160 add_free_chunk (LOSFreeChunks *free_chunks, size_t size)
161 {
162         int num_chunks = size >> LOS_CHUNK_BITS;
163
164         free_chunks->size = size;
165
166         if (num_chunks >= LOS_NUM_FAST_SIZES)
167                 num_chunks = 0;
168         free_chunks->next_size = los_fast_free_lists [num_chunks];
169         los_fast_free_lists [num_chunks] = free_chunks;
170 }
171
172 static LOSFreeChunks*
173 get_from_size_list (LOSFreeChunks **list, size_t size)
174 {
175         LOSFreeChunks *free_chunks = NULL;
176         LOSSection *section;
177         int num_chunks, i, start_index;
178
179         g_assert ((size & (LOS_CHUNK_SIZE - 1)) == 0);
180
181         while (*list) {
182                 free_chunks = *list;
183                 if (free_chunks->size >= size)
184                         break;
185                 list = &(*list)->next_size;
186         }
187
188         if (!*list)
189                 return NULL;
190
191         *list = free_chunks->next_size;
192
193         if (free_chunks->size > size)
194                 add_free_chunk ((LOSFreeChunks*)((char*)free_chunks + size), free_chunks->size - size);
195
196         num_chunks = size >> LOS_CHUNK_BITS;
197
198         section = LOS_SECTION_FOR_OBJ (free_chunks);
199
200         start_index = LOS_CHUNK_INDEX (free_chunks, section);
201         for (i = start_index; i < start_index + num_chunks; ++i) {
202                 g_assert (section->free_chunk_map [i]);
203                 section->free_chunk_map [i] = 0;
204         }
205
206         section->num_free_chunks -= size >> LOS_CHUNK_BITS;
207         g_assert (section->num_free_chunks >= 0);
208
209         return free_chunks;
210 }
211
212 static LOSObject*
213 get_los_section_memory (size_t size)
214 {
215         LOSSection *section;
216         LOSFreeChunks *free_chunks;
217         int num_chunks;
218
219         size += LOS_CHUNK_SIZE - 1;
220         size &= ~(LOS_CHUNK_SIZE - 1);
221
222         num_chunks = size >> LOS_CHUNK_BITS;
223
224         g_assert (size > 0 && size - sizeof (LOSObject) <= LOS_SECTION_OBJECT_LIMIT);
225         g_assert (num_chunks > 0);
226
227  retry:
228         if (num_chunks >= LOS_NUM_FAST_SIZES) {
229                 free_chunks = get_from_size_list (&los_fast_free_lists [0], size);
230         } else {
231                 int i;
232                 for (i = num_chunks; i < LOS_NUM_FAST_SIZES; ++i) {
233                         free_chunks = get_from_size_list (&los_fast_free_lists [i], size);
234                         if (free_chunks)
235                                 break;
236                 }
237                 if (!free_chunks)
238                         free_chunks = get_from_size_list (&los_fast_free_lists [0], size);
239         }
240
241         if (free_chunks)
242                 return (LOSObject*)free_chunks;
243
244         section = get_os_memory_aligned (LOS_SECTION_SIZE, LOS_SECTION_SIZE, TRUE);
245
246         total_alloc += LOS_SECTION_SIZE;
247
248         free_chunks = (LOSFreeChunks*)((char*)section + LOS_CHUNK_SIZE);
249         free_chunks->size = LOS_SECTION_SIZE - LOS_CHUNK_SIZE;
250         free_chunks->next_size = los_fast_free_lists [0];
251         los_fast_free_lists [0] = free_chunks;
252
253         section->num_free_chunks = LOS_SECTION_NUM_CHUNKS;
254
255         section->free_chunk_map = (unsigned char*)section + sizeof (LOSSection);
256         g_assert (sizeof (LOSSection) + LOS_SECTION_NUM_CHUNKS + 1 <= LOS_CHUNK_SIZE);
257         section->free_chunk_map [0] = 0;
258         memset (section->free_chunk_map + 1, 1, LOS_SECTION_NUM_CHUNKS);
259
260         section->next = los_sections;
261         los_sections = section;
262
263         ++los_num_sections;
264
265         goto retry;
266 }
267
268 static void
269 free_los_section_memory (LOSObject *obj, size_t size)
270 {
271         LOSSection *section = LOS_SECTION_FOR_OBJ (obj);
272         int num_chunks, i, start_index;
273
274         size += LOS_CHUNK_SIZE - 1;
275         size &= ~(LOS_CHUNK_SIZE - 1);
276
277         num_chunks = size >> LOS_CHUNK_BITS;
278
279         g_assert (size > 0 && size - sizeof (LOSObject) <= LOS_SECTION_OBJECT_LIMIT);
280         g_assert (num_chunks > 0);
281
282         section->num_free_chunks += num_chunks;
283         g_assert (section->num_free_chunks <= LOS_SECTION_NUM_CHUNKS);
284
285         /*
286          * We could free the LOS section here if it's empty, but we
287          * can't unless we also remove its free chunks from the fast
288          * free lists.  Instead, we do it in los_sweep().
289          */
290
291         start_index = LOS_CHUNK_INDEX (obj, section);
292         for (i = start_index; i < start_index + num_chunks; ++i) {
293                 g_assert (!section->free_chunk_map [i]);
294                 section->free_chunk_map [i] = 1;
295         }
296
297         add_free_chunk ((LOSFreeChunks*)obj, size);
298 }
299
300 static void
301 free_large_object (LOSObject *obj)
302 {
303 #ifndef LOS_DUMMY
304         size_t size = obj->size;
305         DEBUG (4, fprintf (gc_debug_file, "Freed large object %p, size %lu\n", obj->data, (unsigned long)obj->size));
306         binary_protocol_empty (obj->data, obj->size);
307
308         los_memory_usage -= size;
309         los_num_objects--;
310
311 #ifdef USE_MALLOC
312         free (obj);
313 #else
314         if (size > LOS_SECTION_OBJECT_LIMIT) {
315                 size += sizeof (LOSObject);
316                 size += pagesize - 1;
317                 size &= ~(pagesize - 1);
318                 total_alloc -= size;
319                 free_os_memory (obj, size);
320         } else {
321                 free_los_section_memory (obj, size + sizeof (LOSObject));
322 #ifdef LOS_CONSISTENCY_CHECKS
323                 los_consistency_check ();
324 #endif
325         }
326 #endif
327 #endif
328 }
329
330 /*
331  * Objects with size >= MAX_SMALL_SIZE are allocated in the large object space.
332  * They are currently kept track of with a linked list.
333  * They don't move, so there is no need to pin them during collection
334  * and we avoid the memcpy overhead.
335  */
336 static void* __attribute__((noinline))
337 alloc_large_inner (MonoVTable *vtable, size_t size)
338 {
339         LOSObject *obj;
340         void **vtslot;
341
342         g_assert (size > MAX_SMALL_OBJ_SIZE);
343
344 #ifdef LOS_DUMMY
345         if (!los_segment)
346                 los_segment = get_os_memory (LOS_SEGMENT_SIZE, TRUE);
347         los_segment_index = ALIGN_UP (los_segment_index);
348
349         obj = (LOSObject*)(los_segment + los_segment_index);
350         los_segment_index += size + sizeof (LOSObject);
351         g_assert (los_segment_index <= LOS_SEGMENT_SIZE);
352 #else
353         if (need_major_collection ()) {
354                 DEBUG (4, fprintf (gc_debug_file, "Should trigger major collection: req size %zd (los already: %lu, limit: %lu)\n", size, (unsigned long)los_memory_usage, (unsigned long)next_los_collection));
355                 stop_world ();
356                 major_collection ("LOS overflow");
357                 restart_world ();
358         }
359
360 #ifdef USE_MALLOC
361         obj = malloc (size + sizeof (LOSObject));
362         memset (obj, 0, size + sizeof (LOSObject));
363 #else
364         if (size > LOS_SECTION_OBJECT_LIMIT) {
365                 size_t alloc_size = size;
366                 alloc_size += sizeof (LOSObject);
367                 alloc_size += pagesize - 1;
368                 alloc_size &= ~(pagesize - 1);
369                 /* FIXME: handle OOM */
370                 obj = get_os_memory (alloc_size, TRUE);
371                 total_alloc += alloc_size;
372         } else {
373                 obj = get_los_section_memory (size + sizeof (LOSObject));
374                 memset (obj, 0, size + sizeof (LOSObject));
375         }
376 #endif
377 #endif
378
379         g_assert (!((mword)obj->data & (ALLOC_ALIGN - 1)));
380         obj->size = size;
381         vtslot = (void**)obj->data;
382         *vtslot = vtable;
383         update_heap_boundaries ((mword)obj->data, (mword)obj->data + size);
384         obj->next = los_object_list;
385         los_object_list = obj;
386         los_memory_usage += size;
387         los_num_objects++;
388         DEBUG (4, fprintf (gc_debug_file, "Allocated large object %p, vtable: %p (%s), size: %zd\n", obj->data, vtable, vtable->klass->name, size));
389         binary_protocol_alloc (obj->data, vtable, size);
390
391 #ifdef LOS_CONSISTENCY_CHECK
392         los_consistency_check ();
393 #endif
394
395         return obj->data;
396 }
397
398 static void
399 los_sweep (void)
400 {
401         LOSSection *section, *prev;
402         int i;
403         int num_sections = 0;
404
405         for (i = 0; i < LOS_NUM_FAST_SIZES; ++i)
406                 los_fast_free_lists [i] = NULL;
407
408         prev = NULL;
409         section = los_sections;
410         while (section) {
411                 if (section->num_free_chunks == LOS_SECTION_NUM_CHUNKS) {
412                         LOSSection *next = section->next;
413                         if (prev)
414                                 prev->next = next;
415                         else
416                                 los_sections = next;
417                         free_os_memory (section, LOS_SECTION_SIZE);
418                         section = next;
419                         --los_num_sections;
420                         continue;
421                 }
422
423                 for (i = 0; i <= LOS_SECTION_NUM_CHUNKS; ++i) {
424                         if (section->free_chunk_map [i]) {
425                                 int j;
426                                 for (j = i + 1; j <= LOS_SECTION_NUM_CHUNKS && section->free_chunk_map [j]; ++j)
427                                         ;
428                                 add_free_chunk ((LOSFreeChunks*)((char*)section + (i << LOS_CHUNK_BITS)), (j - i) << LOS_CHUNK_BITS);
429                                 i = j - 1;
430                         }
431                 }
432
433                 prev = section;
434                 section = section->next;
435
436                 ++num_sections;
437         }
438
439 #ifdef LOS_CONSISTENCY_CHECK
440         los_consistency_check ();
441 #endif
442
443         /*
444         g_print ("LOS sections: %d  objects: %d  usage: %d\n", num_sections, los_num_objects, los_memory_usage);
445         for (i = 0; i < LOS_NUM_FAST_SIZES; ++i) {
446                 int num_chunks = 0;
447                 LOSFreeChunks *free_chunks;
448                 for (free_chunks = los_fast_free_lists [i]; free_chunks; free_chunks = free_chunks->next_size)
449                         ++num_chunks;
450                 g_print ("  %d: %d\n", i, num_chunks);
451         }
452         */
453
454         g_assert (los_num_sections == num_sections);
455 }