Avoid computing GC maps if precise stack marking is disabled.
[mono.git] / mono / metadata / sgen-gc.h
1 /*
2  * Copyright 2001-2003 Ximian, Inc
3  * Copyright 2003-2010 Novell, Inc.
4  * 
5  * Permission is hereby granted, free of charge, to any person obtaining
6  * a copy of this software and associated documentation files (the
7  * "Software"), to deal in the Software without restriction, including
8  * without limitation the rights to use, copy, modify, merge, publish,
9  * distribute, sublicense, and/or sell copies of the Software, and to
10  * permit persons to whom the Software is furnished to do so, subject to
11  * the following conditions:
12  * 
13  * The above copyright notice and this permission notice shall be
14  * included in all copies or substantial portions of the Software.
15  * 
16  * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND,
17  * EXPRESS OR IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF
18  * MERCHANTABILITY, FITNESS FOR A PARTICULAR PURPOSE AND
19  * NONINFRINGEMENT. IN NO EVENT SHALL THE AUTHORS OR COPYRIGHT HOLDERS BE
20  * LIABLE FOR ANY CLAIM, DAMAGES OR OTHER LIABILITY, WHETHER IN AN ACTION
21  * OF CONTRACT, TORT OR OTHERWISE, ARISING FROM, OUT OF OR IN CONNECTION
22  * WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE SOFTWARE.
23  */
24 #ifndef __MONO_SGENGC_H__
25 #define __MONO_SGENGC_H__
26
27 /* pthread impl */
28 #include "config.h"
29 #include <glib.h>
30 #include <pthread.h>
31 #include <signal.h>
32 #include <mono/utils/mono-compiler.h>
33 #include <mono/metadata/class-internals.h>
34 #include <mono/metadata/object-internals.h>
35
36 /*
37  * Turning on heavy statistics will turn off the managed allocator and
38  * the managed write barrier.
39  */
40 //#define HEAVY_STATISTICS
41
42 /*
43  * If this is set, the nursery is aligned to an address aligned to its size, ie.
44  * a 1MB nursery will be aligned to an address divisible by 1MB. This allows us to
45  * speed up ptr_in_nursery () checks which are very frequent. This requires the
46  * nursery size to be a compile time constant.
47  */
48 #define SGEN_ALIGN_NURSERY 1
49
50 //#define SGEN_BINARY_PROTOCOL
51
52 #define SGEN_MAX_DEBUG_LEVEL 2
53
54 #define THREAD_HASH_SIZE 11
55
56 #define GC_BITS_PER_WORD (sizeof (mword) * 8)
57
58 #define ARCH_THREAD_TYPE pthread_t
59 #define ARCH_GET_THREAD pthread_self
60 #define ARCH_THREAD_EQUALS(a,b) pthread_equal (a, b)
61
62 #if SIZEOF_VOID_P == 4
63 typedef guint32 mword;
64 #else
65 typedef guint64 mword;
66 #endif
67
68 #define SGEN_TV_DECLARE(name) gint64 name
69 #define SGEN_TV_GETTIME(tv) tv = mono_100ns_ticks ()
70 #define SGEN_TV_ELAPSED(start,end) (int)((end-start) / 10)
71 #define SGEN_TV_ELAPSED_MS(start,end) ((SGEN_TV_ELAPSED((start),(end)) + 500) / 1000)
72
73 /* for use with write barriers */
74 typedef struct _RememberedSet RememberedSet;
75 struct _RememberedSet {
76         mword *store_next;
77         mword *end_set;
78         RememberedSet *next;
79         mword data [MONO_ZERO_LEN_ARRAY];
80 };
81
82 /* eventually share with MonoThread? */
83 typedef struct _SgenThreadInfo SgenThreadInfo;
84
85 struct _SgenThreadInfo {
86         SgenThreadInfo *next;
87         ARCH_THREAD_TYPE id;
88         unsigned int stop_count; /* to catch duplicate signals */
89         int signal;
90         int skip;
91         volatile int in_critical_region;
92         void *stack_end;
93         void *stack_start;
94         void *stack_start_limit;
95         char **tlab_next_addr;
96         char **tlab_start_addr;
97         char **tlab_temp_end_addr;
98         char **tlab_real_end_addr;
99         gpointer **store_remset_buffer_addr;
100         long *store_remset_buffer_index_addr;
101         RememberedSet *remset;
102         gpointer runtime_data;
103         gpointer stopped_ip;    /* only valid if the thread is stopped */
104         MonoDomain *stopped_domain; /* ditto */
105         gpointer *stopped_regs;     /* ditto */
106 #ifndef HAVE_KW_THREAD
107         char *tlab_start;
108         char *tlab_next;
109         char *tlab_temp_end;
110         char *tlab_real_end;
111         gpointer *store_remset_buffer;
112         long store_remset_buffer_index;
113 #endif
114 };
115
116 enum {
117         MEMORY_ROLE_GEN0,
118         MEMORY_ROLE_GEN1,
119         MEMORY_ROLE_PINNED,
120         MEMORY_ROLE_INTERNAL
121 };
122
123 typedef struct _SgenBlock SgenBlock;
124 struct _SgenBlock {
125         void *next;
126         unsigned char role;
127 };
128
129 /*
130  * The nursery section and the major copying collector's sections use
131  * this struct.
132  */
133 typedef struct _GCMemSection GCMemSection;
134 struct _GCMemSection {
135         SgenBlock block;
136         char *data;
137         mword size;
138         /* pointer where more data could be allocated if it fits */
139         char *next_data;
140         char *end_data;
141         /*
142          * scan starts is an array of pointers to objects equally spaced in the allocation area
143          * They let use quickly find pinned objects from pinning pointers.
144          */
145         char **scan_starts;
146         /* in major collections indexes in the pin_queue for objects that pin this section */
147         void **pin_queue_start;
148         int pin_queue_num_entries;
149         unsigned short num_scan_start;
150         gboolean is_to_space;
151 };
152
153 #define SGEN_SIZEOF_GC_MEM_SECTION      ((sizeof (GCMemSection) + 7) & ~7)
154
155 /*
156  * to quickly find the head of an object pinned by a conservative
157  * address we keep track of the objects allocated for each
158  * SGEN_SCAN_START_SIZE memory chunk in the nursery or other memory
159  * sections. Larger values have less memory overhead and bigger
160  * runtime cost. 4-8 KB are reasonable values.
161  */
162 #define SGEN_SCAN_START_SIZE (4096*2)
163
164 /*
165  * Objects bigger then this go into the large object space.  This size
166  * has a few constraints.  It must fit into the major heap, which in
167  * the case of the copying collector means that it must fit into a
168  * pinned chunk.  It must also play well with the GC descriptors, some
169  * of which (DESC_TYPE_RUN_LENGTH, DESC_TYPE_SMALL_BITMAP) encode the
170  * object size.
171  */
172 #define SGEN_MAX_SMALL_OBJ_SIZE 8000
173
174 /* This is also the MAJOR_SECTION_SIZE for the copying major
175    collector */
176 #define SGEN_PINNED_CHUNK_SIZE  (128 * 1024)
177
178 #define SGEN_PINNED_CHUNK_FOR_PTR(o)    ((SgenBlock*)(((mword)(o)) & ~(SGEN_PINNED_CHUNK_SIZE - 1)))
179
180 typedef struct _SgenPinnedChunk SgenPinnedChunk;
181
182 #if defined(__APPLE__) || defined(__OpenBSD__) || defined(__FreeBSD__)
183 const static int suspend_signal_num = SIGXFSZ;
184 #else
185 const static int suspend_signal_num = SIGPWR;
186 #endif
187 const static int restart_signal_num = SIGXCPU;
188
189 /*
190  * Recursion is not allowed for the thread lock.
191  */
192 #define LOCK_DECLARE(name) pthread_mutex_t name = PTHREAD_MUTEX_INITIALIZER
193 /* if changing LOCK_INIT to something that isn't idempotent, look at
194    its use in mono_gc_base_init in sgen-gc.c */
195 #define LOCK_INIT(name)
196 #define LOCK_GC pthread_mutex_lock (&gc_mutex)
197 #define UNLOCK_GC pthread_mutex_unlock (&gc_mutex)
198 #define LOCK_INTERRUPTION pthread_mutex_lock (&interruption_mutex)
199 #define UNLOCK_INTERRUPTION pthread_mutex_unlock (&interruption_mutex)
200
201 #define SGEN_CAS_PTR    InterlockedCompareExchangePointer
202 #define SGEN_ATOMIC_ADD(x,i)    do {                                    \
203                 int __old_x;                                            \
204                 do {                                                    \
205                         __old_x = (x);                                  \
206                 } while (InterlockedCompareExchange (&(x), __old_x + (i), __old_x) != __old_x); \
207         } while (0)
208
209 /* non-pthread will need to provide their own version of start/stop */
210 #define USE_SIGNAL_BASED_START_STOP_WORLD 1
211 /* we intercept pthread_create calls to know which threads exist */
212 #define USE_PTHREAD_INTERCEPT 1
213
214 #ifdef HEAVY_STATISTICS
215 #define HEAVY_STAT(x)   x
216
217 extern long long stat_objects_alloced_degraded;
218 extern long long stat_bytes_alloced_degraded;
219 extern long long stat_copy_object_called_major;
220 extern long long stat_objects_copied_major;
221 #else
222 #define HEAVY_STAT(x)
223 #endif
224
225 #define DEBUG(level,a) do {if (G_UNLIKELY ((level) <= SGEN_MAX_DEBUG_LEVEL && (level) <= gc_debug_level)) a;} while (0)
226
227 extern int gc_debug_level;
228 extern FILE* gc_debug_file;
229
230 extern int current_collection_generation;
231
232 extern gboolean conservative_stack_mark;
233
234 #define SGEN_ALLOC_ALIGN                8
235 #define SGEN_ALLOC_ALIGN_BITS   3
236
237 #define SGEN_ALIGN_UP(s)                (((s)+(SGEN_ALLOC_ALIGN-1)) & ~(SGEN_ALLOC_ALIGN-1))
238
239 #ifdef SGEN_ALIGN_NURSERY
240 #define SGEN_PTR_IN_NURSERY(p,bits,start,end)   (((mword)(p) & ~((1 << (bits)) - 1)) == (mword)(start))
241 #else
242 #define SGEN_PTR_IN_NURSERY(p,bits,start,end)   ((char*)(p) >= (start) && (char*)(p) < (end))
243 #endif
244
245 /* Structure that corresponds to a MonoVTable: desc is a mword so requires
246  * no cast from a pointer to an integer
247  */
248 typedef struct {
249         MonoClass *klass;
250         mword desc;
251 } GCVTable;
252
253 /* these bits are set in the object vtable: we could merge them since an object can be
254  * either pinned or forwarded but not both.
255  * We store them in the vtable slot because the bits are used in the sync block for
256  * other purposes: if we merge them and alloc the sync blocks aligned to 8 bytes, we can change
257  * this and use bit 3 in the syncblock (with the lower two bits both set for forwarded, that
258  * would be an invalid combination for the monitor and hash code).
259  * The values are already shifted.
260  * The forwarding address is stored in the sync block.
261  */
262 #define SGEN_FORWARDED_BIT 1
263 #define SGEN_PINNED_BIT 2
264 #define SGEN_VTABLE_BITS_MASK 0x3
265
266 /* returns NULL if not forwarded, or the forwarded address */
267 #define SGEN_OBJECT_IS_FORWARDED(obj) (((mword*)(obj))[0] & SGEN_FORWARDED_BIT ? (void*)(((mword*)(obj))[0] & ~SGEN_VTABLE_BITS_MASK) : NULL)
268 #define SGEN_OBJECT_IS_PINNED(obj) (((mword*)(obj))[0] & SGEN_PINNED_BIT)
269
270 /* set the forwarded address fw_addr for object obj */
271 #define SGEN_FORWARD_OBJECT(obj,fw_addr) do {                           \
272                 ((mword*)(obj))[0] = (mword)(fw_addr) | SGEN_FORWARDED_BIT; \
273         } while (0)
274 #define SGEN_PIN_OBJECT(obj) do {       \
275                 ((mword*)(obj))[0] |= SGEN_PINNED_BIT;  \
276         } while (0)
277 #define SGEN_UNPIN_OBJECT(obj) do {     \
278                 ((mword*)(obj))[0] &= ~SGEN_PINNED_BIT; \
279         } while (0)
280
281 /*
282  * Since we set bits in the vtable, use the macro to load it from the pointer to
283  * an object that is potentially pinned.
284  */
285 #define SGEN_LOAD_VTABLE(addr) ((*(mword*)(addr)) & ~SGEN_VTABLE_BITS_MASK)
286
287 /*
288  * ######################################################################
289  * ########  GC descriptors
290  * ######################################################################
291  * Used to quickly get the info the GC needs about an object: size and
292  * where the references are held.
293  */
294 #define OBJECT_HEADER_WORDS (sizeof(MonoObject)/sizeof(gpointer))
295 #define LOW_TYPE_BITS 3
296 #define SMALL_BITMAP_SHIFT 16
297 #define SMALL_BITMAP_SIZE (GC_BITS_PER_WORD - SMALL_BITMAP_SHIFT)
298 #define VECTOR_INFO_SHIFT 14
299 #define VECTOR_ELSIZE_SHIFT 3
300 #define LARGE_BITMAP_SIZE (GC_BITS_PER_WORD - LOW_TYPE_BITS)
301 #define MAX_ELEMENT_SIZE 0x3ff
302 #define VECTOR_SUBTYPE_PTRFREE (DESC_TYPE_V_PTRFREE << VECTOR_INFO_SHIFT)
303 #define VECTOR_SUBTYPE_REFS    (DESC_TYPE_V_REFS << VECTOR_INFO_SHIFT)
304 #define VECTOR_SUBTYPE_RUN_LEN (DESC_TYPE_V_RUN_LEN << VECTOR_INFO_SHIFT)
305 #define VECTOR_SUBTYPE_BITMAP  (DESC_TYPE_V_BITMAP << VECTOR_INFO_SHIFT)
306
307 /* objects are aligned to 8 bytes boundaries
308  * A descriptor is a pointer in MonoVTable, so 32 or 64 bits of size.
309  * The low 3 bits define the type of the descriptor. The other bits
310  * depend on the type.
311  * As a general rule the 13 remaining low bits define the size, either
312  * of the whole object or of the elements in the arrays. While for objects
313  * the size is already in bytes, for arrays we need to shift, because
314  * array elements might be smaller than 8 bytes. In case of arrays, we
315  * use two bits to describe what the additional high bits represents,
316  * so the default behaviour can handle element sizes less than 2048 bytes.
317  * The high 16 bits, if 0 it means the object is pointer-free.
318  * This design should make it easy and fast to skip over ptr-free data.
319  * The first 4 types should cover >95% of the objects.
320  * Note that since the size of objects is limited to 64K, larger objects
321  * will be allocated in the large object heap.
322  * If we want 4-bytes alignment, we need to put vector and small bitmap
323  * inside complex.
324  */
325 enum {
326         /*
327          * We don't use 0 so that 0 isn't a valid GC descriptor.  No
328          * deep reason for this other than to be able to identify a
329          * non-inited descriptor for debugging.
330          *
331          * If an object contains no references, its GC descriptor is
332          * always DESC_TYPE_RUN_LENGTH, without a size, no exceptions.
333          * This is so that we can quickly check for that in
334          * copy_object_no_checks(), without having to fetch the
335          * object's class.
336          */
337         DESC_TYPE_RUN_LENGTH = 1, /* 15 bits aligned byte size | 1-3 (offset, numptr) bytes tuples */
338         DESC_TYPE_SMALL_BITMAP, /* 15 bits aligned byte size | 16-48 bit bitmap */
339         DESC_TYPE_COMPLEX,      /* index for bitmap into complex_descriptors */
340         DESC_TYPE_VECTOR,       /* 10 bits element size | 1 bit array | 2 bits desc | element desc */
341         DESC_TYPE_ARRAY,        /* 10 bits element size | 1 bit array | 2 bits desc | element desc */
342         DESC_TYPE_LARGE_BITMAP, /* | 29-61 bitmap bits */
343         DESC_TYPE_COMPLEX_ARR,  /* index for bitmap into complex_descriptors */
344         /* subtypes for arrays and vectors */
345         DESC_TYPE_V_PTRFREE = 0,/* there are no refs: keep first so it has a zero value  */
346         DESC_TYPE_V_REFS,       /* all the array elements are refs */
347         DESC_TYPE_V_RUN_LEN,    /* elements are run-length encoded as DESC_TYPE_RUN_LENGTH */
348         DESC_TYPE_V_BITMAP      /* elements are as the bitmap in DESC_TYPE_SMALL_BITMAP */
349 };
350
351 #define SGEN_VTABLE_HAS_REFERENCES(vt)  (((MonoVTable*)(vt))->gc_descr != (void*)DESC_TYPE_RUN_LENGTH)
352
353 /* helper macros to scan and traverse objects, macros because we resue them in many functions */
354 #define OBJ_RUN_LEN_SIZE(size,desc,obj) do { \
355                 (size) = ((desc) & 0xfff8) >> 1;        \
356     } while (0)
357
358 #define OBJ_BITMAP_SIZE(size,desc,obj) do { \
359                 (size) = ((desc) & 0xfff8) >> 1;        \
360     } while (0)
361
362 //#define PREFETCH(addr) __asm__ __volatile__ ("     prefetchnta     %0": : "m"(*(char *)(addr)))
363 #define PREFETCH(addr)
364
365 /* code using these macros must define a HANDLE_PTR(ptr) macro that does the work */
366 #define OBJ_RUN_LEN_FOREACH_PTR(desc,obj)       do {    \
367                 if ((desc) & 0xffff0000) {      \
368                         /* there are pointers */        \
369                         void **_objptr_end;     \
370                         void **_objptr = (void**)(obj); \
371                         _objptr += ((desc) >> 16) & 0xff;       \
372                         _objptr_end = _objptr + (((desc) >> 24) & 0xff);        \
373                         while (_objptr < _objptr_end) { \
374                                 HANDLE_PTR (_objptr, (obj));    \
375                                 _objptr++;      \
376                         }       \
377                 }       \
378         } while (0)
379
380 /* a bitmap desc means that there are pointer references or we'd have
381  * choosen run-length, instead: add an assert to check.
382  */
383 #define OBJ_BITMAP_FOREACH_PTR(desc,obj)        do {    \
384                 /* there are pointers */        \
385                 void **_objptr = (void**)(obj); \
386                 gsize _bmap = (desc) >> 16;     \
387                 _objptr += OBJECT_HEADER_WORDS; \
388                 while (_bmap) { \
389                         if ((_bmap & 1)) {      \
390                                 HANDLE_PTR (_objptr, (obj));    \
391                         }       \
392                         _bmap >>= 1;    \
393                         ++_objptr;      \
394                 }       \
395         } while (0)
396
397 #define OBJ_LARGE_BITMAP_FOREACH_PTR(vt,obj)    do {    \
398                 /* there are pointers */        \
399                 void **_objptr = (void**)(obj); \
400                 gsize _bmap = (vt)->desc >> LOW_TYPE_BITS;      \
401                 _objptr += OBJECT_HEADER_WORDS; \
402                 while (_bmap) { \
403                         if ((_bmap & 1)) {      \
404                                 HANDLE_PTR (_objptr, (obj));    \
405                         }       \
406                         _bmap >>= 1;    \
407                         ++_objptr;      \
408                 }       \
409         } while (0)
410
411 gsize* mono_sgen_get_complex_descriptor (GCVTable *vt) MONO_INTERNAL;
412
413 #define OBJ_COMPLEX_FOREACH_PTR(vt,obj) do {    \
414                 /* there are pointers */        \
415                 void **_objptr = (void**)(obj); \
416                 gsize *bitmap_data = mono_sgen_get_complex_descriptor ((vt)); \
417                 int bwords = (*bitmap_data) - 1;        \
418                 void **start_run = _objptr;     \
419                 bitmap_data++;  \
420                 if (0) {        \
421                         MonoObject *myobj = (MonoObject*)obj;   \
422                         g_print ("found %d at %p (0x%zx): %s.%s\n", bwords, (obj), (vt)->desc, myobj->vtable->klass->name_space, myobj->vtable->klass->name);   \
423                 }       \
424                 while (bwords-- > 0) {  \
425                         gsize _bmap = *bitmap_data++;   \
426                         _objptr = start_run;    \
427                         /*g_print ("bitmap: 0x%x/%d at %p\n", _bmap, bwords, _objptr);*/        \
428                         while (_bmap) { \
429                                 if ((_bmap & 1)) {      \
430                                         HANDLE_PTR (_objptr, (obj));    \
431                                 }       \
432                                 _bmap >>= 1;    \
433                                 ++_objptr;      \
434                         }       \
435                         start_run += GC_BITS_PER_WORD;  \
436                 }       \
437         } while (0)
438
439 /* this one is untested */
440 #define OBJ_COMPLEX_ARR_FOREACH_PTR(vt,obj)     do {    \
441                 /* there are pointers */        \
442                 gsize *mbitmap_data = mono_sgen_get_complex_descriptor ((vt)); \
443                 int mbwords = (*mbitmap_data++) - 1;    \
444                 int el_size = mono_array_element_size (vt->klass);      \
445                 char *e_start = (char*)(obj) +  G_STRUCT_OFFSET (MonoArray, vector);    \
446                 char *e_end = e_start + el_size * mono_array_length_fast ((MonoArray*)(obj));   \
447                 if (0)                                                  \
448                         g_print ("found %d at %p (0x%zx): %s.%s\n", mbwords, (obj), (vt)->desc, vt->klass->name_space, vt->klass->name); \
449                 while (e_start < e_end) {       \
450                         void **_objptr = (void**)e_start;       \
451                         gsize *bitmap_data = mbitmap_data;      \
452                         unsigned int bwords = mbwords;  \
453                         while (bwords-- > 0) {  \
454                                 gsize _bmap = *bitmap_data++;   \
455                                 void **start_run = _objptr;     \
456                                 /*g_print ("bitmap: 0x%x\n", _bmap);*/  \
457                                 while (_bmap) { \
458                                         if ((_bmap & 1)) {      \
459                                                 HANDLE_PTR (_objptr, (obj));    \
460                                         }       \
461                                         _bmap >>= 1;    \
462                                         ++_objptr;      \
463                                 }       \
464                                 _objptr = start_run + GC_BITS_PER_WORD; \
465                         }       \
466                         e_start += el_size;     \
467                 }       \
468         } while (0)
469
470 #define OBJ_VECTOR_FOREACH_PTR(vt,obj)  do {    \
471                 /* note: 0xffffc000 excludes DESC_TYPE_V_PTRFREE */     \
472                 if ((vt)->desc & 0xffffc000) {  \
473                         int el_size = ((vt)->desc >> 3) & MAX_ELEMENT_SIZE;     \
474                         /* there are pointers */        \
475                         int etype = (vt)->desc & 0xc000;        \
476                         if (etype == (DESC_TYPE_V_REFS << 14)) {        \
477                                 void **p = (void**)((char*)(obj) + G_STRUCT_OFFSET (MonoArray, vector));        \
478                                 void **end_refs = (void**)((char*)p + el_size * mono_array_length_fast ((MonoArray*)(obj)));    \
479                                 /* Note: this code can handle also arrays of struct with only references in them */     \
480                                 while (p < end_refs) {  \
481                                         HANDLE_PTR (p, (obj));  \
482                                         ++p;    \
483                                 }       \
484                         } else if (etype == DESC_TYPE_V_RUN_LEN << 14) {        \
485                                 int offset = ((vt)->desc >> 16) & 0xff; \
486                                 int num_refs = ((vt)->desc >> 24) & 0xff;       \
487                                 char *e_start = (char*)(obj) + G_STRUCT_OFFSET (MonoArray, vector);     \
488                                 char *e_end = e_start + el_size * mono_array_length_fast ((MonoArray*)(obj));   \
489                                 while (e_start < e_end) {       \
490                                         void **p = (void**)e_start;     \
491                                         int i;  \
492                                         p += offset;    \
493                                         for (i = 0; i < num_refs; ++i) {        \
494                                                 HANDLE_PTR (p + i, (obj));      \
495                                         }       \
496                                         e_start += el_size;     \
497                                 }       \
498                         } else if (etype == DESC_TYPE_V_BITMAP << 14) { \
499                                 char *e_start = (char*)(obj) +  G_STRUCT_OFFSET (MonoArray, vector);    \
500                                 char *e_end = e_start + el_size * mono_array_length_fast ((MonoArray*)(obj));   \
501                                 while (e_start < e_end) {       \
502                                         void **p = (void**)e_start;     \
503                                         gsize _bmap = (vt)->desc >> 16; \
504                                         /* Note: there is no object header here to skip */      \
505                                         while (_bmap) { \
506                                                 if ((_bmap & 1)) {      \
507                                                         HANDLE_PTR (p, (obj));  \
508                                                 }       \
509                                                 _bmap >>= 1;    \
510                                                 ++p;    \
511                                         }       \
512                                         e_start += el_size;     \
513                                 }       \
514                         }       \
515                 }       \
516         } while (0)
517
518 typedef struct _SgenInternalAllocator SgenInternalAllocator;
519
520 #define SGEN_GRAY_QUEUE_SECTION_SIZE    (128 - 3)
521
522 /*
523  * This is a stack now instead of a queue, so the most recently added items are removed
524  * first, improving cache locality, and keeping the stack size manageable.
525  */
526 typedef struct _GrayQueueSection GrayQueueSection;
527 struct _GrayQueueSection {
528         int end;
529         GrayQueueSection *next;
530         char *objects [SGEN_GRAY_QUEUE_SECTION_SIZE];
531 };
532
533 typedef struct _SgenGrayQueue SgenGrayQueue;
534
535 typedef void (*GrayQueueAllocPrepareFunc) (SgenGrayQueue*);
536
537 struct _SgenGrayQueue {
538         SgenInternalAllocator *allocator;
539         GrayQueueSection *first;
540         GrayQueueSection *free_list;
541         int balance;
542         GrayQueueAllocPrepareFunc alloc_prepare_func;
543         void *alloc_prepare_data;
544 };
545
546 #if SGEN_MAX_DEBUG_LEVEL >= 9
547 #define GRAY_OBJECT_ENQUEUE gray_object_enqueue
548 #define GRAY_OBJECT_DEQUEUE(queue,o) ((o) = gray_object_dequeue ((queue)))
549 #else
550 #define GRAY_OBJECT_ENQUEUE(queue,o) do {                               \
551                 if (G_UNLIKELY (!(queue)->first || (queue)->first->end == SGEN_GRAY_QUEUE_SECTION_SIZE)) \
552                         mono_sgen_gray_object_enqueue ((queue), (o));   \
553                 else                                                    \
554                         (queue)->first->objects [(queue)->first->end++] = (o); \
555         } while (0)
556 #define GRAY_OBJECT_DEQUEUE(queue,o) do {                               \
557                 if (!(queue)->first)                                    \
558                         (o) = NULL;                                     \
559                 else if (G_UNLIKELY ((queue)->first->end == 1))         \
560                         (o) = mono_sgen_gray_object_dequeue ((queue));          \
561                 else                                                    \
562                         (o) = (queue)->first->objects [--(queue)->first->end]; \
563         } while (0)
564 #endif
565
566 void mono_sgen_gray_object_enqueue (SgenGrayQueue *queue, char *obj) MONO_INTERNAL;
567 char* mono_sgen_gray_object_dequeue (SgenGrayQueue *queue) MONO_INTERNAL;
568
569 typedef void (*IterateObjectCallbackFunc) (char*, size_t, void*);
570
571 void* mono_sgen_alloc_os_memory (size_t size, int activate) MONO_INTERNAL;
572 void* mono_sgen_alloc_os_memory_aligned (mword size, mword alignment, gboolean activate) MONO_INTERNAL;
573 void mono_sgen_free_os_memory (void *addr, size_t size) MONO_INTERNAL;
574
575 int mono_sgen_thread_handshake (int signum) MONO_INTERNAL;
576 SgenThreadInfo* mono_sgen_thread_info_lookup (ARCH_THREAD_TYPE id) MONO_INTERNAL;
577 SgenThreadInfo** mono_sgen_get_thread_table (void) MONO_INTERNAL;
578 void mono_sgen_wait_for_suspend_ack (int count) MONO_INTERNAL;
579
580 gboolean mono_sgen_is_worker_thread (pthread_t thread) MONO_INTERNAL;
581
582 void mono_sgen_update_heap_boundaries (mword low, mword high) MONO_INTERNAL;
583
584 void mono_sgen_register_major_sections_alloced (int num_sections) MONO_INTERNAL;
585 mword mono_sgen_get_minor_collection_allowance (void) MONO_INTERNAL;
586
587 void mono_sgen_scan_area_with_callback (char *start, char *end, IterateObjectCallbackFunc callback, void *data, gboolean allow_flags) MONO_INTERNAL;
588 void mono_sgen_check_section_scan_starts (GCMemSection *section) MONO_INTERNAL;
589
590 /* Keep in sync with mono_sgen_dump_internal_mem_usage() in dump_heap()! */
591 enum {
592         INTERNAL_MEM_MANAGED,
593         INTERNAL_MEM_PIN_QUEUE,
594         INTERNAL_MEM_FRAGMENT,
595         INTERNAL_MEM_SECTION,
596         INTERNAL_MEM_SCAN_STARTS,
597         INTERNAL_MEM_FIN_TABLE,
598         INTERNAL_MEM_FINALIZE_ENTRY,
599         INTERNAL_MEM_DISLINK_TABLE,
600         INTERNAL_MEM_DISLINK,
601         INTERNAL_MEM_ROOTS_TABLE,
602         INTERNAL_MEM_ROOT_RECORD,
603         INTERNAL_MEM_STATISTICS,
604         INTERNAL_MEM_REMSET,
605         INTERNAL_MEM_GRAY_QUEUE,
606         INTERNAL_MEM_STORE_REMSET,
607         INTERNAL_MEM_MS_TABLES,
608         INTERNAL_MEM_MS_BLOCK_INFO,
609         INTERNAL_MEM_EPHEMERON_LINK,
610         INTERNAL_MEM_WORKER_DATA,
611         INTERNAL_MEM_MAX
612 };
613
614 #define SGEN_INTERNAL_FREELIST_NUM_SLOTS        30
615
616 struct _SgenInternalAllocator {
617         SgenPinnedChunk *chunk_list;
618         SgenPinnedChunk *free_lists [SGEN_INTERNAL_FREELIST_NUM_SLOTS];
619         void *delayed_free_lists [SGEN_INTERNAL_FREELIST_NUM_SLOTS];
620         long small_internal_mem_bytes [INTERNAL_MEM_MAX];
621 };
622
623 enum {
624         GENERATION_NURSERY,
625         GENERATION_OLD,
626         GENERATION_MAX
627 };
628
629 void mono_sgen_init_internal_allocator (void) MONO_INTERNAL;
630
631 SgenInternalAllocator* mono_sgen_get_unmanaged_allocator (void) MONO_INTERNAL;
632
633 const char* mono_sgen_internal_mem_type_name (int type) MONO_INTERNAL;
634 void mono_sgen_report_internal_mem_usage (void) MONO_INTERNAL;
635 void mono_sgen_report_internal_mem_usage_full (SgenInternalAllocator *alc) MONO_INTERNAL;
636 void mono_sgen_dump_internal_mem_usage (FILE *heap_dump_file) MONO_INTERNAL;
637 void mono_sgen_dump_section (GCMemSection *section, const char *type) MONO_INTERNAL;
638 void mono_sgen_dump_occupied (char *start, char *end, char *section_start) MONO_INTERNAL;
639
640 void mono_sgen_register_moved_object (void *obj, void *destination) MONO_INTERNAL;
641
642 void mono_sgen_register_fixed_internal_mem_type (int type, size_t size) MONO_INTERNAL;
643
644 void* mono_sgen_alloc_internal (int type) MONO_INTERNAL;
645 void mono_sgen_free_internal (void *addr, int type) MONO_INTERNAL;
646
647 void* mono_sgen_alloc_internal_dynamic (size_t size, int type) MONO_INTERNAL;
648 void mono_sgen_free_internal_dynamic (void *addr, size_t size, int type) MONO_INTERNAL;
649
650 void* mono_sgen_alloc_internal_fixed (SgenInternalAllocator *allocator, int type) MONO_INTERNAL;
651 void mono_sgen_free_internal_fixed (SgenInternalAllocator *allocator, void *addr, int type) MONO_INTERNAL;
652
653 void* mono_sgen_alloc_internal_full (SgenInternalAllocator *allocator, size_t size, int type) MONO_INTERNAL;
654 void mono_sgen_free_internal_full (SgenInternalAllocator *allocator, void *addr, size_t size, int type) MONO_INTERNAL;
655
656 void mono_sgen_free_internal_delayed (void *addr, int type, SgenInternalAllocator *thread_allocator) MONO_INTERNAL;
657
658 void mono_sgen_debug_printf (int level, const char *format, ...) MONO_INTERNAL;
659
660 gboolean mono_sgen_parse_environment_string_extract_number (const char *str, glong *out) MONO_INTERNAL;
661
662 void mono_sgen_internal_scan_objects (SgenInternalAllocator *alc, IterateObjectCallbackFunc callback, void *callback_data) MONO_INTERNAL;
663 void mono_sgen_internal_scan_pinned_objects (SgenInternalAllocator *alc, IterateObjectCallbackFunc callback, void *callback_data) MONO_INTERNAL;
664
665 void mono_sgen_internal_update_heap_boundaries (SgenInternalAllocator *alc) MONO_INTERNAL;
666
667 void** mono_sgen_find_optimized_pin_queue_area (void *start, void *end, int *num) MONO_INTERNAL;
668 void mono_sgen_find_section_pin_queue_start_end (GCMemSection *section) MONO_INTERNAL;
669 void mono_sgen_pin_objects_in_section (GCMemSection *section, SgenGrayQueue *queue) MONO_INTERNAL;
670
671 void mono_sgen_pin_stats_register_object (char *obj, size_t size);
672
673 void mono_sgen_add_to_global_remset (gpointer ptr) MONO_INTERNAL;
674
675 int mono_sgen_get_current_collection_generation (void) MONO_INTERNAL;
676
677 typedef void (*sgen_cardtable_block_callback) (mword start, mword size);
678
679 typedef struct _SgenMajorCollector SgenMajorCollector;
680 struct _SgenMajorCollector {
681         size_t section_size;
682         gboolean is_parallel;
683         gboolean supports_cardtable;
684
685         /*
686          * This is set to TRUE if the sweep for the last major
687          * collection has been completed.
688          */
689         gboolean *have_swept;
690
691         void* (*alloc_heap) (mword nursery_size, mword nursery_align, int nursery_bits);
692         gboolean (*is_object_live) (char *obj);
693         void* (*alloc_small_pinned_obj) (size_t size, gboolean has_references);
694         void* (*alloc_degraded) (MonoVTable *vtable, size_t size);
695         void (*copy_or_mark_object) (void **obj_slot, SgenGrayQueue *queue);
696         void (*minor_scan_object) (char *start, SgenGrayQueue *queue);
697         char* (*minor_scan_vtype) (char *start, mword desc, char* from_start, char* from_end, SgenGrayQueue *queue);
698         void (*major_scan_object) (char *start, SgenGrayQueue *queue);
699         void (*copy_object) (void **obj_slot, SgenGrayQueue *queue);
700         void* (*alloc_object) (int size, gboolean has_references);
701         void (*free_pinned_object) (char *obj, size_t size);
702         void (*iterate_objects) (gboolean non_pinned, gboolean pinned, IterateObjectCallbackFunc callback, void *data);
703         void (*free_non_pinned_object) (char *obj, size_t size);
704         void (*find_pin_queue_start_ends) (SgenGrayQueue *queue);
705         void (*pin_objects) (SgenGrayQueue *queue);
706         void (*scan_card_table) (SgenGrayQueue *queue);
707         void (*iterate_live_block_ranges) (sgen_cardtable_block_callback callback);
708         void (*init_to_space) (void);
709         void (*sweep) (void);
710         void (*check_scan_starts) (void);
711         void (*dump_heap) (FILE *heap_dump_file);
712         gint64 (*get_used_size) (void);
713         void (*start_nursery_collection) (void);
714         void (*finish_nursery_collection) (void);
715         void (*start_major_collection) (void);
716         void (*finish_major_collection) (void);
717         void (*have_computed_minor_collection_allowance) (void);
718         gboolean (*ptr_is_in_non_pinned_space) (char *ptr);
719         gboolean (*obj_is_from_pinned_alloc) (char *obj);
720         void (*report_pinned_memory_usage) (void);
721         int (*get_num_major_sections) (void);
722         gboolean (*handle_gc_param) (const char *opt);
723         void (*print_gc_param_usage) (void);
724         gboolean (*is_worker_thread) (pthread_t thread);
725 };
726
727 void mono_sgen_marksweep_init (SgenMajorCollector *collector) MONO_INTERNAL;
728 void mono_sgen_marksweep_fixed_init (SgenMajorCollector *collector) MONO_INTERNAL;
729 void mono_sgen_marksweep_par_init (SgenMajorCollector *collector) MONO_INTERNAL;
730 void mono_sgen_marksweep_fixed_par_init (SgenMajorCollector *collector) MONO_INTERNAL;
731 void mono_sgen_copying_init (SgenMajorCollector *collector) MONO_INTERNAL;
732
733 /*
734  * This function can be called on an object whose first word, the
735  * vtable field, is not intact.  This is necessary for the parallel
736  * collector.
737  */
738 static inline guint
739 mono_sgen_par_object_get_size (MonoVTable *vtable, MonoObject* o)
740 {
741         MonoClass *klass = vtable->klass;
742         /*
743          * We depend on mono_string_length_fast and
744          * mono_array_length_fast not using the object's vtable.
745          */
746         if (klass == mono_defaults.string_class) {
747                 return sizeof (MonoString) + 2 * mono_string_length_fast ((MonoString*) o) + 2;
748         } else if (klass->rank) {
749                 MonoArray *array = (MonoArray*)o;
750                 size_t size = sizeof (MonoArray) + klass->sizes.element_size * mono_array_length_fast (array);
751                 if (G_UNLIKELY (array->bounds)) {
752                         size += sizeof (mono_array_size_t) - 1;
753                         size &= ~(sizeof (mono_array_size_t) - 1);
754                         size += sizeof (MonoArrayBounds) * klass->rank;
755                 }
756                 return size;
757         } else {
758                 /* from a created object: the class must be inited already */
759                 return klass->instance_size;
760         }
761 }
762
763 #define mono_sgen_safe_object_get_size(o)               mono_sgen_par_object_get_size ((MonoVTable*)SGEN_LOAD_VTABLE ((o)), (o))
764
765 const char* mono_sgen_safe_name (void* obj) MONO_INTERNAL;
766
767 enum {
768         SPACE_MAJOR,
769         SPACE_LOS
770 };
771
772 gboolean mono_sgen_try_alloc_space (mword size, int space) MONO_INTERNAL;
773 void mono_sgen_release_space (mword size, int space) MONO_INTERNAL;
774 void mono_sgen_pin_object (void *object, SgenGrayQueue *queue) MONO_INTERNAL;
775 void sgen_collect_major_no_lock (const char *reason) MONO_INTERNAL;
776 gboolean mono_sgen_need_major_collection (mword space_needed) MONO_INTERNAL;
777
778 /* LOS */
779
780 typedef struct _LOSObject LOSObject;
781 struct _LOSObject {
782         LOSObject *next;
783         mword size; /* this is the object size */
784         guint16 huge_object;
785         int dummy; /* to have a sizeof (LOSObject) a multiple of ALLOC_ALIGN  and data starting at same alignment */
786         char data [MONO_ZERO_LEN_ARRAY];
787 };
788
789 #define ARRAY_OBJ_INDEX(ptr,array,elem_size) (((char*)(ptr) - ((char*)(array) + G_STRUCT_OFFSET (MonoArray, vector))) / (elem_size))
790
791 extern LOSObject *los_object_list;
792 extern mword los_memory_usage;
793 extern mword last_los_memory_usage;
794
795 void mono_sgen_los_free_object (LOSObject *obj) MONO_INTERNAL;
796 void* mono_sgen_los_alloc_large_inner (MonoVTable *vtable, size_t size) MONO_INTERNAL;
797 void mono_sgen_los_sweep (void) MONO_INTERNAL;
798 gboolean mono_sgen_ptr_is_in_los (char *ptr, char **start) MONO_INTERNAL;
799 void mono_sgen_los_iterate_objects (IterateObjectCallbackFunc cb, void *user_data) MONO_INTERNAL;
800 void mono_sgen_los_iterate_live_block_ranges (sgen_cardtable_block_callback callback) MONO_INTERNAL;
801 void mono_sgen_los_scan_card_table (SgenGrayQueue *queue) MONO_INTERNAL;
802 FILE *mono_sgen_get_logfile (void) MONO_INTERNAL;
803
804 #endif /* __MONO_SGENGC_H__ */