#ifdef GC_darwin_register_mach_handler_thread in GC_DARWIN_THREADS.
[cacao.git] / src / boehm-gc / mark_rts.c
1 /* 
2  * Copyright 1988, 1989 Hans-J. Boehm, Alan J. Demers
3  * Copyright (c) 1991-1994 by Xerox Corporation.  All rights reserved.
4  *
5  * THIS MATERIAL IS PROVIDED AS IS, WITH ABSOLUTELY NO WARRANTY EXPRESSED
6  * OR IMPLIED.  ANY USE IS AT YOUR OWN RISK.
7  *
8  * Permission is hereby granted to use or copy this program
9  * for any purpose,  provided the above notices are retained on all copies.
10  * Permission to modify the code and to distribute modified code is granted,
11  * provided the above notices are retained, and a notice that the code was
12  * modified is included with the above copyright notice.
13  */
14
15 #include "config.h"
16
17 # include <stdio.h>
18 # include "private/gc_priv.h"
19
20 /* Data structure for list of root sets.                                */
21 /* We keep a hash table, so that we can filter out duplicate additions. */
22 /* Under Win32, we need to do a better job of filtering overlaps, so    */
23 /* we resort to sequential search, and pay the price.                   */
24 /* This is really declared in gc_priv.h:
25 struct roots {
26         ptr_t r_start;
27         ptr_t r_end;
28  #      if !defined(MSWIN32) && !defined(MSWINCE)
29           struct roots * r_next;
30  #      endif
31         GC_bool r_tmp;
32                 -- Delete before registering new dynamic libraries
33 };
34
35 struct roots GC_static_roots[MAX_ROOT_SETS];
36 */
37
38 int GC_no_dls = 0;      /* Register dynamic library data segments.      */
39
40 static int n_root_sets = 0;
41
42         /* GC_static_roots[0..n_root_sets) contains the valid root sets. */
43
44 # if !defined(NO_DEBUGGING)
45 /* For debugging:       */
46 void GC_print_static_roots()
47 {
48     register int i;
49     size_t total = 0;
50     
51     for (i = 0; i < n_root_sets; i++) {
52         GC_printf2("From 0x%lx to 0x%lx ",
53                    (unsigned long) GC_static_roots[i].r_start,
54                    (unsigned long) GC_static_roots[i].r_end);
55         if (GC_static_roots[i].r_tmp) {
56             GC_printf0(" (temporary)\n");
57         } else {
58             GC_printf0("\n");
59         }
60         total += GC_static_roots[i].r_end - GC_static_roots[i].r_start;
61     }
62     GC_printf1("Total size: %ld\n", (unsigned long) total);
63     if (GC_root_size != total) {
64         GC_printf1("GC_root_size incorrect: %ld!!\n",
65                    (unsigned long) GC_root_size);
66     }
67 }
68 # endif /* NO_DEBUGGING */
69
70 /* Primarily for debugging support:     */
71 /* Is the address p in one of the registered static                     */
72 /* root sections?                                                       */
73 GC_bool GC_is_static_root(p)
74 ptr_t p;
75 {
76     static int last_root_set = MAX_ROOT_SETS;
77     register int i;
78     
79     
80     if (last_root_set < n_root_sets
81         && p >= GC_static_roots[last_root_set].r_start
82         && p < GC_static_roots[last_root_set].r_end) return(TRUE);
83     for (i = 0; i < n_root_sets; i++) {
84         if (p >= GC_static_roots[i].r_start
85             && p < GC_static_roots[i].r_end) {
86             last_root_set = i;
87             return(TRUE);
88         }
89     }
90     return(FALSE);
91 }
92
93 #if !defined(MSWIN32) && !defined(MSWINCE)
94 /* 
95 #   define LOG_RT_SIZE 6
96 #   define RT_SIZE (1 << LOG_RT_SIZE)  -- Power of 2, may be != MAX_ROOT_SETS
97
98     struct roots * GC_root_index[RT_SIZE];
99         -- Hash table header.  Used only to check whether a range is
100         -- already present.
101         -- really defined in gc_priv.h
102 */
103
104 static int rt_hash(addr)
105 char * addr;
106 {
107     word result = (word) addr;
108 #   if CPP_WORDSZ > 8*LOG_RT_SIZE
109         result ^= result >> 8*LOG_RT_SIZE;
110 #   endif
111 #   if CPP_WORDSZ > 4*LOG_RT_SIZE
112         result ^= result >> 4*LOG_RT_SIZE;
113 #   endif
114     result ^= result >> 2*LOG_RT_SIZE;
115     result ^= result >> LOG_RT_SIZE;
116     result &= (RT_SIZE-1);
117     return(result);
118 }
119
120 /* Is a range starting at b already in the table? If so return a        */
121 /* pointer to it, else NIL.                                             */
122 struct roots * GC_roots_present(b)
123 char *b;
124 {
125     register int h = rt_hash(b);
126     register struct roots *p = GC_root_index[h];
127     
128     while (p != 0) {
129         if (p -> r_start == (ptr_t)b) return(p);
130         p = p -> r_next;
131     }
132     return(FALSE);
133 }
134
135 /* Add the given root structure to the index. */
136 static void add_roots_to_index(p)
137 struct roots *p;
138 {
139     register int h = rt_hash(p -> r_start);
140     
141     p -> r_next = GC_root_index[h];
142     GC_root_index[h] = p;
143 }
144
145 # else /* MSWIN32 || MSWINCE */
146
147 #   define add_roots_to_index(p)
148
149 # endif
150
151
152
153
154 word GC_root_size = 0;
155
156 void GC_add_roots(b, e)
157 char * b; char * e;
158 {
159     DCL_LOCK_STATE;
160     
161     DISABLE_SIGNALS();
162     LOCK();
163     GC_add_roots_inner(b, e, FALSE);
164     UNLOCK();
165     ENABLE_SIGNALS();
166 }
167
168
169 /* Add [b,e) to the root set.  Adding the same interval a second time   */
170 /* is a moderately fast noop, and hence benign.  We do not handle       */
171 /* different but overlapping intervals efficiently.  (We do handle      */
172 /* them correctly.)                                                     */
173 /* Tmp specifies that the interval may be deleted before                */
174 /* reregistering dynamic libraries.                                     */ 
175 void GC_add_roots_inner(b, e, tmp)
176 char * b; char * e;
177 GC_bool tmp;
178 {
179     struct roots * old;
180     
181 #   if defined(MSWIN32) || defined(MSWINCE)
182       /* Spend the time to ensure that there are no overlapping */
183       /* or adjacent intervals.                                 */
184       /* This could be done faster with e.g. a                  */
185       /* balanced tree.  But the execution time here is         */
186       /* virtually guaranteed to be dominated by the time it    */
187       /* takes to scan the roots.                               */
188       {
189         register int i;
190         
191         for (i = 0; i < n_root_sets; i++) {
192             old = GC_static_roots + i;
193             if ((ptr_t)b <= old -> r_end && (ptr_t)e >= old -> r_start) {
194                 if ((ptr_t)b < old -> r_start) {
195                     old -> r_start = (ptr_t)b;
196                     GC_root_size += (old -> r_start - (ptr_t)b);
197                 }
198                 if ((ptr_t)e > old -> r_end) {
199                     old -> r_end = (ptr_t)e;
200                     GC_root_size += ((ptr_t)e - old -> r_end);
201                 }
202                 old -> r_tmp &= tmp;
203                 break;
204             }
205         }
206         if (i < n_root_sets) {
207           /* merge other overlapping intervals */
208             struct roots *other;
209             
210             for (i++; i < n_root_sets; i++) {
211               other = GC_static_roots + i;
212               b = (char *)(other -> r_start);
213               e = (char *)(other -> r_end);
214               if ((ptr_t)b <= old -> r_end && (ptr_t)e >= old -> r_start) {
215                 if ((ptr_t)b < old -> r_start) {
216                     old -> r_start = (ptr_t)b;
217                     GC_root_size += (old -> r_start - (ptr_t)b);
218                 }
219                 if ((ptr_t)e > old -> r_end) {
220                     old -> r_end = (ptr_t)e;
221                     GC_root_size += ((ptr_t)e - old -> r_end);
222                 }
223                 old -> r_tmp &= other -> r_tmp;
224                 /* Delete this entry. */
225                   GC_root_size -= (other -> r_end - other -> r_start);
226                   other -> r_start = GC_static_roots[n_root_sets-1].r_start;
227                   other -> r_end = GC_static_roots[n_root_sets-1].r_end;
228                                   n_root_sets--;
229               }
230             }
231           return;
232         }
233       }
234 #   else
235       old = GC_roots_present(b);
236       if (old != 0) {
237         if ((ptr_t)e <= old -> r_end) /* already there */ return;
238         /* else extend */
239         GC_root_size += (ptr_t)e - old -> r_end;
240         old -> r_end = (ptr_t)e;
241         return;
242       }
243 #   endif
244     if (n_root_sets == MAX_ROOT_SETS) {
245         ABORT("Too many root sets\n");
246     }
247     GC_static_roots[n_root_sets].r_start = (ptr_t)b;
248     GC_static_roots[n_root_sets].r_end = (ptr_t)e;
249     GC_static_roots[n_root_sets].r_tmp = tmp;
250 #   if !defined(MSWIN32) && !defined(MSWINCE)
251       GC_static_roots[n_root_sets].r_next = 0;
252 #   endif
253     add_roots_to_index(GC_static_roots + n_root_sets);
254     GC_root_size += (ptr_t)e - (ptr_t)b;
255     n_root_sets++;
256 }
257
258 static GC_bool roots_were_cleared = FALSE;
259
260 void GC_clear_roots GC_PROTO((void))
261 {
262     DCL_LOCK_STATE;
263     
264     DISABLE_SIGNALS();
265     LOCK();
266     roots_were_cleared = TRUE;
267     n_root_sets = 0;
268     GC_root_size = 0;
269 #   if !defined(MSWIN32) && !defined(MSWINCE)
270     {
271         register int i;
272         
273         for (i = 0; i < RT_SIZE; i++) GC_root_index[i] = 0;
274     }
275 #   endif
276     UNLOCK();
277     ENABLE_SIGNALS();
278 }
279
280 /* Internal use only; lock held.        */
281 static void GC_remove_root_at_pos(i) 
282 int i;
283 {
284     GC_root_size -= (GC_static_roots[i].r_end - GC_static_roots[i].r_start);
285     GC_static_roots[i].r_start = GC_static_roots[n_root_sets-1].r_start;
286     GC_static_roots[i].r_end = GC_static_roots[n_root_sets-1].r_end;
287     GC_static_roots[i].r_tmp = GC_static_roots[n_root_sets-1].r_tmp;
288     n_root_sets--;
289 }
290
291 #if !defined(MSWIN32) && !defined(MSWINCE)
292 static void GC_rebuild_root_index()
293 {
294     register int i;
295         
296     for (i = 0; i < RT_SIZE; i++) GC_root_index[i] = 0;
297     for (i = 0; i < n_root_sets; i++)
298         add_roots_to_index(GC_static_roots + i);
299 }
300 #endif
301
302 /* Internal use only; lock held.        */
303 void GC_remove_tmp_roots()
304 {
305     register int i;
306     
307     for (i = 0; i < n_root_sets; ) {
308         if (GC_static_roots[i].r_tmp) {
309             GC_remove_root_at_pos(i);
310         } else {
311             i++;
312     }
313     }
314     #if !defined(MSWIN32) && !defined(MSWINCE)
315     GC_rebuild_root_index();
316     #endif
317 }
318
319 #if !defined(MSWIN32) && !defined(MSWINCE)
320 void GC_remove_roots(b, e)
321 char * b; char * e;
322 {
323     DCL_LOCK_STATE;
324     
325     DISABLE_SIGNALS();
326     LOCK();
327     GC_remove_roots_inner(b, e);
328     UNLOCK();
329     ENABLE_SIGNALS();
330 }
331
332 /* Should only be called when the lock is held */
333 void GC_remove_roots_inner(b,e)
334 char * b; char * e;
335 {
336     int i;
337     for (i = 0; i < n_root_sets; ) {
338         if (GC_static_roots[i].r_start >= (ptr_t)b && GC_static_roots[i].r_end <= (ptr_t)e) {
339             GC_remove_root_at_pos(i);
340         } else {
341             i++;
342         }
343     }
344     GC_rebuild_root_index();
345 }
346 #endif /* !defined(MSWIN32) && !defined(MSWINCE) */
347
348 #if defined(MSWIN32) || defined(_WIN32_WCE_EMULATION)
349 /* Workaround for the OS mapping and unmapping behind our back:         */
350 /* Is the address p in one of the temporary static root sections?       */
351 GC_bool GC_is_tmp_root(p)
352 ptr_t p;
353 {
354     static int last_root_set = MAX_ROOT_SETS;
355     register int i;
356     
357     if (last_root_set < n_root_sets
358         && p >= GC_static_roots[last_root_set].r_start
359         && p < GC_static_roots[last_root_set].r_end)
360         return GC_static_roots[last_root_set].r_tmp;
361     for (i = 0; i < n_root_sets; i++) {
362         if (p >= GC_static_roots[i].r_start
363             && p < GC_static_roots[i].r_end) {
364             last_root_set = i;
365             return GC_static_roots[i].r_tmp;
366         }
367     }
368     return(FALSE);
369 }
370 #endif /* MSWIN32 || _WIN32_WCE_EMULATION */
371
372 ptr_t GC_approx_sp()
373 {
374     word dummy;
375
376 #   ifdef _MSC_VER
377 #     pragma warning(disable:4172)
378 #   endif
379     return((ptr_t)(&dummy));
380 #   ifdef _MSC_VER
381 #     pragma warning(default:4172)
382 #   endif
383 }
384
385 /*
386  * Data structure for excluded static roots.
387  * Real declaration is in gc_priv.h.
388
389 struct exclusion {
390     ptr_t e_start;
391     ptr_t e_end;
392 };
393
394 struct exclusion GC_excl_table[MAX_EXCLUSIONS];
395                                         -- Array of exclusions, ascending
396                                         -- address order.
397 */
398
399 size_t GC_excl_table_entries = 0;       /* Number of entries in use.      */
400
401 /* Return the first exclusion range that includes an address >= start_addr */
402 /* Assumes the exclusion table contains at least one entry (namely the     */
403 /* GC data structures).                                                    */
404 struct exclusion * GC_next_exclusion(start_addr)
405 ptr_t start_addr;
406 {
407     size_t low = 0;
408     size_t high = GC_excl_table_entries - 1;
409     size_t mid;
410
411     while (high > low) {
412         mid = (low + high) >> 1;
413         /* low <= mid < high    */
414         if ((word) GC_excl_table[mid].e_end <= (word) start_addr) {
415             low = mid + 1;
416         } else {
417             high = mid;
418         }
419     }
420     if ((word) GC_excl_table[low].e_end <= (word) start_addr) return 0;
421     return GC_excl_table + low;
422 }
423
424 void GC_exclude_static_roots(start, finish)
425 GC_PTR start;
426 GC_PTR finish;
427 {
428     struct exclusion * next;
429     size_t next_index, i;
430
431     if (0 == GC_excl_table_entries) {
432         next = 0;
433     } else {
434         next = GC_next_exclusion(start);
435     }
436     if (0 != next) {
437       if ((word)(next -> e_start) < (word) finish) {
438         /* incomplete error check. */
439         ABORT("exclusion ranges overlap");
440       }  
441       if ((word)(next -> e_start) == (word) finish) {
442         /* extend old range backwards   */
443           next -> e_start = (ptr_t)start;
444           return;
445       }
446       next_index = next - GC_excl_table;
447       for (i = GC_excl_table_entries; i > next_index; --i) {
448         GC_excl_table[i] = GC_excl_table[i-1];
449       }
450     } else {
451       next_index = GC_excl_table_entries;
452     }
453     if (GC_excl_table_entries == MAX_EXCLUSIONS) ABORT("Too many exclusions");
454     GC_excl_table[next_index].e_start = (ptr_t)start;
455     GC_excl_table[next_index].e_end = (ptr_t)finish;
456     ++GC_excl_table_entries;
457 }
458
459 /* Invoke push_conditional on ranges that are not excluded. */
460 void GC_push_conditional_with_exclusions(bottom, top, all)
461 ptr_t bottom;
462 ptr_t top;
463 int all;
464 {
465     struct exclusion * next;
466     ptr_t excl_start;
467
468     while (bottom < top) {
469         next = GC_next_exclusion(bottom);
470         if (0 == next || (excl_start = next -> e_start) >= top) {
471             GC_push_conditional(bottom, top, all);
472             return;
473         }
474         if (excl_start > bottom) GC_push_conditional(bottom, excl_start, all);
475         bottom = next -> e_end;
476     }
477 }
478
479 /*
480  * In the absence of threads, push the stack contents.
481  * In the presence of threads, push enough of the current stack
482  * to ensure that callee-save registers saved in collector frames have been
483  * seen.
484  */
485 void GC_push_current_stack(cold_gc_frame)
486 ptr_t cold_gc_frame;
487 {
488 #   if defined(THREADS)
489         if (0 == cold_gc_frame) return;
490 #       ifdef STACK_GROWS_DOWN
491           GC_push_all_eager(GC_approx_sp(), cold_gc_frame);
492           /* For IA64, the register stack backing store is handled      */
493           /* in the thread-specific code.                               */
494 #       else
495           GC_push_all_eager( cold_gc_frame, GC_approx_sp() );
496 #       endif
497 #   else
498 #       ifdef STACK_GROWS_DOWN
499             GC_push_all_stack_partially_eager( GC_approx_sp(), GC_stackbottom,
500                                                cold_gc_frame );
501 #           ifdef IA64
502               /* We also need to push the register stack backing store. */
503               /* This should really be done in the same way as the      */
504               /* regular stack.  For now we fudge it a bit.             */
505               /* Note that the backing store grows up, so we can't use  */
506               /* GC_push_all_stack_partially_eager.                     */
507               {
508                 extern word GC_save_regs_ret_val;
509                         /* Previously set to backing store pointer.     */
510                 ptr_t bsp = (ptr_t) GC_save_regs_ret_val;
511                 ptr_t cold_gc_bs_pointer;
512                 if (GC_all_interior_pointers) {
513                   cold_gc_bs_pointer = bsp - 2048;
514                   if (cold_gc_bs_pointer < BACKING_STORE_BASE) {
515                     cold_gc_bs_pointer = BACKING_STORE_BASE;
516                   } else {
517                     GC_push_all_stack(BACKING_STORE_BASE, cold_gc_bs_pointer);
518                   }
519                 } else {
520                   cold_gc_bs_pointer = BACKING_STORE_BASE;
521                 }
522                 GC_push_all_eager(cold_gc_bs_pointer, bsp);
523                 /* All values should be sufficiently aligned that we    */
524                 /* dont have to worry about the boundary.               */
525               }
526 #           endif
527 #       else
528             GC_push_all_stack_partially_eager( GC_stackbottom, GC_approx_sp(),
529                                                cold_gc_frame );
530 #       endif
531 #   endif /* !THREADS */
532 }
533
534 /*
535  * Push GC internal roots.  Only called if there is some reason to believe
536  * these would not otherwise get registered.
537  */
538 void GC_push_gc_structures GC_PROTO((void))
539 {
540     GC_push_finalizer_structures();
541     GC_push_stubborn_structures();
542 #   if defined(THREADS)
543       GC_push_thread_structures();
544 #   endif
545 }
546
547 #ifdef THREAD_LOCAL_ALLOC
548   void GC_mark_thread_local_free_lists();
549 #endif
550
551 void GC_cond_register_dynamic_libraries()
552 {
553 # if (defined(DYNAMIC_LOADING) || defined(MSWIN32) || defined(MSWINCE) \
554      || defined(PCR)) && !defined(SRC_M3)
555     GC_remove_tmp_roots();
556     if (!GC_no_dls) GC_register_dynamic_libraries();
557 # else
558     GC_no_dls = TRUE;
559 # endif
560 }
561
562 /*
563  * Call the mark routines (GC_tl_push for a single pointer, GC_push_conditional
564  * on groups of pointers) on every top level accessible pointer.
565  * If all is FALSE, arrange to push only possibly altered values.
566  * Cold_gc_frame is an address inside a GC frame that
567  * remains valid until all marking is complete.
568  * A zero value indicates that it's OK to miss some
569  * register values.
570  */
571 void GC_push_roots(all, cold_gc_frame)
572 GC_bool all;
573 ptr_t cold_gc_frame;
574 {
575     int i;
576     int kind;
577
578     /*
579      * Next push static data.  This must happen early on, since it's
580      * not robust against mark stack overflow.
581      */
582      /* Reregister dynamic libraries, in case one got added.            */
583      /* There is some argument for doing this as late as possible,      */
584      /* especially on win32, where it can change asynchronously.        */
585      /* In those cases, we do it here.  But on other platforms, it's    */
586      /* not safe with the world stopped, so we do it earlier.           */
587 #      if !defined(REGISTER_LIBRARIES_EARLY)
588          GC_cond_register_dynamic_libraries();
589 #      endif
590
591      /* Mark everything in static data areas                             */
592        for (i = 0; i < n_root_sets; i++) {
593          GC_push_conditional_with_exclusions(
594                              GC_static_roots[i].r_start,
595                              GC_static_roots[i].r_end, all);
596        }
597
598      /* Mark all free list header blocks, if those were allocated from  */
599      /* the garbage collected heap.  This makes sure they don't         */
600      /* disappear if we are not marking from static data.  It also      */
601      /* saves us the trouble of scanning them, and possibly that of     */
602      /* marking the freelists.                                          */
603        for (kind = 0; kind < GC_n_kinds; kind++) {
604          GC_PTR base = GC_base(GC_obj_kinds[kind].ok_freelist);
605          if (0 != base) {
606            GC_set_mark_bit(base);
607          }
608        }
609        
610      /* Mark from GC internal roots if those might otherwise have       */
611      /* been excluded.                                                  */
612        if (GC_no_dls || roots_were_cleared) {
613            GC_push_gc_structures();
614        }
615
616      /* Mark thread local free lists, even if their mark        */
617      /* descriptor excludes the link field.                     */
618      /* If the world is not stopped, this is unsafe.  It is     */
619      /* also unnecessary, since we will do this again with the  */
620      /* world stopped.                                          */
621 #      ifdef THREAD_LOCAL_ALLOC
622          if (GC_world_stopped) GC_mark_thread_local_free_lists();
623 #      endif
624
625     /*
626      * Now traverse stacks, and mark from register contents.
627      * These must be done last, since they can legitimately overflow
628      * the mark stack.
629      */
630 #   ifdef USE_GENERIC_PUSH_REGS
631         GC_generic_push_regs(cold_gc_frame);
632         /* Also pushes stack, so that we catch callee-save registers    */
633         /* saved inside the GC_push_regs frame.                         */
634 #   else
635        /*
636         * push registers - i.e., call GC_push_one(r) for each
637         * register contents r.
638         */
639         GC_push_regs(); /* usually defined in machine_dep.c */
640         GC_push_current_stack(cold_gc_frame);
641         /* In the threads case, this only pushes collector frames.      */
642         /* In the case of linux threads on IA64, the hot section of     */
643         /* the main stack is marked here, but the register stack        */
644         /* backing store is handled in the threads-specific code.       */
645 #   endif
646     if (GC_push_other_roots != 0) (*GC_push_other_roots)();
647         /* In the threads case, this also pushes thread stacks. */
648         /* Note that without interior pointer recognition lots  */
649         /* of stuff may have been pushed already, and this      */
650         /* should be careful about mark stack overflows.        */
651 }
652