[sgen] Binary protocol for every write barrier, not just the generic store one.
[mono.git] / mono / metadata / sgen-gc.c
index 3a8cf5b6f35c05c24ec682548cff625bd09ccfd5..8c2cfe6250fbeef494653cacb4ebb032e9ebf706 100644 (file)
@@ -337,6 +337,7 @@ static long long time_major_fragment_creation = 0;
 
 int gc_debug_level = 0;
 FILE* gc_debug_file;
+static gboolean debug_print_allowance = FALSE;
 
 /*
 void
@@ -718,6 +719,7 @@ pthread_t main_gc_thread = NULL;
  */
 /*heap limits*/
 static mword max_heap_size = ((mword)0)- ((mword)1);
+static mword soft_heap_limit = ((mword)0) - ((mword)1);
 static mword allocated_heap;
 
 /*Object was pinned during the current collection*/
@@ -746,11 +748,19 @@ mono_sgen_try_alloc_space (mword size, int space)
 }
 
 static void
-init_heap_size_limits (glong max_heap)
+init_heap_size_limits (glong max_heap, glong soft_limit)
 {
+       if (soft_limit)
+               soft_heap_limit = soft_limit;
+
        if (max_heap == 0)
                return;
 
+       if (max_heap < soft_limit) {
+               fprintf (stderr, "max-heap-size must be at least as large as soft-heap-limit.\n");
+               exit (1);
+       }
+
        if (max_heap < nursery_size * 4) {
                fprintf (stderr, "max-heap-size must be at least 4 times larger than nursery size.\n");
                exit (1);
@@ -2129,25 +2139,49 @@ mono_sgen_update_heap_boundaries (mword low, mword high)
        } while (SGEN_CAS_PTR ((gpointer*)&highest_heap_address, (gpointer)high, (gpointer)old) != (gpointer)old);
 }
 
+static unsigned long
+prot_flags_for_activate (int activate)
+{
+       unsigned long prot_flags = activate? MONO_MMAP_READ|MONO_MMAP_WRITE: MONO_MMAP_NONE;
+       return prot_flags | MONO_MMAP_PRIVATE | MONO_MMAP_ANON;
+}
+
+/*
+ * Allocate a big chunk of memory from the OS (usually 64KB to several megabytes).
+ * This must not require any lock.
+ */
+void*
+mono_sgen_alloc_os_memory (size_t size, int activate)
+{
+       void *ptr = mono_valloc (0, size, prot_flags_for_activate (activate));
+       if (ptr) {
+               /* FIXME: CAS */
+               total_alloc += size;
+       }
+       return ptr;
+}
+
 /* size must be a power of 2 */
 void*
 mono_sgen_alloc_os_memory_aligned (mword size, mword alignment, gboolean activate)
 {
-       /* Allocate twice the memory to be able to put the block on an aligned address */
-       char *mem = mono_sgen_alloc_os_memory (size + alignment, activate);
-       char *aligned;
-
-       g_assert (mem);
-
-       aligned = (char*)((mword)(mem + (alignment - 1)) & ~(alignment - 1));
-       g_assert (aligned >= mem && aligned + size <= mem + size + alignment && !((mword)aligned & (alignment - 1)));
-
-       if (aligned > mem)
-               mono_sgen_free_os_memory (mem, aligned - mem);
-       if (aligned + size < mem + size + alignment)
-               mono_sgen_free_os_memory (aligned + size, (mem + size + alignment) - (aligned + size));
+       void *ptr = mono_valloc_aligned (size, alignment, prot_flags_for_activate (activate));
+       if (ptr) {
+               /* FIXME: CAS */
+               total_alloc += size;
+       }
+       return ptr;
+}
 
-       return aligned;
+/*
+ * Free the memory returned by mono_sgen_alloc_os_memory (), returning it to the OS.
+ */
+void
+mono_sgen_free_os_memory (void *addr, size_t size)
+{
+       mono_vfree (addr, size);
+       /* FIXME: CAS */
+       total_alloc -= size;
 }
 
 /*
@@ -2366,6 +2400,18 @@ bridge_register_finalized_object (MonoObject *object)
        finalized_array [finalized_array_entries++] = object;
 }
 
+static void
+bridge_process (void)
+{
+       if (finalized_array_entries <= 0)
+               return;
+
+       g_assert (mono_sgen_need_bridge_processing ());
+       mono_sgen_bridge_processing (finalized_array_entries, finalized_array);
+
+       finalized_array_entries = 0;
+}
+
 CopyOrMarkObjectFunc
 mono_sgen_get_copy_object (void)
 {
@@ -2470,11 +2516,8 @@ finish_gray_stack (char *start_addr, char *end_addr, int generation, GrayQueue *
                if (generation == GENERATION_OLD)
                        finalize_in_range (copy_func, nursery_start, nursery_end, GENERATION_NURSERY, queue);
 
-               if (fin_ready != num_ready_finalizers) {
+               if (fin_ready != num_ready_finalizers)
                        ++num_loops;
-                       if (finalized_array != NULL)
-                               mono_sgen_bridge_processing (finalized_array_entries, finalized_array);
-               }
 
                /* drain the new stack that might have been created */
                DEBUG (6, fprintf (gc_debug_file, "Precise scan of gray area post fin\n"));
@@ -2786,7 +2829,7 @@ static void
 try_calculate_minor_collection_allowance (gboolean overwrite)
 {
        int num_major_sections, num_major_sections_saved, save_target, allowance_target;
-       mword los_memory_saved;
+       mword los_memory_saved, new_major, new_heap_size;
 
        if (overwrite)
                g_assert (need_calculate_minor_collection_allowance);
@@ -2805,7 +2848,16 @@ try_calculate_minor_collection_allowance (gboolean overwrite)
        num_major_sections_saved = MAX (last_collection_old_num_major_sections - num_major_sections, 0);
        los_memory_saved = MAX (last_collection_old_los_memory_usage - last_collection_los_memory_usage, 1);
 
-       save_target = ((num_major_sections * major_collector.section_size) + los_memory_saved) / 2;
+       new_major = num_major_sections * major_collector.section_size;
+       new_heap_size = new_major + last_collection_los_memory_usage;
+
+       /*
+        * FIXME: Why is save_target half the major memory plus half the
+        * LOS memory saved?  Shouldn't it be half the major memory
+        * saved plus half the LOS memory saved?  Or half the whole heap
+        * size?
+        */
+       save_target = (new_major + los_memory_saved) / 2;
 
        /*
         * We aim to allow the allocation of as many sections as is
@@ -2826,6 +2878,23 @@ try_calculate_minor_collection_allowance (gboolean overwrite)
 
        minor_collection_allowance = MAX (MIN (allowance_target, num_major_sections * major_collector.section_size + los_memory_usage), MIN_MINOR_COLLECTION_ALLOWANCE);
 
+       if (new_heap_size + minor_collection_allowance > soft_heap_limit) {
+               if (new_heap_size > soft_heap_limit)
+                       minor_collection_allowance = MIN_MINOR_COLLECTION_ALLOWANCE;
+               else
+                       minor_collection_allowance = MAX (soft_heap_limit - new_heap_size, MIN_MINOR_COLLECTION_ALLOWANCE);
+       }
+
+       if (debug_print_allowance) {
+               mword old_major = last_collection_old_num_major_sections * major_collector.section_size;
+
+               fprintf (gc_debug_file, "Before collection: %ld bytes (%ld major, %ld LOS)\n",
+                               old_major + last_collection_old_los_memory_usage, old_major, last_collection_old_los_memory_usage);
+               fprintf (gc_debug_file, "After collection: %ld bytes (%ld major, %ld LOS)\n",
+                               new_heap_size, new_major, last_collection_los_memory_usage);
+               fprintf (gc_debug_file, "Allowance: %ld bytes\n", minor_collection_allowance);
+       }
+
        if (major_collector.have_computed_minor_collection_allowance)
                major_collector.have_computed_minor_collection_allowance ();
 
@@ -3075,7 +3144,7 @@ collect_nursery (size_t requested_size)
        if (collection_is_parallel ()) {
                while (!gray_object_queue_is_empty (WORKERS_DISTRIBUTE_GRAY_QUEUE)) {
                        workers_distribute_gray_queue_sections ();
-                       usleep (1000);
+                       g_usleep (1000);
                }
        }
        workers_join ();
@@ -3355,7 +3424,7 @@ major_do_collection (const char *reason)
        if (major_collector.is_parallel) {
                while (!gray_object_queue_is_empty (WORKERS_DISTRIBUTE_GRAY_QUEUE)) {
                        workers_distribute_gray_queue_sections ();
-                       usleep (1000);
+                       g_usleep (1000);
                }
        }
        workers_join ();
@@ -3553,39 +3622,6 @@ report_internal_mem_usage (void)
        major_collector.report_pinned_memory_usage ();
 }
 
-/*
- * Allocate a big chunk of memory from the OS (usually 64KB to several megabytes).
- * This must not require any lock.
- */
-void*
-mono_sgen_alloc_os_memory (size_t size, int activate)
-{
-       void *ptr;
-       unsigned long prot_flags = activate? MONO_MMAP_READ|MONO_MMAP_WRITE: MONO_MMAP_NONE;
-
-       prot_flags |= MONO_MMAP_PRIVATE | MONO_MMAP_ANON;
-       size += pagesize - 1;
-       size &= ~(pagesize - 1);
-       ptr = mono_valloc (0, size, prot_flags);
-       /* FIXME: CAS */
-       total_alloc += size;
-       return ptr;
-}
-
-/*
- * Free the memory returned by mono_sgen_alloc_os_memory (), returning it to the OS.
- */
-void
-mono_sgen_free_os_memory (void *addr, size_t size)
-{
-       mono_vfree (addr, size);
-
-       size += pagesize - 1;
-       size &= ~(pagesize - 1);
-       /* FIXME: CAS */
-       total_alloc -= size;
-}
-
 /*
  * ######################################################################
  * ########  Object allocation
@@ -3599,8 +3635,22 @@ mono_sgen_free_os_memory (void *addr, size_t size)
  */
 
 static void*
-alloc_degraded (MonoVTable *vtable, size_t size)
-{
+alloc_degraded (MonoVTable *vtable, size_t size, gboolean for_mature)
+{
+       static int last_major_gc_warned = -1;
+       static int num_degraded = 0;
+
+       if (!for_mature) {
+               if (last_major_gc_warned < num_major_gcs) {
+                       ++num_degraded;
+                       if (num_degraded == 1 || num_degraded == 3)
+                               fprintf (stderr, "Warning: Degraded allocation.  Consider increasing nursery-size if the warning persists.\n");
+                       else if (num_degraded == 10)
+                               fprintf (stderr, "Warning: Repeated degraded allocation.  Consider increasing nursery-size.\n");
+                       last_major_gc_warned = num_major_gcs;
+               }
+       }
+
        if (need_major_collection (0)) {
                mono_profiler_gc_event (MONO_GC_EVENT_START, 1);
                stop_world (1);
@@ -3717,7 +3767,7 @@ mono_gc_alloc_obj_nolock (MonoVTable *vtable, size_t size)
                         * for a while, to decrease the number of useless nursery collections.
                         */
                        if (degraded_mode && degraded_mode < DEFAULT_NURSERY_SIZE) {
-                               p = alloc_degraded (vtable, size);
+                               p = alloc_degraded (vtable, size, FALSE);
                                binary_protocol_alloc_degraded (p, vtable, size);
                                return p;
                        }
@@ -3730,7 +3780,7 @@ mono_gc_alloc_obj_nolock (MonoVTable *vtable, size_t size)
                                        if (!p) {
                                                minor_collect_or_expand_inner (size);
                                                if (degraded_mode) {
-                                                       p = alloc_degraded (vtable, size);
+                                                       p = alloc_degraded (vtable, size, FALSE);
                                                        binary_protocol_alloc_degraded (p, vtable, size);
                                                        return p;
                                                } else {
@@ -3757,7 +3807,7 @@ mono_gc_alloc_obj_nolock (MonoVTable *vtable, size_t size)
                                        if (!p) {
                                                minor_collect_or_expand_inner (tlab_size);
                                                if (degraded_mode) {
-                                                       p = alloc_degraded (vtable, size);
+                                                       p = alloc_degraded (vtable, size, FALSE);
                                                        binary_protocol_alloc_degraded (p, vtable, size);
                                                        return p;
                                                } else {
@@ -4034,7 +4084,7 @@ mono_gc_alloc_mature (MonoVTable *vtable)
        void **res;
        size_t size = ALIGN_UP (vtable->klass->instance_size);
        LOCK_GC;
-       res = alloc_degraded (vtable, size);
+       res = alloc_degraded (vtable, size, TRUE);
        mono_atomic_store_seq (res, vtable);
        UNLOCK_GC;
        if (G_UNLIKELY (vtable->klass->has_finalize))
@@ -4360,7 +4410,7 @@ mono_sgen_get_minor_collection_allowance (void)
  */
 
 static void
-rehash_roots (gboolean pinned)
+rehash_roots (int root_type)
 {
        int i;
        unsigned int hash;
@@ -4368,19 +4418,19 @@ rehash_roots (gboolean pinned)
        RootRecord *entry, *next;
        int new_size;
 
-       new_size = g_spaced_primes_closest (num_roots_entries [pinned]);
+       new_size = g_spaced_primes_closest (num_roots_entries [root_type]);
        new_hash = mono_sgen_alloc_internal_dynamic (new_size * sizeof (RootRecord*), INTERNAL_MEM_ROOTS_TABLE);
-       for (i = 0; i < roots_hash_size [pinned]; ++i) {
-               for (entry = roots_hash [pinned][i]; entry; entry = next) {
+       for (i = 0; i < roots_hash_size [root_type]; ++i) {
+               for (entry = roots_hash [root_type][i]; entry; entry = next) {
                        hash = mono_aligned_addr_hash (entry->start_root) % new_size;
                        next = entry->next;
                        entry->next = new_hash [hash];
                        new_hash [hash] = entry;
                }
        }
-       mono_sgen_free_internal_dynamic (roots_hash [pinned], roots_hash_size [pinned] * sizeof (RootRecord*), INTERNAL_MEM_ROOTS_TABLE);
-       roots_hash [pinned] = new_hash;
-       roots_hash_size [pinned] = new_size;
+       mono_sgen_free_internal_dynamic (roots_hash [root_type], roots_hash_size [root_type] * sizeof (RootRecord*), INTERNAL_MEM_ROOTS_TABLE);
+       roots_hash [root_type] = new_hash;
+       roots_hash_size [root_type] = new_size;
 }
 
 static RootRecord*
@@ -4496,13 +4546,7 @@ mono_gc_deregister_root (char* addr)
  * ######################################################################
  */
 
-#if USE_SIGNAL_BASED_START_STOP_WORLD
-
-static MonoSemType suspend_ack_semaphore;
-static MonoSemType *suspend_ack_semaphore_ptr;
-static unsigned int global_stop_count = 0;
-
-static sigset_t suspend_signal_mask;
+unsigned int mono_sgen_global_stop_count = 0;
 
 #ifdef USE_MONO_CTX
 static MonoContext cur_thread_ctx = {0};
@@ -4532,6 +4576,15 @@ update_current_thread_stack (void *start)
                gc_callbacks.thread_suspend_func (info->runtime_data, NULL);
 }
 
+void
+mono_sgen_fill_thread_info_for_suspend (SgenThreadInfo *info)
+{
+#ifdef HAVE_KW_THREAD
+       /* update the remset info in the thread data structure */
+       info->remset = remembered_set;
+#endif
+}
+
 /*
  * Define this and use the "xdomain-checks" MONO_GC_DEBUG option to
  * have cross-domain checks in the write barrier.
@@ -4550,24 +4603,6 @@ update_current_thread_stack (void *start)
 static gboolean
 is_ip_in_managed_allocator (MonoDomain *domain, gpointer ip);
 
-void
-mono_sgen_wait_for_suspend_ack (int count)
-{
-#if defined(__MACH__) && MONO_MACH_ARCH_SUPPORTED
-               /* mach thread_resume is synchronous so we dont need to wait for them */
-#else
-       int i, result;
-
-       for (i = 0; i < count; ++i) {
-               while ((result = MONO_SEM_WAIT (suspend_ack_semaphore_ptr)) != 0) {
-                       if (errno != EINTR) {
-                               g_error ("sem_wait ()");
-                       }
-               }
-       }
-#endif
-}
-
 static int
 restart_threads_until_none_in_managed_allocator (void)
 {
@@ -4640,113 +4675,6 @@ restart_threads_until_none_in_managed_allocator (void)
        return num_threads_died;
 }
 
-static void
-suspend_thread (SgenThreadInfo *info, void *context)
-{
-       int stop_count;
-#ifdef USE_MONO_CTX
-       MonoContext monoctx;
-#else
-       gpointer regs [ARCH_NUM_REGS];
-#endif
-       gpointer stack_start;
-
-       g_assert (info->doing_handshake);
-
-       info->stopped_domain = mono_domain_get ();
-       info->stopped_ip = context ? (gpointer) ARCH_SIGCTX_IP (context) : NULL;
-       stop_count = global_stop_count;
-       /* duplicate signal */
-       if (0 && info->stop_count == stop_count)
-               return;
-#ifdef HAVE_KW_THREAD
-       /* update the remset info in the thread data structure */
-       info->remset = remembered_set;
-#endif
-       stack_start = context ? (char*) ARCH_SIGCTX_SP (context) - REDZONE_SIZE : NULL;
-       /* If stack_start is not within the limits, then don't set it
-          in info and we will be restarted. */
-       if (stack_start >= info->stack_start_limit && info->stack_start <= info->stack_end) {
-               info->stack_start = stack_start;
-
-#ifdef USE_MONO_CTX
-               if (context) {
-                       mono_sigctx_to_monoctx (context, &monoctx);
-                       info->monoctx = &monoctx;
-               } else {
-                       info->monoctx = NULL;
-               }
-#else
-               if (context) {
-                       ARCH_COPY_SIGCTX_REGS (regs, context);
-                       info->stopped_regs = regs;
-               } else {
-                       info->stopped_regs = NULL;
-               }
-#endif
-       } else {
-               g_assert (!info->stack_start);
-       }
-
-       /* Notify the JIT */
-       if (gc_callbacks.thread_suspend_func)
-               gc_callbacks.thread_suspend_func (info->runtime_data, context);
-
-       DEBUG (4, fprintf (gc_debug_file, "Posting suspend_ack_semaphore for suspend from %p %p\n", info, (gpointer)mono_native_thread_id_get ()));
-       /* notify the waiting thread */
-       MONO_SEM_POST (suspend_ack_semaphore_ptr);
-       info->stop_count = stop_count;
-
-       /* wait until we receive the restart signal */
-       do {
-               info->signal = 0;
-               sigsuspend (&suspend_signal_mask);
-       } while (info->signal != restart_signal_num && info->doing_handshake);
-
-       DEBUG (4, fprintf (gc_debug_file, "Posting suspend_ack_semaphore for resume from %p %p\n", info, (gpointer)mono_native_thread_id_get ()));
-       /* notify the waiting thread */
-       MONO_SEM_POST (suspend_ack_semaphore_ptr);
-}
-
-/* LOCKING: assumes the GC lock is held (by the stopping thread) */
-static void
-suspend_handler (int sig, siginfo_t *siginfo, void *context)
-{
-       SgenThreadInfo *info;
-       int old_errno = errno;
-
-       info = mono_thread_info_current ();
-
-       if (info) {
-               suspend_thread (info, context);
-       } else {
-               /* This can happen while a thread is dying */
-               g_print ("no thread info in suspend\n");
-       }
-
-       errno = old_errno;
-}
-
-static void
-restart_handler (int sig)
-{
-       SgenThreadInfo *info;
-       int old_errno = errno;
-
-       info = mono_thread_info_current ();
-
-       /*
-        * If a thread is dying there might be no thread info.  In
-        * that case we rely on info->doing_handshake.
-        */
-       if (info) {
-               info->signal = restart_signal_num;
-               DEBUG (4, fprintf (gc_debug_file, "Restart handler in %p %p\n", info, (gpointer)mono_native_thread_id_get ()));
-       }
-
-       errno = old_errno;
-}
-
 static void
 acquire_gc_locks (void)
 {
@@ -4775,10 +4703,10 @@ stop_world (int generation)
 
        update_current_thread_stack (&count);
 
-       global_stop_count++;
-       DEBUG (3, fprintf (gc_debug_file, "stopping world n %d from %p %p\n", global_stop_count, mono_thread_info_current (), (gpointer)mono_native_thread_id_get ()));
+       mono_sgen_global_stop_count++;
+       DEBUG (3, fprintf (gc_debug_file, "stopping world n %d from %p %p\n", mono_sgen_global_stop_count, mono_thread_info_current (), (gpointer)mono_native_thread_id_get ()));
        TV_GETTIME (stop_world_time);
-       count = mono_sgen_thread_handshake (suspend_signal_num);
+       count = mono_sgen_thread_handshake (TRUE);
        count -= restart_threads_until_none_in_managed_allocator ();
        g_assert (count >= 0);
        DEBUG (3, fprintf (gc_debug_file, "world stopped %d thread(s)\n", count));
@@ -4814,17 +4742,18 @@ restart_world (int generation)
 
        release_gc_locks ();
 
-       count = mono_sgen_thread_handshake (restart_signal_num);
+       count = mono_sgen_thread_handshake (FALSE);
        TV_GETTIME (end_sw);
        usec = TV_ELAPSED (stop_world_time, end_sw);
        max_pause_usec = MAX (usec, max_pause_usec);
        DEBUG (2, fprintf (gc_debug_file, "restarted %d thread(s) (pause time: %d usec, max: %d)\n", count, (int)usec, (int)max_pause_usec));
        mono_profiler_gc_event (MONO_GC_EVENT_POST_START_WORLD, generation);
+
+       bridge_process ();
+
        return count;
 }
 
-#endif /* USE_SIGNAL_BASED_START_STOP_WORLD */
-
 int
 mono_sgen_get_current_collection_generation (void)
 {
@@ -5317,9 +5246,11 @@ sgen_thread_register (SgenThreadInfo* info, void *addr)
        thread_info = info;
 #endif
 
+#if !defined(__MACH__)
        info->stop_count = -1;
-       info->skip = 0;
        info->signal = 0;
+#endif
+       info->skip = 0;
        info->doing_handshake = FALSE;
        info->thread_is_dying = FALSE;
        info->stack_start = NULL;
@@ -5440,18 +5371,16 @@ sgen_thread_unregister (SgenThreadInfo *p)
        FIXME: I believe we could avoid this by using mono_thread_info_lookup when
        mono_thread_info_current returns NULL. Or fix mono_thread_info_lookup to do so.
        */
-#if defined(__MACH__) && MONO_MACH_ARCH_SUPPORTED
+#if (defined(__MACH__) && MONO_MACH_ARCH_SUPPORTED) || !defined(HAVE_PTHREAD_KILL)
        LOCK_GC;
 #else
        while (!TRYLOCK_GC) {
-               if (p->doing_handshake)
-                       suspend_thread (p, NULL);
-               else
-                       usleep (50);
+               if (!mono_sgen_park_current_thread_if_doing_handshake (p))
+                       g_usleep (50);
        }
 #endif
 
-       binary_protocol_thread_unregister ((gpointer)id);
+       binary_protocol_thread_unregister ((gpointer)mono_thread_info_get_tid (p));
        DEBUG (3, fprintf (gc_debug_file, "unregister thread %p (%p)\n", p, (gpointer)mono_thread_info_get_tid (p)));
 
 #if defined(__MACH__)
@@ -5599,6 +5528,8 @@ mono_gc_wbarrier_set_field (MonoObject *obj, gpointer field_ptr, MonoObject* val
                return;
        }
        DEBUG (8, fprintf (gc_debug_file, "Adding remset at %p\n", field_ptr));
+       if (value)
+               binary_protocol_wbarrier (field_ptr, value, value->vtable);
        if (use_cardtable) {
                *(void**)field_ptr = value;
                if (ptr_in_nursery (value))
@@ -5637,6 +5568,8 @@ mono_gc_wbarrier_set_arrayref (MonoArray *arr, gpointer slot_ptr, MonoObject* va
                return;
        }
        DEBUG (8, fprintf (gc_debug_file, "Adding remset at %p\n", slot_ptr));
+       if (value)
+               binary_protocol_wbarrier (slot_ptr, value, value->vtable);
        if (use_cardtable) {
                *(void**)slot_ptr = value;
                if (ptr_in_nursery (value))
@@ -5676,6 +5609,18 @@ mono_gc_wbarrier_arrayref_copy (gpointer dest_ptr, gpointer src_ptr, int count)
                return;
        }
 
+#ifdef SGEN_BINARY_PROTOCOL
+       {
+               int i;
+               for (i = 0; i < count; ++i) {
+                       gpointer dest = (gpointer*)dest_ptr + i;
+                       gpointer obj = *((gpointer*)src_ptr + i);
+                       if (obj)
+                               binary_protocol_wbarrier (dest, obj, (gpointer)LOAD_VTABLE (obj));
+               }
+       }
+#endif
+
        if (use_cardtable) {
                gpointer *dest = dest_ptr;
                gpointer *src = src_ptr;
@@ -5878,15 +5823,43 @@ void mono_gc_wbarrier_value_copy_bitmap (gpointer _dest, gpointer _src, int size
        }
 }
 
+#ifdef SGEN_BINARY_PROTOCOL
+#undef HANDLE_PTR
+#define HANDLE_PTR(ptr,obj) do {                                       \
+               gpointer o = *(gpointer*)(ptr);                         \
+               if ((o)) {                                              \
+                       gpointer d = ((char*)dest) + ((char*)(ptr) - (char*)(obj)); \
+                       binary_protocol_wbarrier (d, o, (gpointer) LOAD_VTABLE (o)); \
+               }                                                       \
+       } while (0)
+
+static void
+scan_object_for_binary_protocol_copy_wbarrier (gpointer dest, char *start, mword desc)
+{
+#define SCAN_OBJECT_NOVTABLE
+#include "sgen-scan-object.h"
+}
+#endif
 
 void
 mono_gc_wbarrier_value_copy (gpointer dest, gpointer src, int count, MonoClass *klass)
 {
        RememberedSet *rs;
-       size_t size = count * mono_class_value_size (klass, NULL);
+       size_t element_size = mono_class_value_size (klass, NULL);
+       size_t size = count * element_size;
        TLAB_ACCESS_INIT;
        HEAVY_STAT (++stat_wbarrier_value_copy);
        g_assert (klass->valuetype);
+#ifdef SGEN_BINARY_PROTOCOL
+       {
+               int i;
+               for (i = 0; i < count; ++i) {
+                       scan_object_for_binary_protocol_copy_wbarrier ((char*)dest + i * element_size,
+                                       (char*)src + i * element_size - sizeof (MonoObject),
+                                       (mword) klass->gc_descr);
+               }
+       }
+#endif
        if (use_cardtable) {
 #ifdef DISABLE_CRITICAL_REGION
                LOCK_GC;
@@ -5915,7 +5888,7 @@ mono_gc_wbarrier_value_copy (gpointer dest, gpointer src, int count, MonoClass *
                        *(rs->store_next++) = (mword)dest | REMSET_VTYPE;
                        *(rs->store_next++) = (mword)klass->gc_descr;
                        *(rs->store_next++) = (mword)count;
-                       *(rs->store_next++) = (mword)size;
+                       *(rs->store_next++) = (mword)element_size;
                        UNLOCK_GC;
                        return;
                }
@@ -5928,7 +5901,7 @@ mono_gc_wbarrier_value_copy (gpointer dest, gpointer src, int count, MonoClass *
                *(rs->store_next++) = (mword)dest | REMSET_VTYPE;
                *(rs->store_next++) = (mword)klass->gc_descr;
                *(rs->store_next++) = (mword)count;
-               *(rs->store_next++) = (mword)size;
+               *(rs->store_next++) = (mword)element_size;
                UNLOCK_GC;
        }
 }
@@ -5950,6 +5923,9 @@ mono_gc_wbarrier_object_copy (MonoObject* obj, MonoObject *src)
        DEBUG (6, fprintf (gc_debug_file, "Adding object remset for %p\n", obj));
        size = mono_object_class (obj)->instance_size;
        LOCK_GC;
+#ifdef SGEN_BINARY_PROTOCOL
+       scan_object_for_binary_protocol_copy_wbarrier (obj, (char*)src, (mword) src->vtable->gc_descr);
+#endif
        /* do not copy the sync state */
        mono_gc_memmove ((char*)obj + sizeof (MonoObject), (char*)src + sizeof (MonoObject),
                        size - sizeof (MonoObject));
@@ -6579,10 +6555,11 @@ mono_gc_base_init (void)
        char *env;
        char **opts, **ptr;
        char *major_collector_opt = NULL;
-       struct sigaction sinfo;
        glong max_heap = 0;
+       glong soft_limit = 0;
        int num_workers;
        int result;
+       int dummy;
 
        do {
                result = InterlockedCompareExchange (&gc_initialized, -1, 0);
@@ -6592,7 +6569,7 @@ mono_gc_base_init (void)
                        return;
                case -1:
                        /* being inited by another thread */
-                       usleep (1000);
+                       g_usleep (1000);
                        break;
                case 0:
                        /* we will init it */
@@ -6605,7 +6582,7 @@ mono_gc_base_init (void)
        LOCK_INIT (gc_mutex);
 
        pagesize = mono_pagesize ();
-       gc_debug_file = stdout;
+       gc_debug_file = stderr;
 
        cb.thread_register = sgen_thread_register;
        cb.thread_unregister = sgen_thread_unregister;
@@ -6656,25 +6633,9 @@ mono_gc_base_init (void)
         * it inits the small id which is required for hazard pointer
         * operations.
         */
-       suspend_ack_semaphore_ptr = &suspend_ack_semaphore;
-       MONO_SEM_INIT (&suspend_ack_semaphore, 0);
-
-       sigfillset (&sinfo.sa_mask);
-       sinfo.sa_flags = SA_RESTART | SA_SIGINFO;
-       sinfo.sa_sigaction = suspend_handler;
-       if (sigaction (suspend_signal_num, &sinfo, NULL) != 0) {
-               g_error ("failed sigaction");
-       }
+       mono_sgen_os_init ();
 
-       sinfo.sa_handler = restart_handler;
-       if (sigaction (restart_signal_num, &sinfo, NULL) != 0) {
-               g_error ("failed sigaction");
-       }
-
-       sigfillset (&suspend_signal_mask);
-       sigdelset (&suspend_signal_mask, restart_signal_num);
-
-       mono_thread_info_attach (&sinfo);
+       mono_thread_info_attach (&dummy);
 
        if (!major_collector_opt || !strcmp (major_collector_opt, "marksweep")) {
                mono_sgen_marksweep_init (&major_collector);
@@ -6738,6 +6699,19 @@ mono_gc_base_init (void)
                                }
                                continue;
                        }
+                       if (g_str_has_prefix (opt, "soft-heap-limit=")) {
+                               opt = strchr (opt, '=') + 1;
+                               if (*opt && mono_gc_parse_environment_string_extract_number (opt, &soft_limit)) {
+                                       if (soft_limit <= 0) {
+                                               fprintf (stderr, "soft-heap-limit must be positive.\n");
+                                               exit (1);
+                                       }
+                               } else {
+                                       fprintf (stderr, "soft-heap-limit must be an integer.\n");
+                                       exit (1);
+                               }
+                               continue;
+                       }
                        if (g_str_has_prefix (opt, "workers=")) {
                                long val;
                                char *endptr;
@@ -6796,6 +6770,7 @@ mono_gc_base_init (void)
                        if (!(major_collector.handle_gc_param && major_collector.handle_gc_param (opt))) {
                                fprintf (stderr, "MONO_GC_PARAMS must be a comma-delimited list of one or more of the following:\n");
                                fprintf (stderr, "  max-heap-size=N (where N is an integer, possibly with a k, m or a g suffix)\n");
+                               fprintf (stderr, "  soft-heap-limit=n (where N is an integer, possibly with a k, m or a g suffix)\n");
                                fprintf (stderr, "  nursery-size=N (where N is an integer, possibly with a k, m or a g suffix)\n");
                                fprintf (stderr, "  major=COLLECTOR (where COLLECTOR is `marksweep', `marksweep-par' or `copying')\n");
                                fprintf (stderr, "  wbarrier=WBARRIER (where WBARRIER is `remset' or `cardtable')\n");
@@ -6816,7 +6791,7 @@ mono_gc_base_init (void)
 
        nursery_size = DEFAULT_NURSERY_SIZE;
        minor_collection_allowance = MIN_MINOR_COLLECTION_ALLOWANCE;
-       init_heap_size_limits (max_heap);
+       init_heap_size_limits (max_heap, soft_limit);
 
        alloc_nursery ();
 
@@ -6836,6 +6811,8 @@ mono_gc_base_init (void)
                                                gc_debug_file = stderr;
                                        g_free (rf);
                                }
+                       } else if (!strcmp (opt, "print-allowance")) {
+                               debug_print_allowance = TRUE;
                        } else if (!strcmp (opt, "collect-before-allocs")) {
                                collect_before_allocs = 1;
                        } else if (g_str_has_prefix (opt, "collect-before-allocs=")) {
@@ -6877,6 +6854,7 @@ mono_gc_base_init (void)
                                fprintf (stderr, "  disable-major\n");
                                fprintf (stderr, "  xdomain-checks\n");
                                fprintf (stderr, "  clear-at-gc\n");
+                               fprintf (stderr, "  print-allowance\n");
                                exit (1);
                        }
                }
@@ -6895,12 +6873,6 @@ mono_gc_base_init (void)
        gc_initialized = 1;
 }
 
-int
-mono_gc_get_suspend_signal (void)
-{
-       return suspend_signal_num;
-}
-
 enum {
        ATYPE_NORMAL,
        ATYPE_VECTOR,
@@ -7396,7 +7368,6 @@ mono_gc_get_write_barrier (void)
        int i, nursery_check_labels [3];
        int label_no_wb_3, label_no_wb_4, label_need_wb, label_slow_path;
        int buffer_var, buffer_index_var, dummy_var;
-       gboolean use_managed_barrier;
 
 #ifdef HAVE_KW_THREAD
        int stack_end_offset = -1, store_remset_buffer_offset = -1;
@@ -7426,10 +7397,7 @@ mono_gc_get_write_barrier (void)
        mb = mono_mb_new (mono_defaults.object_class, "wbarrier", MONO_WRAPPER_WRITE_BARRIER);
 
 #ifdef MANAGED_WBARRIER
-       use_managed_barrier = TRUE;
-#endif
-
-       if (use_managed_barrier && use_cardtable) {
+       if (use_cardtable) {
                emit_nursery_check (mb, nursery_check_labels);
                /*
                addr = sgen_cardtable + ((address >> CARD_BITS) & CARD_MASK)
@@ -7468,7 +7436,7 @@ mono_gc_get_write_barrier (void)
                                mono_mb_patch_branch (mb, nursery_check_labels [i]);
                }               
                mono_mb_emit_byte (mb, CEE_RET);
-       } else if (use_managed_barrier && mono_runtime_has_tls_get ()) {
+       } else if (mono_runtime_has_tls_get ()) {
                emit_nursery_check (mb, nursery_check_labels);
 
                // if (ptr >= stack_end) goto need_wb;
@@ -7547,13 +7515,14 @@ mono_gc_get_write_barrier (void)
                mono_mb_emit_ldarg (mb, 0);
                mono_mb_emit_icall (mb, mono_gc_wbarrier_generic_nostore);
                mono_mb_emit_byte (mb, CEE_RET);
-       } else {
+       } else
+#endif
+       {
                mono_mb_emit_ldarg (mb, 0);
                mono_mb_emit_icall (mb, mono_gc_wbarrier_generic_nostore);
-               mono_mb_emit_byte (mb, CEE_RET);                
+               mono_mb_emit_byte (mb, CEE_RET);
        }
 
-
        res = mono_mb_create_method (mb, sig, 16);
        mono_mb_free (mb);