Merge pull request #350 from robwilkens/bug1089
[mono.git] / mono / metadata / threads.c
index c090393736cba337f1dda46f192960589b948786..e3b9e1a569dd3eccfe36042ab9c0aea4d3de9da0 100644 (file)
@@ -8,6 +8,7 @@
  *
  * Copyright 2001-2003 Ximian, Inc (http://www.ximian.com)
  * Copyright 2004-2009 Novell, Inc (http://www.novell.com)
+ * Copyright 2011 Xamarin, Inc (http://www.xamarin.com)
  */
 
 #include <config.h>
@@ -16,7 +17,7 @@
 #include <signal.h>
 #include <string.h>
 
-#if defined(__OpenBSD__)
+#if defined(__OpenBSD__) || defined(__FreeBSD__)
 #include <pthread.h>
 #include <pthread_np.h>
 #endif
@@ -42,6 +43,9 @@
 #include <mono/utils/mono-mmap.h>
 #include <mono/utils/mono-membar.h>
 #include <mono/utils/mono-time.h>
+#include <mono/utils/mono-threads.h>
+#include <mono/utils/hazard-pointer.h>
+#include <mono/utils/mono-tls.h>
 
 #include <mono/metadata/gc-internal.h>
 
 extern int tkill (pid_t tid, int signal);
 #endif
 
+#if defined(PLATFORM_MACOSX) && defined(HAVE_PTHREAD_GET_STACKADDR_NP)
+void *pthread_get_stackaddr_np(pthread_t);
+size_t pthread_get_stacksize_np(pthread_t);
+#endif
+
 /*#define THREAD_DEBUG(a) do { a; } while (0)*/
 #define THREAD_DEBUG(a)
 /*#define THREAD_WAIT_DEBUG(a) do { a; } while (0)*/
@@ -106,11 +115,6 @@ typedef struct {
        MonoThreadDomainTls *freelist;
 } StaticDataInfo;
 
-typedef struct {
-       gpointer p;
-       MonoHazardousFreeFunc free_func;
-} DelayedFreeItem;
-
 /* Number of cached culture objects in the MonoThread->cached_culture_info array
  * (per-type): we use the first NUM entries for CultureInfo and the last for
  * UICultureInfo. So the size of the array is really NUM_CACHED_CULTURES * 2.
@@ -150,7 +154,7 @@ static MonoGHashTable *threads_starting_up = NULL;
 static MonoGHashTable *thread_start_args = NULL;
 
 /* The TLS key that holds the MonoObject assigned to each thread */
-static guint32 current_object_key = -1;
+static MonoNativeTlsKey current_object_key;
 
 #ifdef MONO_HAVE_FAST_TLS
 /* we need to use both the Tls* functions and __thread because
@@ -159,12 +163,12 @@ static guint32 current_object_key = -1;
 MONO_FAST_TLS_DECLARE(tls_current_object);
 #define SET_CURRENT_OBJECT(x) do { \
        MONO_FAST_TLS_SET (tls_current_object, x); \
-       TlsSetValue (current_object_key, x); \
+       mono_native_tls_set_value (current_object_key, x); \
 } while (FALSE)
 #define GET_CURRENT_OBJECT() ((MonoInternalThread*) MONO_FAST_TLS_GET (tls_current_object))
 #else
-#define SET_CURRENT_OBJECT(x) TlsSetValue (current_object_key, x)
-#define GET_CURRENT_OBJECT() (MonoInternalThread*) TlsGetValue (current_object_key)
+#define SET_CURRENT_OBJECT(x) mono_native_tls_set_value (current_object_key, x)
+#define GET_CURRENT_OBJECT() (MonoInternalThread*) mono_native_tls_get_value (current_object_key)
 #endif
 
 /* function called at thread start */
@@ -190,8 +194,13 @@ static guint32 mono_alloc_static_data_slot (StaticDataInfo *static_data, guint32
 static gboolean mono_thread_resume (MonoInternalThread* thread);
 static void mono_thread_start (MonoThread *thread);
 static void signal_thread_state_change (MonoInternalThread *thread);
+static void abort_thread_internal (MonoInternalThread *thread, gboolean can_raise_exception, gboolean install_async_abort);
+static void suspend_thread_internal (MonoInternalThread *thread, gboolean interrupt);
+static void self_suspend_internal (MonoInternalThread *thread);
+static gboolean resume_thread_internal (MonoInternalThread *thread);
 
 static MonoException* mono_thread_execute_interruption (MonoInternalThread *thread);
+static void ref_stack_destroy (gpointer rs);
 
 /* Spin lock for InterlockedXXX 64 bit functions */
 #define mono_interlocked_lock() EnterCriticalSection (&interlocked_mutex)
@@ -204,30 +213,17 @@ static gint32 thread_interruption_requested = 0;
 /* Event signaled when a thread changes its background mode */
 static HANDLE background_change_event;
 
-/* The table for small ID assignment */
-static CRITICAL_SECTION small_id_mutex;
-static int small_id_table_size = 0;
-static int small_id_next = 0;
-static int highest_small_id = -1;
-static MonoInternalThread **small_id_table = NULL;
-
-/* The hazard table */
-#if MONO_SMALL_CONFIG
-#define HAZARD_TABLE_MAX_SIZE  256
-#else
-#define HAZARD_TABLE_MAX_SIZE  16384 /* There cannot be more threads than this number. */
-#endif
-static volatile int hazard_table_size = 0;
-static MonoThreadHazardPointers * volatile hazard_table = NULL;
+static gboolean shutting_down = FALSE;
 
-/* The table where we keep pointers to blocks to be freed but that
-   have to wait because they're guarded by a hazard pointer. */
-static CRITICAL_SECTION delayed_free_table_mutex;
-static GArray *delayed_free_table = NULL;
+static gint32 managed_thread_id_counter = 0;
 
-static gboolean shutting_down = FALSE;
+static guint32
+get_next_managed_thread_id (void)
+{
+       return InterlockedIncrement (&managed_thread_id_counter);
+}
 
-guint32
+MonoNativeTlsKey
 mono_thread_get_tls_key (void)
 {
        return current_object_key;
@@ -251,7 +247,7 @@ static gboolean handle_store(MonoThread *thread)
 {
        mono_threads_lock ();
 
-       THREAD_DEBUG (g_message ("%s: thread %p ID %"G_GSIZE_FORMAT, __func__, thread, (gsize)thread->tid));
+       THREAD_DEBUG (g_message ("%s: thread %p ID %"G_GSIZE_FORMAT, __func__, thread, (gsize)thread->internal_thread->tid));
 
        if (threads_starting_up)
                mono_g_hash_table_remove (threads_starting_up, thread);
@@ -322,206 +318,6 @@ static gboolean handle_remove(MonoInternalThread *thread)
        return ret;
 }
 
-/*
- * Allocate a small thread id.
- *
- * FIXME: The biggest part of this function is very similar to
- * domain_id_alloc() in domain.c and should be merged.
- */
-static int
-small_id_alloc (MonoInternalThread *thread)
-{
-       int id = -1, i;
-
-       EnterCriticalSection (&small_id_mutex);
-
-       if (!small_id_table) {
-               small_id_table_size = 2;
-               /* 
-                * Enabling this causes problems, because SGEN doesn't track/update the TLS slot holding
-                * the current thread.
-                */
-               //small_id_table = mono_gc_alloc_fixed (small_id_table_size * sizeof (MonoInternalThread*), mono_gc_make_root_descr_all_refs (small_id_table_size));
-               small_id_table = mono_gc_alloc_fixed (small_id_table_size * sizeof (MonoInternalThread*), NULL);
-       }
-       for (i = small_id_next; i < small_id_table_size; ++i) {
-               if (!small_id_table [i]) {
-                       id = i;
-                       break;
-               }
-       }
-       if (id == -1) {
-               for (i = 0; i < small_id_next; ++i) {
-                       if (!small_id_table [i]) {
-                               id = i;
-                               break;
-                       }
-               }
-       }
-       if (id == -1) {
-               MonoInternalThread **new_table;
-               int new_size = small_id_table_size * 2;
-               if (new_size >= (1 << 16))
-                       g_assert_not_reached ();
-               id = small_id_table_size;
-               //new_table = mono_gc_alloc_fixed (new_size * sizeof (MonoInternalThread*), mono_gc_make_root_descr_all_refs (new_size));
-               new_table = mono_gc_alloc_fixed (new_size * sizeof (MonoInternalThread*), NULL);
-               memcpy (new_table, small_id_table, small_id_table_size * sizeof (void*));
-               mono_gc_free_fixed (small_id_table);
-               small_id_table = new_table;
-               small_id_table_size = new_size;
-       }
-       thread->small_id = id;
-       g_assert (small_id_table [id] == NULL);
-       small_id_table [id] = thread;
-       small_id_next++;
-       if (small_id_next > small_id_table_size)
-               small_id_next = 0;
-
-       g_assert (id < HAZARD_TABLE_MAX_SIZE);
-       if (id >= hazard_table_size) {
-#if MONO_SMALL_CONFIG
-               hazard_table = g_malloc0 (sizeof (MonoThreadHazardPointers) * HAZARD_TABLE_MAX_SIZE);
-               hazard_table_size = HAZARD_TABLE_MAX_SIZE;
-#else
-               gpointer page_addr;
-               int pagesize = mono_pagesize ();
-               int num_pages = (hazard_table_size * sizeof (MonoThreadHazardPointers) + pagesize - 1) / pagesize;
-
-               if (hazard_table == NULL) {
-                       hazard_table = mono_valloc (NULL,
-                               sizeof (MonoThreadHazardPointers) * HAZARD_TABLE_MAX_SIZE,
-                               MONO_MMAP_NONE);
-               }
-
-               g_assert (hazard_table != NULL);
-               page_addr = (guint8*)hazard_table + num_pages * pagesize;
-
-               mono_mprotect (page_addr, pagesize, MONO_MMAP_READ | MONO_MMAP_WRITE);
-
-               ++num_pages;
-               hazard_table_size = num_pages * pagesize / sizeof (MonoThreadHazardPointers);
-
-#endif
-               g_assert (id < hazard_table_size);
-               hazard_table [id].hazard_pointers [0] = NULL;
-               hazard_table [id].hazard_pointers [1] = NULL;
-       }
-
-       if (id > highest_small_id) {
-               highest_small_id = id;
-               mono_memory_write_barrier ();
-       }
-
-       LeaveCriticalSection (&small_id_mutex);
-
-       return id;
-}
-
-static void
-small_id_free (int id)
-{
-       g_assert (id >= 0 && id < small_id_table_size);
-       g_assert (small_id_table [id] != NULL);
-
-       small_id_table [id] = NULL;
-}
-
-static gboolean
-is_pointer_hazardous (gpointer p)
-{
-       int i;
-       int highest = highest_small_id;
-
-       g_assert (highest < hazard_table_size);
-
-       for (i = 0; i <= highest; ++i) {
-               if (hazard_table [i].hazard_pointers [0] == p
-                               || hazard_table [i].hazard_pointers [1] == p)
-                       return TRUE;
-       }
-
-       return FALSE;
-}
-
-MonoThreadHazardPointers*
-mono_hazard_pointer_get (void)
-{
-       MonoInternalThread *current_thread = mono_thread_internal_current ();
-
-       if (!(current_thread && current_thread->small_id >= 0)) {
-               static MonoThreadHazardPointers emerg_hazard_table;
-               g_warning ("Thread %p may have been prematurely finalized", current_thread);
-               return &emerg_hazard_table;
-       }
-
-       return &hazard_table [current_thread->small_id];
-}
-
-static void
-try_free_delayed_free_item (int index)
-{
-       if (delayed_free_table->len > index) {
-               DelayedFreeItem item = { NULL, NULL };
-
-               EnterCriticalSection (&delayed_free_table_mutex);
-               /* We have to check the length again because another
-                  thread might have freed an item before we acquired
-                  the lock. */
-               if (delayed_free_table->len > index) {
-                       item = g_array_index (delayed_free_table, DelayedFreeItem, index);
-
-                       if (!is_pointer_hazardous (item.p))
-                               g_array_remove_index_fast (delayed_free_table, index);
-                       else
-                               item.p = NULL;
-               }
-               LeaveCriticalSection (&delayed_free_table_mutex);
-
-               if (item.p != NULL)
-                       item.free_func (item.p);
-       }
-}
-
-void
-mono_thread_hazardous_free_or_queue (gpointer p, MonoHazardousFreeFunc free_func)
-{
-       int i;
-
-       /* First try to free a few entries in the delayed free
-          table. */
-       for (i = 2; i >= 0; --i)
-               try_free_delayed_free_item (i);
-
-       /* Now see if the pointer we're freeing is hazardous.  If it
-          isn't, free it.  Otherwise put it in the delay list. */
-       if (is_pointer_hazardous (p)) {
-               DelayedFreeItem item = { p, free_func };
-
-               ++mono_stats.hazardous_pointer_count;
-
-               EnterCriticalSection (&delayed_free_table_mutex);
-               g_array_append_val (delayed_free_table, item);
-               LeaveCriticalSection (&delayed_free_table_mutex);
-       } else
-               free_func (p);
-}
-
-void
-mono_thread_hazardous_try_free_all (void)
-{
-       int len;
-       int i;
-
-       if (!delayed_free_table)
-               return;
-
-       len = delayed_free_table->len;
-
-       for (i = len - 1; i >= 0; --i)
-               try_free_delayed_free_item (i);
-}
-
 static void ensure_synch_cs_set (MonoInternalThread *thread)
 {
        CRITICAL_SECTION *synch_cs;
@@ -568,6 +364,28 @@ static void thread_cleanup (MonoInternalThread *thread)
                        mono_array_set (thread->cached_culture_info, MonoObject*, i, NULL);
        }
 
+       ensure_synch_cs_set (thread);
+
+       EnterCriticalSection (thread->synch_cs);
+
+       thread->state |= ThreadState_Stopped;
+       thread->state &= ~ThreadState_Background;
+
+       LeaveCriticalSection (thread->synch_cs);
+
+       /*
+       An interruption request has leaked to cleanup. Adjust the global counter.
+
+       This can happen is the abort source thread finds the abortee (this) thread
+       in unmanaged code. If this thread never trips back to managed code or check
+       the local flag it will be left set and positively unbalance the global counter.
+       
+       Leaving the counter unbalanced will cause a performance degradation since all threads
+       will now keep checking their local flags all the time.
+       */
+       if (InterlockedExchange (&thread->interruption_requested, 0))
+               InterlockedDecrement (&thread_interruption_requested);
+
        /* if the thread is not in the hash it has been removed already */
        if (!handle_remove (thread)) {
                /* This needs to be called even if handle_remove () fails */
@@ -577,13 +395,6 @@ static void thread_cleanup (MonoInternalThread *thread)
        }
        mono_release_type_locks (thread);
 
-       EnterCriticalSection (thread->synch_cs);
-
-       thread->state |= ThreadState_Stopped;
-       thread->state &= ~ThreadState_Background;
-
-       LeaveCriticalSection (thread->synch_cs);
-       
        mono_profiler_thread_end (thread->tid);
 
        if (thread == mono_thread_internal_current ())
@@ -593,13 +404,13 @@ static void thread_cleanup (MonoInternalThread *thread)
 
        mono_free_static_data (thread->static_data, TRUE);
        thread->static_data = NULL;
+       ref_stack_destroy (thread->appdomain_refs);
+       thread->appdomain_refs = NULL;
 
        if (mono_thread_cleanup_fn)
                mono_thread_cleanup_fn (thread);
 
-       small_id_free (thread->small_id);
-       thread->small_id = -2;
-
+       MONO_GC_UNREGISTER_ROOT (thread->thread_pinning_ref);
 }
 
 static gpointer
@@ -680,6 +491,7 @@ init_root_domain_thread (MonoInternalThread *thread, MonoThread *candidate)
 
 static guint32 WINAPI start_wrapper_internal(void *data)
 {
+       MonoThreadInfo *info;
        struct StartInfo *start_info=(struct StartInfo *)data;
        guint32 (*start_func)(void *);
        void *start_arg;
@@ -700,6 +512,11 @@ static guint32 WINAPI start_wrapper_internal(void *data)
         * thread resumed
         */
 
+       info = mono_thread_info_current ();
+       g_assert (info);
+       internal->thread_info = info;
+
+
        tid=internal->tid;
 
        SET_CURRENT_OBJECT (internal);
@@ -733,7 +550,7 @@ static guint32 WINAPI start_wrapper_internal(void *data)
 
        LIBGC_DEBUG (g_message ("%s: (%"G_GSIZE_FORMAT",%d) Setting thread stack to %p", __func__, GetCurrentThreadId (), getpid (), thread->stack_ptr));
 
-       THREAD_DEBUG (g_message ("%s: (%"G_GSIZE_FORMAT") Setting current_object_key to %p", __func__, GetCurrentThreadId (), thread));
+       THREAD_DEBUG (g_message ("%s: (%"G_GSIZE_FORMAT") Setting current_object_key to %p", __func__, GetCurrentThreadId (), internal));
 
        /* On 2.0 profile (and higher), set explicitly since state might have been
           Unknown */
@@ -757,10 +574,8 @@ static guint32 WINAPI start_wrapper_internal(void *data)
        start_info->obj->ec_to_set = NULL;
 
        g_free (start_info);
-#ifdef DEBUG
-       g_message ("%s: start_wrapper for %"G_GSIZE_FORMAT, __func__,
-                  thread->tid);
-#endif
+       THREAD_DEBUG (g_message ("%s: start_wrapper for %"G_GSIZE_FORMAT, __func__,
+                                                        internal->tid));
 
        /* 
         * Call this after calling start_notify, since the profiler callback might want
@@ -812,12 +627,10 @@ static guint32 WINAPI start_wrapper_internal(void *data)
 
 static guint32 WINAPI start_wrapper(void *data)
 {
-#ifdef HAVE_SGEN_GC
        volatile int dummy;
 
        /* Avoid scanning the frames above this frame during a GC */
        mono_gc_set_stack_end ((void*)&dummy);
-#endif
 
        return start_wrapper_internal (data);
 }
@@ -854,7 +667,7 @@ gpointer mono_create_thread (WapiSecurityAttributes *security,
 #ifdef HOST_WIN32
        DWORD real_tid;
 
-       res = CreateThread (security, stacksize, start, param, create, &real_tid);
+       res = mono_threads_CreateThread (security, stacksize, start, param, create, &real_tid);
        if (tid)
                *tid = real_tid;
 #else
@@ -882,7 +695,7 @@ register_thread_start_argument (MonoThread *thread, struct StartInfo *start_info
        mono_g_hash_table_insert (thread_start_args, thread, start_info->start_arg);
 }
 
-MonoInternalThread* mono_thread_create_internal (MonoDomain *domain, gpointer func, gpointer arg, gboolean threadpool_thread)
+MonoInternalThread* mono_thread_create_internal (MonoDomain *domain, gpointer func, gpointer arg, gboolean threadpool_thread, guint32 stack_size)
 {
        MonoThread *thread;
        MonoInternalThread *internal;
@@ -914,10 +727,13 @@ MonoInternalThread* mono_thread_create_internal (MonoDomain *domain, gpointer fu
        mono_g_hash_table_insert (threads_starting_up, thread, thread);
        mono_threads_unlock (); 
 
+       if (stack_size == 0)
+               stack_size = default_stacksize_for_thread (internal);
+
        /* Create suspended, so we can do some housekeeping before the thread
         * starts
         */
-       thread_handle = mono_create_thread (NULL, default_stacksize_for_thread (internal), (LPTHREAD_START_ROUTINE)start_wrapper, start_info,
+       thread_handle = mono_create_thread (NULL, stack_size, (LPTHREAD_START_ROUTINE)start_wrapper, start_info,
                                     CREATE_SUSPENDED, &tid);
        THREAD_DEBUG (g_message ("%s: Started thread ID %"G_GSIZE_FORMAT" (handle %p)", __func__, tid, thread_handle));
        if (thread_handle == NULL) {
@@ -933,7 +749,9 @@ MonoInternalThread* mono_thread_create_internal (MonoDomain *domain, gpointer fu
        internal->handle=thread_handle;
        internal->tid=tid;
        internal->apartment_state=ThreadApartmentState_Unknown;
-       small_id_alloc (internal);
+       internal->thread_pinning_ref = internal;
+       internal->managed_id = get_next_managed_thread_id ();
+       MONO_GC_REGISTER_ROOT (internal->thread_pinning_ref);
 
        internal->synch_cs = g_new0 (CRITICAL_SECTION, 1);
        InitializeCriticalSection (internal->synch_cs);
@@ -951,7 +769,7 @@ MonoInternalThread* mono_thread_create_internal (MonoDomain *domain, gpointer fu
 void
 mono_thread_create (MonoDomain *domain, gpointer func, gpointer arg)
 {
-       mono_thread_create_internal (domain, func, arg, FALSE);
+       mono_thread_create_internal (domain, func, arg, FALSE, 0);
 }
 
 /*
@@ -966,6 +784,9 @@ mono_thread_get_stack_bounds (guint8 **staddr, size_t *stsize)
 #if defined(HAVE_PTHREAD_GET_STACKSIZE_NP) && defined(HAVE_PTHREAD_GET_STACKADDR_NP)
        *staddr = (guint8*)pthread_get_stackaddr_np (pthread_self ());
        *stsize = pthread_get_stacksize_np (pthread_self ());
+
+       /* staddr points to the start of the stack, not the end */
+       *staddr -= *stsize;
        *staddr = (guint8*)((gssize)*staddr & ~(mono_pagesize () - 1));
        return;
        /* FIXME: simplify the mess below */
@@ -1055,7 +876,10 @@ mono_thread_attach (MonoDomain *domain)
        thread->android_tid = (gpointer) gettid ();
 #endif
        thread->apartment_state=ThreadApartmentState_Unknown;
-       small_id_alloc (thread);
+       thread->thread_pinning_ref = thread;
+       thread->managed_id = get_next_managed_thread_id ();
+       MONO_GC_REGISTER_ROOT (thread->thread_pinning_ref);
+
        thread->stack_ptr = &tid;
 
        thread->synch_cs = g_new0 (CRITICAL_SECTION, 1);
@@ -1108,8 +932,10 @@ mono_thread_detach (MonoThread *thread)
 {
        g_return_if_fail (thread != NULL);
 
-       THREAD_DEBUG (g_message ("%s: mono_thread_detach for %p (%"G_GSIZE_FORMAT")", __func__, thread, (gsize)thread->tid));
+       THREAD_DEBUG (g_message ("%s: mono_thread_detach for %p (%"G_GSIZE_FORMAT")", __func__, thread, (gsize)thread->internal_thread->tid));
        
+       mono_profiler_thread_end (thread->internal_thread->tid);
+
        thread_cleanup (thread->internal_thread);
 
        SET_CURRENT_OBJECT (NULL);
@@ -1145,6 +971,7 @@ ves_icall_System_Threading_Thread_ConstructInternalThread (MonoThread *this)
 
        internal->state = ThreadState_Unstarted;
        internal->apartment_state = ThreadApartmentState_Unknown;
+       internal->managed_id = get_next_managed_thread_id ();
 
        InterlockedCompareExchangePointer ((gpointer)&this->internal_thread, internal, NULL);
 }
@@ -1174,8 +1001,6 @@ HANDLE ves_icall_System_Threading_Thread_Thread_internal(MonoThread *this,
                return NULL;
        }
 
-       internal->small_id = -1;
-
        if ((internal->state & ThreadState_Aborted) != 0) {
                LeaveCriticalSection (internal->synch_cs);
                return this;
@@ -1220,7 +1045,9 @@ HANDLE ves_icall_System_Threading_Thread_Thread_internal(MonoThread *this,
                
                internal->handle=thread;
                internal->tid=tid;
-               small_id_alloc (internal);
+               internal->thread_pinning_ref = internal;
+               MONO_GC_REGISTER_ROOT (internal->thread_pinning_ref);
+               
 
                /* Don't call handle_store() here, delay it to Start.
                 * We can't join a thread (trying to will just block
@@ -1249,19 +1076,24 @@ void ves_icall_System_Threading_InternalThread_Thread_free_internal (MonoInterna
                CloseHandle (thread);
 
        if (this->synch_cs) {
-               DeleteCriticalSection (this->synch_cs);
-               g_free (this->synch_cs);
+               CRITICAL_SECTION *synch_cs = this->synch_cs;
                this->synch_cs = NULL;
+               DeleteCriticalSection (synch_cs);
+               g_free (synch_cs);
        }
 
-       g_free (this->name);
+       if (this->name) {
+               void *name = this->name;
+               this->name = NULL;
+               g_free (name);
+       }
 }
 
 static void mono_thread_start (MonoThread *thread)
 {
        MonoInternalThread *internal = thread->internal_thread;
 
-       THREAD_DEBUG (g_message ("%s: (%"G_GSIZE_FORMAT") Launching thread %p (%"G_GSIZE_FORMAT")", __func__, GetCurrentThreadId (), thread, (gsize)thread->tid));
+       THREAD_DEBUG (g_message ("%s: (%"G_GSIZE_FORMAT") Launching thread %p (%"G_GSIZE_FORMAT")", __func__, GetCurrentThreadId (), internal, (gsize)internal->tid));
 
        /* Only store the handle when the thread is about to be
         * launched, to avoid the main thread deadlocking while trying
@@ -1279,14 +1111,14 @@ static void mono_thread_start (MonoThread *thread)
                 * started
                 */
 
-               THREAD_DEBUG (g_message ("%s: (%"G_GSIZE_FORMAT") waiting for thread %p (%"G_GSIZE_FORMAT") to start", __func__, GetCurrentThreadId (), thread, (gsize)thread->tid));
+               THREAD_DEBUG (g_message ("%s: (%"G_GSIZE_FORMAT") waiting for thread %p (%"G_GSIZE_FORMAT") to start", __func__, GetCurrentThreadId (), internal, (gsize)internal->tid));
 
                WaitForSingleObjectEx (internal->start_notify, INFINITE, FALSE);
                CloseHandle (internal->start_notify);
                internal->start_notify = NULL;
        }
 
-       THREAD_DEBUG (g_message ("%s: (%"G_GSIZE_FORMAT") Done launching thread %p (%"G_GSIZE_FORMAT")", __func__, GetCurrentThreadId (), thread, (gsize)thread->tid));
+       THREAD_DEBUG (g_message ("%s: (%"G_GSIZE_FORMAT") Done launching thread %p (%"G_GSIZE_FORMAT")", __func__, GetCurrentThreadId (), internal, (gsize)internal->tid));
 }
 
 void ves_icall_System_Threading_Thread_Sleep_internal(gint32 ms)
@@ -1298,15 +1130,25 @@ void ves_icall_System_Threading_Thread_Sleep_internal(gint32 ms)
 
        mono_thread_current_check_pending_interrupt ();
        
-       mono_thread_set_state (thread, ThreadState_WaitSleepJoin);
+       while (TRUE) {
+               mono_thread_set_state (thread, ThreadState_WaitSleepJoin);
        
-       res = SleepEx(ms,TRUE);
+               res = SleepEx(ms,TRUE);
        
-       mono_thread_clr_state (thread, ThreadState_WaitSleepJoin);
-
-       if (res == WAIT_IO_COMPLETION) { /* we might have been interrupted */
-               MonoException* exc = mono_thread_execute_interruption (thread);
-               if (exc) mono_raise_exception (exc);
+               mono_thread_clr_state (thread, ThreadState_WaitSleepJoin);
+
+               if (res == WAIT_IO_COMPLETION) { /* we might have been interrupted */
+                       MonoException* exc = mono_thread_execute_interruption (thread);
+                       if (exc) {
+                               mono_raise_exception (exc);
+                       } else {
+                               // FIXME: !INFINITE
+                               if (ms != INFINITE)
+                                       break;
+                       }
+               } else {
+                       break;
+               }
        }
 }
 
@@ -1382,13 +1224,13 @@ ves_icall_System_Threading_Thread_GetName_internal (MonoInternalThread *this_obj
 }
 
 void 
-ves_icall_System_Threading_Thread_SetName_internal (MonoInternalThread *this_obj, MonoString *name)
+mono_thread_set_name_internal (MonoInternalThread *this_obj, MonoString *name, gboolean managed)
 {
        ensure_synch_cs_set (this_obj);
        
        EnterCriticalSection (this_obj->synch_cs);
-       
-       if (this_obj->name) {
+
+       if (this_obj->flags & MONO_THREAD_FLAG_NAME_SET) {
                LeaveCriticalSection (this_obj->synch_cs);
                
                mono_raise_exception (mono_get_exception_invalid_operation ("Thread.Name can only be set once."));
@@ -1401,6 +1243,9 @@ ves_icall_System_Threading_Thread_SetName_internal (MonoInternalThread *this_obj
        }
        else
                this_obj->name = NULL;
+
+       if (managed)
+               this_obj->flags |= MONO_THREAD_FLAG_NAME_SET;
        
        LeaveCriticalSection (this_obj->synch_cs);
        if (this_obj->name) {
@@ -1410,6 +1255,12 @@ ves_icall_System_Threading_Thread_SetName_internal (MonoInternalThread *this_obj
        }
 }
 
+void 
+ves_icall_System_Threading_Thread_SetName_internal (MonoInternalThread *this_obj, MonoString *name)
+{
+       mono_thread_set_name_internal (this_obj, name, TRUE);
+}
+
 /* If the array is already in the requested domain, we just return it,
    otherwise we return a copy in that domain. */
 static MonoArray*
@@ -1424,7 +1275,7 @@ byte_array_to_domain (MonoArray *arr, MonoDomain *domain)
                return arr;
 
        copy = mono_array_new (domain, mono_defaults.byte_class, arr->max_length);
-       memcpy (mono_array_addr (copy, guint8, 0), mono_array_addr (arr, guint8, 0), arr->max_length);
+       mono_gc_memmove (mono_array_addr (copy, guint8, 0), mono_array_addr (arr, guint8, 0), arr->max_length);
        return copy;
 }
 
@@ -2156,25 +2007,22 @@ ves_icall_System_Threading_Thread_GetState (MonoInternalThread* this)
 
 void ves_icall_System_Threading_Thread_Interrupt_internal (MonoInternalThread *this)
 {
-       gboolean throw = FALSE;
-       
+       MonoInternalThread *current;
+       gboolean throw;
+
        ensure_synch_cs_set (this);
 
-       if (this == mono_thread_internal_current ())
-               return;
-       
-       EnterCriticalSection (this->synch_cs);
-       
-       this->thread_interrupt_requested = TRUE;
-       
-       if (this->state & ThreadState_WaitSleepJoin) {
-               throw = TRUE;
-       }
-       
+       current = mono_thread_internal_current ();
+
+       EnterCriticalSection (this->synch_cs);  
+
+       this->thread_interrupt_requested = TRUE;        
+       throw = current != this && (this->state & ThreadState_WaitSleepJoin);   
+
        LeaveCriticalSection (this->synch_cs);
        
        if (throw) {
-               signal_thread_state_change (this);
+               abort_thread_internal (this, TRUE, FALSE);
        }
 }
 
@@ -2322,7 +2170,7 @@ ves_icall_System_Threading_Thread_Abort (MonoInternalThread *thread, MonoObject
                /* Make sure the thread is awake */
                mono_thread_resume (thread);
        
-       signal_thread_state_change (thread);
+       abort_thread_internal (thread, TRUE, TRUE);
 }
 
 void
@@ -2429,7 +2277,7 @@ mono_thread_suspend (MonoInternalThread *thread)
 
        LeaveCriticalSection (thread->synch_cs);
 
-       signal_thread_state_change (thread);
+       suspend_thread_internal (thread, FALSE);
        return TRUE;
 }
 
@@ -2461,24 +2309,8 @@ mono_thread_resume (MonoInternalThread *thread)
                LeaveCriticalSection (thread->synch_cs);
                return FALSE;
        }
-       
-       thread->resume_event = CreateEvent (NULL, TRUE, FALSE, NULL);
-       if (thread->resume_event == NULL) {
-               LeaveCriticalSection (thread->synch_cs);
-               return(FALSE);
-       }
-       
-       /* Awake the thread */
-       SetEvent (thread->suspend_event);
 
-       LeaveCriticalSection (thread->synch_cs);
-
-       /* Wait for the thread to awake */
-       WaitForSingleObject (thread->resume_event, INFINITE);
-       CloseHandle (thread->resume_event);
-       thread->resume_event = NULL;
-
-       return TRUE;
+       return resume_thread_internal (thread);
 }
 
 void
@@ -2488,16 +2320,25 @@ ves_icall_System_Threading_Thread_Resume (MonoThread *thread)
                mono_raise_exception (mono_get_exception_thread_state ("Thread has not been started, or is dead."));
 }
 
+static gboolean
+mono_threads_is_critical_method (MonoMethod *method)
+{
+       switch (method->wrapper_type) {
+       case MONO_WRAPPER_RUNTIME_INVOKE:
+       case MONO_WRAPPER_XDOMAIN_INVOKE:
+       case MONO_WRAPPER_XDOMAIN_DISPATCH:     
+               return TRUE;
+       }
+       return FALSE;
+}
+
 static gboolean
 find_wrapper (MonoMethod *m, gint no, gint ilo, gboolean managed, gpointer data)
 {
        if (managed)
                return TRUE;
 
-       if (m->wrapper_type == MONO_WRAPPER_RUNTIME_INVOKE ||
-               m->wrapper_type == MONO_WRAPPER_XDOMAIN_INVOKE ||
-               m->wrapper_type == MONO_WRAPPER_XDOMAIN_DISPATCH) 
-       {
+       if (mono_threads_is_critical_method (m)) {
                *((gboolean*)data) = TRUE;
                return TRUE;
        }
@@ -2533,7 +2374,7 @@ void mono_thread_internal_stop (MonoInternalThread *thread)
        
        LeaveCriticalSection (thread->synch_cs);
        
-       signal_thread_state_change (thread);
+       abort_thread_internal (thread, TRUE, TRUE);
 }
 
 void mono_thread_stop (MonoThread *thread)
@@ -2571,6 +2412,18 @@ ves_icall_System_Threading_Thread_VolatileReadIntPtr (void *ptr)
        return (void *)  *((volatile void **) ptr);
 }
 
+double
+ves_icall_System_Threading_Thread_VolatileReadDouble (void *ptr)
+{
+       return *((volatile double *) (ptr));
+}
+
+float
+ves_icall_System_Threading_Thread_VolatileReadFloat (void *ptr)
+{
+       return *((volatile float *) (ptr));
+}
+
 void
 ves_icall_System_Threading_Thread_VolatileWrite1 (void *ptr, gint8 value)
 {
@@ -2607,15 +2460,24 @@ ves_icall_System_Threading_Thread_VolatileWriteObject (void *ptr, void *value)
        mono_gc_wbarrier_generic_store (ptr, value);
 }
 
+void
+ves_icall_System_Threading_Thread_VolatileWriteDouble (void *ptr, double value)
+{
+       *((volatile double *) ptr) = value;
+}
+
+void
+ves_icall_System_Threading_Thread_VolatileWriteFloat (void *ptr, float value)
+{
+       *((volatile float *) ptr) = value;
+}
+
 void mono_thread_init (MonoThreadStartCB start_cb,
                       MonoThreadAttachCB attach_cb)
 {
-       MONO_GC_REGISTER_ROOT_FIXED (small_id_table);
        InitializeCriticalSection(&threads_mutex);
        InitializeCriticalSection(&interlocked_mutex);
        InitializeCriticalSection(&contexts_mutex);
-       InitializeCriticalSection(&delayed_free_table_mutex);
-       InitializeCriticalSection(&small_id_mutex);
        
        background_change_event = CreateEvent (NULL, TRUE, FALSE, NULL);
        g_assert(background_change_event != NULL);
@@ -2624,14 +2486,12 @@ void mono_thread_init (MonoThreadStartCB start_cb,
        mono_init_static_data_info (&context_static_info);
 
        MONO_FAST_TLS_INIT (tls_current_object);
-       current_object_key=TlsAlloc();
+       mono_native_tls_alloc (&current_object_key, NULL);
        THREAD_DEBUG (g_message ("%s: Allocated current_object_key %d", __func__, current_object_key));
 
        mono_thread_start_cb = start_cb;
        mono_thread_attach_cb = attach_cb;
 
-       delayed_free_table = g_array_new (FALSE, FALSE, sizeof (DelayedFreeItem));
-
        /* Get a pseudo handle to the current process.  This is just a
         * kludge so that wapi can build a process handle if needed.
         * As a pseudo handle is returned, we don't need to clean
@@ -2642,8 +2502,6 @@ void mono_thread_init (MonoThreadStartCB start_cb,
 
 void mono_thread_cleanup (void)
 {
-       mono_thread_hazardous_try_free_all ();
-
 #if !defined(HOST_WIN32) && !defined(RUN_IN_SUBTHREAD)
        /* The main thread must abandon any held mutexes (particularly
         * important for named mutexes as they are shared across
@@ -2671,10 +2529,7 @@ void mono_thread_cleanup (void)
        CloseHandle (background_change_event);
 #endif
 
-       g_array_free (delayed_free_table, TRUE);
-       delayed_free_table = NULL;
-
-       TlsFree (current_object_key);
+       mono_native_tls_free (current_object_key);
 }
 
 void
@@ -3184,11 +3039,14 @@ void mono_thread_suspend_all_other_threads (void)
                        LeaveCriticalSection (thread->synch_cs);
 
                        /* Signal the thread to suspend */
-                       if (signal_suspend)
+                       if (mono_thread_info_new_interrupt_enabled ())
+                               suspend_thread_internal (thread, TRUE);
+                       else if (signal_suspend)
                                signal_thread_state_change (thread);
                }
 
-               if (eventidx > 0) {
+               /*Only wait on the suspend event if we are using the old path */
+               if (eventidx > 0 && !mono_thread_info_new_interrupt_enabled ()) {
                        WaitForMultipleObjectsEx (eventidx, events, TRUE, 100, FALSE);
                        for (i = 0; i < wait->num; ++i) {
                                MonoInternalThread *thread = wait->threads [i];
@@ -3205,7 +3063,9 @@ void mono_thread_suspend_all_other_threads (void)
                                }
                                LeaveCriticalSection (thread->synch_cs);
                        }
-               } else {
+               }
+               
+               if (eventidx <= 0) {
                        /* 
                         * If there are threads which are starting up, we wait until they
                         * are suspended when they try to register in the threads hash.
@@ -3247,6 +3107,109 @@ collect_threads (gpointer key, gpointer value, gpointer user_data)
        }
 }
 
+static gboolean thread_dump_requested;
+
+static G_GNUC_UNUSED gboolean
+print_stack_frame_to_string (MonoStackFrameInfo *frame, MonoContext *ctx, gpointer data)
+{
+       GString *p = (GString*)data;
+       MonoMethod *method = NULL;
+       if (frame->ji)
+               method = frame->ji->method;
+
+       if (method) {
+               gchar *location = mono_debug_print_stack_frame (method, frame->native_offset, frame->domain);
+               g_string_append_printf (p, "  %s\n", location);
+               g_free (location);
+       } else
+               g_string_append_printf (p, "  at <unknown> <0x%05x>\n", frame->native_offset);
+
+       return FALSE;
+}
+
+static void
+print_thread_dump (MonoInternalThread *thread, MonoThreadInfo *info)
+{
+       GString* text = g_string_new (0);
+       char *name;
+       GError *error = NULL;
+
+       if (thread->name) {
+               name = g_utf16_to_utf8 (thread->name, thread->name_len, NULL, NULL, &error);
+               g_assert (!error);
+               g_string_append_printf (text, "\n\"%s\"", name);
+               g_free (name);
+       }
+       else if (thread->threadpool_thread)
+               g_string_append (text, "\n\"<threadpool thread>\"");
+       else
+               g_string_append (text, "\n\"<unnamed thread>\"");
+
+#if 0
+/* This no longer works with remote unwinding */
+#ifndef HOST_WIN32
+       wapi_desc = wapi_current_thread_desc ();
+       g_string_append_printf (text, " tid=0x%p this=0x%p %s\n", (gpointer)(gsize)thread->tid, thread,  wapi_desc);
+       free (wapi_desc);
+#endif
+#endif
+
+       mono_get_eh_callbacks ()->mono_walk_stack_with_state (print_stack_frame_to_string, &info->suspend_state, MONO_UNWIND_SIGNAL_SAFE, text);
+       mono_thread_info_resume (mono_thread_info_get_tid (info));
+
+       fprintf (stdout, "%s", text->str);
+
+#if PLATFORM_WIN32 && TARGET_WIN32 && _DEBUG
+       OutputDebugStringA(text->str);
+#endif
+
+       g_string_free (text, TRUE);
+       fflush (stdout);
+}
+
+static void
+dump_thread (gpointer key, gpointer value, gpointer user)
+{
+       MonoInternalThread *thread = (MonoInternalThread *)value;
+       MonoThreadInfo *info;
+
+       if (thread == mono_thread_internal_current ())
+               return;
+
+       /*
+       FIXME This still can hang if we stop a thread during malloc.
+       FIXME This can hang if we suspend on a critical method and the GC kicks in. A fix might be to have function
+       that takes a callback and runs it with the target suspended.
+       We probably should loop a bit around trying to get it to either managed code
+       or WSJ state.
+       */
+       info = mono_thread_info_safe_suspend_sync ((MonoNativeThreadId)(gpointer)(gsize)thread->tid, FALSE);
+
+       if (!info)
+               return;
+
+       print_thread_dump (thread, info);
+}
+
+void
+mono_threads_perform_thread_dump (void)
+{
+       if (!thread_dump_requested)
+               return;
+
+       printf ("Full thread dump:\n");
+
+       /* 
+        * Make a copy of the hashtable since we can't do anything with
+        * threads while threads_mutex is held.
+        */
+       mono_threads_lock ();
+       mono_g_hash_table_foreach (threads, dump_thread, NULL);
+       mono_threads_unlock ();
+
+       thread_dump_requested = FALSE;
+}
+
 /**
  * mono_threads_request_thread_dump:
  *
@@ -3259,6 +3222,14 @@ mono_threads_request_thread_dump (void)
        struct wait_data *wait = &wait_data;
        int i;
 
+       /*The new thread dump code runs out of the finalizer thread. */
+       if (mono_thread_info_new_interrupt_enabled ()) {
+               thread_dump_requested = TRUE;
+               mono_gc_finalize_notify ();
+               return;
+       }
+
+
        memset (wait, 0, sizeof (struct wait_data));
 
        /* 
@@ -3284,6 +3255,75 @@ mono_threads_request_thread_dump (void)
        }
 }
 
+struct ref_stack {
+       gpointer *refs;
+       gint allocated; /* +1 so that refs [allocated] == NULL */
+       gint bottom;
+};
+
+typedef struct ref_stack RefStack;
+
+static RefStack *
+ref_stack_new (gint initial_size)
+{
+       RefStack *rs;
+
+       initial_size = MAX (initial_size, 16) + 1;
+       rs = g_new0 (RefStack, 1);
+       rs->refs = g_new0 (gpointer, initial_size);
+       rs->allocated = initial_size;
+       return rs;
+}
+
+static void
+ref_stack_destroy (gpointer ptr)
+{
+       RefStack *rs = ptr;
+
+       if (rs != NULL) {
+               g_free (rs->refs);
+               g_free (rs);
+       }
+}
+
+static void
+ref_stack_push (RefStack *rs, gpointer ptr)
+{
+       g_assert (rs != NULL);
+
+       if (rs->bottom >= rs->allocated) {
+               rs->refs = g_realloc (rs->refs, rs->allocated * 2 * sizeof (gpointer) + 1);
+               rs->allocated <<= 1;
+               rs->refs [rs->allocated] = NULL;
+       }
+       rs->refs [rs->bottom++] = ptr;
+}
+
+static void
+ref_stack_pop (RefStack *rs)
+{
+       if (rs == NULL || rs->bottom == 0)
+               return;
+
+       rs->bottom--;
+       rs->refs [rs->bottom] = NULL;
+}
+
+static gboolean
+ref_stack_find (RefStack *rs, gpointer ptr)
+{
+       gpointer *refs;
+
+       if (rs == NULL)
+               return FALSE;
+
+       for (refs = rs->refs; refs && *refs; refs++) {
+               if (*refs == ptr)
+                       return TRUE;
+       }
+       return FALSE;
+}
+
 /*
  * mono_thread_push_appdomain_ref:
  *
@@ -3299,7 +3339,9 @@ mono_thread_push_appdomain_ref (MonoDomain *domain)
        if (thread) {
                /* printf ("PUSH REF: %"G_GSIZE_FORMAT" -> %s.\n", (gsize)thread->tid, domain->friendly_name); */
                SPIN_LOCK (thread->lock_thread_id);
-               thread->appdomain_refs = g_slist_prepend (thread->appdomain_refs, domain);
+               if (thread->appdomain_refs == NULL)
+                       thread->appdomain_refs = ref_stack_new (16);
+               ref_stack_push (thread->appdomain_refs, domain);
                SPIN_UNLOCK (thread->lock_thread_id);
        }
 }
@@ -3311,10 +3353,8 @@ mono_thread_pop_appdomain_ref (void)
 
        if (thread) {
                /* printf ("POP REF: %"G_GSIZE_FORMAT" -> %s.\n", (gsize)thread->tid, ((MonoDomain*)(thread->appdomain_refs->data))->friendly_name); */
-               /* FIXME: How can the list be empty ? */
                SPIN_LOCK (thread->lock_thread_id);
-               if (thread->appdomain_refs)
-                       thread->appdomain_refs = g_slist_remove (thread->appdomain_refs, thread->appdomain_refs->data);
+               ref_stack_pop (thread->appdomain_refs);
                SPIN_UNLOCK (thread->lock_thread_id);
        }
 }
@@ -3324,7 +3364,7 @@ mono_thread_internal_has_appdomain_ref (MonoInternalThread *thread, MonoDomain *
 {
        gboolean res;
        SPIN_LOCK (thread->lock_thread_id);
-       res = g_slist_find (thread->appdomain_refs, domain) != NULL;
+       res = ref_stack_find (thread->appdomain_refs, domain);
        SPIN_UNLOCK (thread->lock_thread_id);
        return res;
 }
@@ -3487,7 +3527,6 @@ static const int static_data_size [NUM_STATIC_DATA_IDX] = {
 
 static uintptr_t* static_reference_bitmaps [NUM_STATIC_DATA_IDX];
 
-#ifdef HAVE_SGEN_GC
 static void
 mark_tls_slots (void *addr, MonoGCMarkFunc mark_func)
 {
@@ -3513,7 +3552,6 @@ mark_tls_slots (void *addr, MonoGCMarkFunc mark_func)
                }
        }
 }
-#endif
 
 /*
  *  mono_alloc_static_data
@@ -3529,10 +3567,8 @@ mono_alloc_static_data (gpointer **static_data_ptr, guint32 offset, gboolean thr
        gpointer* static_data = *static_data_ptr;
        if (!static_data) {
                static void* tls_desc = NULL;
-#ifdef HAVE_SGEN_GC
-               if (!tls_desc)
+               if (mono_gc_user_markers_supported () && !tls_desc)
                        tls_desc = mono_gc_make_root_descr_user (mark_tls_slots);
-#endif
                static_data = mono_gc_alloc_fixed (static_data_size [0], threadlocal?tls_desc:NULL);
                *static_data_ptr = static_data;
                static_data [0] = static_data;
@@ -3541,11 +3577,10 @@ mono_alloc_static_data (gpointer **static_data_ptr, guint32 offset, gboolean thr
        for (i = 1; i <= idx; ++i) {
                if (static_data [i])
                        continue;
-#ifdef HAVE_SGEN_GC
-               static_data [i] = threadlocal?g_malloc0 (static_data_size [i]):mono_gc_alloc_fixed (static_data_size [i], NULL);
-#else
-               static_data [i] = mono_gc_alloc_fixed (static_data_size [i], NULL);
-#endif
+               if (mono_gc_user_markers_supported () && threadlocal)
+                       static_data [i] = g_malloc0 (static_data_size [i]);
+               else
+                       static_data [i] = mono_gc_alloc_fixed (static_data_size [i], NULL);
        }
 }
 
@@ -3556,14 +3591,10 @@ mono_free_static_data (gpointer* static_data, gboolean threadlocal)
        for (i = 1; i < NUM_STATIC_DATA_IDX; ++i) {
                if (!static_data [i])
                        continue;
-#ifdef HAVE_SGEN_GC
-               if (threadlocal)
+               if (mono_gc_user_markers_supported () && threadlocal)
                        g_free (static_data [i]);
                else
                        mono_gc_free_fixed (static_data [i]);
-#else
-               mono_gc_free_fixed (static_data [i]);
-#endif
        }
        mono_gc_free_fixed (static_data);
 }
@@ -3776,7 +3807,7 @@ free_thread_static_data_helper (gpointer key, gpointer value, gpointer user)
        if (!thread->static_data || !thread->static_data [idx])
                return;
        ptr = ((char*) thread->static_data [idx]) + (data->offset & 0xffffff);
-       memset (ptr, 0, data->size);
+       mono_gc_bzero (ptr, data->size);
 }
 
 static void
@@ -3855,7 +3886,7 @@ mono_thread_alloc_tls (MonoReflectionType *type)
        /* TlsDatum is a struct, so we subtract the object header size offset */
        bitmap = mono_class_compute_bitmap (klass, default_bitmap, sizeof (default_bitmap) * 8, - (int)(sizeof (MonoObject) / sizeof (gpointer)), &max_set, FALSE);
        size = mono_type_size (type->type, &align);
-       tls_offset = mono_alloc_special_static_data (SPECIAL_STATIC_THREAD, size, align, bitmap, max_set);
+       tls_offset = mono_alloc_special_static_data (SPECIAL_STATIC_THREAD, size, align, (uintptr_t*)bitmap, max_set);
        if (bitmap != default_bitmap)
                g_free (bitmap);
        tlsrec = g_new0 (MonoTlsDataRecord, 1);
@@ -4015,39 +4046,7 @@ static MonoException* mono_thread_execute_interruption (MonoInternalThread *thre
                return thread->abort_exc;
        }
        else if ((thread->state & ThreadState_SuspendRequested) != 0) {
-               thread->state &= ~ThreadState_SuspendRequested;
-               thread->state |= ThreadState_Suspended;
-               thread->suspend_event = CreateEvent (NULL, TRUE, FALSE, NULL);
-               if (thread->suspend_event == NULL) {
-                       LeaveCriticalSection (thread->synch_cs);
-                       return(NULL);
-               }
-               if (thread->suspended_event)
-                       SetEvent (thread->suspended_event);
-
-               LeaveCriticalSection (thread->synch_cs);
-
-               if (shutting_down) {
-                       /* After we left the lock, the runtime might shut down so everything becomes invalid */
-                       for (;;)
-                               Sleep (1000);
-               }
-               
-               WaitForSingleObject (thread->suspend_event, INFINITE);
-               
-               EnterCriticalSection (thread->synch_cs);
-
-               CloseHandle (thread->suspend_event);
-               thread->suspend_event = NULL;
-               thread->state &= ~ThreadState_Suspended;
-       
-               /* The thread that requested the resume will have replaced this event
-                * and will be waiting for it
-                */
-               SetEvent (thread->resume_event);
-
-               LeaveCriticalSection (thread->synch_cs);
-               
+               self_suspend_internal (thread);         
                return NULL;
        }
        else if ((thread->state & ThreadState_StopRequested) != 0) {
@@ -4057,6 +4056,14 @@ static MonoException* mono_thread_execute_interruption (MonoInternalThread *thre
                
                mono_thread_exit ();
                return NULL;
+       } else if (thread->pending_exception) {
+               MonoException *exc;
+
+               exc = thread->pending_exception;
+               thread->pending_exception = NULL;
+
+        LeaveCriticalSection (thread->synch_cs);
+        return exc;
        } else if (thread->thread_interrupt_requested) {
 
                thread->thread_interrupt_requested = FALSE;
@@ -4096,13 +4103,13 @@ mono_thread_request_interruption (gboolean running_managed)
        
        if (InterlockedCompareExchange (&thread->interruption_requested, 1, 0) == 1)
                return NULL;
+       InterlockedIncrement (&thread_interruption_requested);
 
        if (!running_managed || is_running_protected_wrapper ()) {
                /* Can't stop while in unmanaged code. Increase the global interruption
                   request count. When exiting the unmanaged method the count will be
                   checked and the thread will be interrupted. */
                
-               InterlockedIncrement (&thread_interruption_requested);
 
                if (mono_thread_notify_pending_exc_fn && !running_managed)
                        /* The JIT will notify the thread about the interruption */
@@ -4226,12 +4233,8 @@ mono_thread_get_and_clear_pending_exception (void)
 /*
  * mono_set_pending_exception:
  *
- *   Set the pending exception of the current thread to EXC. On platforms which 
- * support it, the exception will be thrown when execution returns to managed code. 
- * On other platforms, this function is equivalent to mono_raise_exception (). 
- * Internal calls which report exceptions using this function instead of 
- * raise_exception () might be called by JITted code using a more efficient calling 
- * convention.
+ *   Set the pending exception of the current thread to EXC.
+ * The exception will be thrown when execution returns to managed code.
  */
 void
 mono_set_pending_exception (MonoException *exc)
@@ -4242,14 +4245,9 @@ mono_set_pending_exception (MonoException *exc)
        if (thread == NULL)
                return;
 
-       if (mono_thread_notify_pending_exc_fn) {
-               MONO_OBJECT_SETREF (thread, pending_exception, exc);
+       MONO_OBJECT_SETREF (thread, pending_exception, exc);
 
-               mono_thread_notify_pending_exc_fn ();
-       } else {
-               /* No way to notify the JIT about the exception, have to throw it now */
-               mono_raise_exception (exc);
-       }
+    mono_thread_request_interruption (FALSE);
 }
 
 /**
@@ -4336,26 +4334,27 @@ mono_thread_test_state (MonoInternalThread *thread, MonoThreadState test)
        return ret;
 }
 
-static MonoClassField *execution_context_field;
+//static MonoClassField *execution_context_field;
 
 static MonoObject**
 get_execution_context_addr (void)
 {
        MonoDomain *domain = mono_domain_get ();
-       guint32 offset;
+       guint32 offset = domain->execution_context_field_offset;
 
-       if (!execution_context_field) {
-               execution_context_field = mono_class_get_field_from_name (mono_defaults.thread_class,
-                               "_ec");
-               g_assert (execution_context_field);
-       }
+       if (!offset) {
+               MonoClassField *field = mono_class_get_field_from_name (mono_defaults.thread_class, "_ec");
+               g_assert (field);
 
-       g_assert (mono_class_try_get_vtable (domain, mono_defaults.appdomain_class));
+               g_assert (mono_class_try_get_vtable (domain, mono_defaults.appdomain_class));
 
-       mono_domain_lock (domain);
-       offset = GPOINTER_TO_UINT (g_hash_table_lookup (domain->special_static_fields, execution_context_field));
-       mono_domain_unlock (domain);
-       g_assert (offset);
+               mono_domain_lock (domain);
+               offset = GPOINTER_TO_UINT (g_hash_table_lookup (domain->special_static_fields, field));
+               mono_domain_unlock (domain);
+               g_assert (offset);
+
+               domain->execution_context_field_offset = offset;
+       }
 
        return (MonoObject**) mono_get_special_static_data (offset);
 }
@@ -4417,3 +4416,242 @@ mono_thread_kill (MonoInternalThread *thread, int signal)
 #  endif
 #endif
 }
+
+static void
+self_interrupt_thread (void *_unused)
+{
+       MonoThreadInfo *info = mono_thread_info_current ();
+       MonoException *exc = mono_thread_execute_interruption (mono_thread_internal_current ()); 
+       if (exc) /*We must use _with_context since we didn't trampoline into the runtime*/
+               mono_raise_exception_with_context (exc, &info->suspend_state.ctx);
+       g_assert_not_reached (); /*this MUST not happen since we can't resume from an async call*/
+}
+
+static gboolean
+mono_jit_info_match (MonoJitInfo *ji, gpointer ip)
+{
+       if (!ji)
+               return FALSE;
+       return ji->code_start <= ip && (char*)ip < (char*)ji->code_start + ji->code_size;
+}
+
+static gboolean
+last_managed (MonoStackFrameInfo *frame, MonoContext *ctx, gpointer data)
+{
+       MonoJitInfo **dest = data;
+       *dest = frame->ji;
+       return TRUE;
+}
+
+static MonoJitInfo*
+mono_thread_info_get_last_managed (MonoThreadInfo *info)
+{
+       MonoJitInfo *ji = NULL;
+       mono_get_eh_callbacks ()->mono_walk_stack_with_state (last_managed, &info->suspend_state, MONO_UNWIND_SIGNAL_SAFE, &ji);
+       return ji;
+}
+
+static void
+abort_thread_internal (MonoInternalThread *thread, gboolean can_raise_exception, gboolean install_async_abort)
+{
+       MonoJitInfo *ji;
+       MonoThreadInfo *info = NULL;
+       gboolean protected_wrapper;
+       gboolean running_managed;
+
+       if (!mono_thread_info_new_interrupt_enabled ()) {
+               signal_thread_state_change (thread);
+               return;
+       }
+
+       /*
+       FIXME this is insanely broken, it doesn't cause interruption to happen
+       synchronously since passing FALSE to mono_thread_request_interruption makes sure it returns NULL
+       */
+       if (thread == mono_thread_internal_current ()) {
+               /* Do it synchronously */
+               MonoException *exc = mono_thread_request_interruption (can_raise_exception); 
+               if (exc)
+                       mono_raise_exception (exc);
+#ifndef HOST_WIN32
+               wapi_interrupt_thread (thread->handle);
+#endif
+               return;
+       }
+
+       /*FIXME we need to check 2 conditions here, request to interrupt this thread or if the target died*/
+       if (!(info = mono_thread_info_safe_suspend_sync ((MonoNativeThreadId)(gsize)thread->tid, TRUE))) {
+               return;
+       }
+
+       if (mono_get_eh_callbacks ()->mono_install_handler_block_guard (&info->suspend_state)) {
+               mono_thread_info_resume (mono_thread_info_get_tid (info));
+               return;
+       }
+
+       /*someone is already interrupting it*/
+       if (InterlockedCompareExchange (&thread->interruption_requested, 1, 0) == 1) {
+               mono_thread_info_resume (mono_thread_info_get_tid (info));
+               return;
+       }
+       InterlockedIncrement (&thread_interruption_requested);
+
+       ji = mono_thread_info_get_last_managed (info);
+       protected_wrapper = ji && mono_threads_is_critical_method (ji->method);
+       running_managed = mono_jit_info_match (ji, MONO_CONTEXT_GET_IP (&info->suspend_state.ctx));
+
+       if (!protected_wrapper && running_managed) {
+               /*We are in managed code*/
+               /*Set the thread to call */
+               if (install_async_abort)
+                       mono_thread_info_setup_async_call (info, self_interrupt_thread, NULL);
+               mono_thread_info_resume (mono_thread_info_get_tid (info));
+       } else {
+               gpointer interrupt_handle;
+               /* 
+                * This will cause waits to be broken.
+                * It will also prevent the thread from entering a wait, so if the thread returns
+                * from the wait before it receives the abort signal, it will just spin in the wait
+                * functions in the io-layer until the signal handler calls QueueUserAPC which will
+                * make it return.
+                */
+#ifndef HOST_WIN32
+               interrupt_handle = wapi_prepare_interrupt_thread (thread->handle);
+#endif
+               mono_thread_info_resume (mono_thread_info_get_tid (info));
+#ifndef HOST_WIN32
+               wapi_finish_interrupt_thread (interrupt_handle);
+#endif
+       }
+       /*FIXME we need to wait for interruption to complete -- figure out how much into interruption we should wait for here*/
+}
+
+static void
+transition_to_suspended (MonoInternalThread *thread)
+{
+       if ((thread->state & ThreadState_SuspendRequested) == 0) {
+               g_assert (0); /*FIXME we should not reach this */
+               /*Make sure we balance the suspend count.*/
+               mono_thread_info_resume ((MonoNativeThreadId)(gpointer)(gsize)thread->tid);
+       } else {
+               thread->state &= ~ThreadState_SuspendRequested;
+               thread->state |= ThreadState_Suspended;
+       }
+       LeaveCriticalSection (thread->synch_cs);
+}
+
+static void
+suspend_thread_internal (MonoInternalThread *thread, gboolean interrupt)
+{
+       if (!mono_thread_info_new_interrupt_enabled ()) {
+               signal_thread_state_change (thread);
+               return;
+       }
+
+       EnterCriticalSection (thread->synch_cs);
+       if (thread == mono_thread_internal_current ()) {
+               transition_to_suspended (thread);
+               mono_thread_info_self_suspend ();
+       } else {
+               MonoThreadInfo *info = mono_thread_info_safe_suspend_sync ((MonoNativeThreadId)(gsize)thread->tid, interrupt);
+               MonoJitInfo *ji = mono_thread_info_get_last_managed (info);
+               gboolean protected_wrapper = ji && mono_threads_is_critical_method (ji->method);
+               gboolean running_managed = mono_jit_info_match (ji, MONO_CONTEXT_GET_IP (&info->suspend_state.ctx));
+
+               if (running_managed && !protected_wrapper) {
+                       transition_to_suspended (thread);
+               } else {
+                       gpointer interrupt_handle;
+
+                       if (InterlockedCompareExchange (&thread->interruption_requested, 1, 0) == 0)
+                               InterlockedIncrement (&thread_interruption_requested);
+#ifndef HOST_WIN32
+                       if (interrupt)
+                               interrupt_handle = wapi_prepare_interrupt_thread (thread->handle);
+#endif
+                       mono_thread_info_resume (mono_thread_info_get_tid (info));
+#ifndef HOST_WIN32
+                       if (interrupt)
+                               wapi_finish_interrupt_thread (interrupt_handle);
+#endif
+                       LeaveCriticalSection (thread->synch_cs);
+               }
+       }
+}
+
+/*This is called with @thread synch_cs held and it must release it*/
+static void
+self_suspend_internal (MonoInternalThread *thread)
+{
+       if (!mono_thread_info_new_interrupt_enabled ()) {
+               thread->state &= ~ThreadState_SuspendRequested;
+               thread->state |= ThreadState_Suspended;
+               thread->suspend_event = CreateEvent (NULL, TRUE, FALSE, NULL);
+               if (thread->suspend_event == NULL) {
+                       LeaveCriticalSection (thread->synch_cs);
+                       return;
+               }
+               if (thread->suspended_event)
+                       SetEvent (thread->suspended_event);
+
+               LeaveCriticalSection (thread->synch_cs);
+
+               if (shutting_down) {
+                       /* After we left the lock, the runtime might shut down so everything becomes invalid */
+                       for (;;)
+                               Sleep (1000);
+               }
+               
+               WaitForSingleObject (thread->suspend_event, INFINITE);
+               
+               EnterCriticalSection (thread->synch_cs);
+
+               CloseHandle (thread->suspend_event);
+               thread->suspend_event = NULL;
+               thread->state &= ~ThreadState_Suspended;
+       
+               /* The thread that requested the resume will have replaced this event
+                * and will be waiting for it
+                */
+               SetEvent (thread->resume_event);
+
+               LeaveCriticalSection (thread->synch_cs);
+               return;
+       }
+
+       transition_to_suspended (thread);
+       mono_thread_info_self_suspend ();
+}
+
+/*This is called with @thread synch_cs held and it must release it*/
+static gboolean
+resume_thread_internal (MonoInternalThread *thread)
+{
+       if (!mono_thread_info_new_interrupt_enabled ()) {
+               thread->resume_event = CreateEvent (NULL, TRUE, FALSE, NULL);
+               if (thread->resume_event == NULL) {
+                       LeaveCriticalSection (thread->synch_cs);
+                       return FALSE;
+               }
+
+               /* Awake the thread */
+               SetEvent (thread->suspend_event);
+
+               LeaveCriticalSection (thread->synch_cs);
+
+               /* Wait for the thread to awake */
+               WaitForSingleObject (thread->resume_event, INFINITE);
+               CloseHandle (thread->resume_event);
+               thread->resume_event = NULL;
+               return TRUE;
+       }
+
+       LeaveCriticalSection (thread->synch_cs);        
+       /* Awake the thread */
+       if (!mono_thread_info_resume ((MonoNativeThreadId)(gpointer)(gsize)thread->tid))
+               return FALSE;
+       EnterCriticalSection (thread->synch_cs);
+       thread->state &= ~ThreadState_Suspended;
+       LeaveCriticalSection (thread->synch_cs);
+       return TRUE;
+}