Sanitize sgen's collection trigger internal API.
[mono.git] / mono / metadata / threadpool.c
1 /*
2  * threadpool.c: global thread pool
3  *
4  * Authors:
5  *   Dietmar Maurer (dietmar@ximian.com)
6  *   Gonzalo Paniagua Javier (gonzalo@ximian.com)
7  *
8  * Copyright 2001-2003 Ximian, Inc (http://www.ximian.com)
9  * Copyright 2004-2010 Novell, Inc (http://www.novell.com)
10  * Copyright 2001 Xamarin Inc (http://www.xamarin.com)
11  */
12
13 #include <config.h>
14 #include <glib.h>
15
16 #include <mono/metadata/profiler-private.h>
17 #include <mono/metadata/threads.h>
18 #include <mono/metadata/threads-types.h>
19 #include <mono/metadata/threadpool-internals.h>
20 #include <mono/metadata/exception.h>
21 #include <mono/metadata/environment.h>
22 #include <mono/metadata/mono-mlist.h>
23 #include <mono/metadata/mono-perfcounters.h>
24 #include <mono/metadata/socket-io.h>
25 #include <mono/metadata/mono-cq.h>
26 #include <mono/metadata/mono-wsq.h>
27 #include <mono/metadata/mono-ptr-array.h>
28 #include <mono/io-layer/io-layer.h>
29 #include <mono/utils/mono-time.h>
30 #include <mono/utils/mono-proclib.h>
31 #include <mono/utils/mono-semaphore.h>
32 #include <errno.h>
33 #ifdef HAVE_SYS_TIME_H
34 #include <sys/time.h>
35 #endif
36 #include <sys/types.h>
37 #include <fcntl.h>
38 #ifdef HAVE_UNISTD_H
39 #include <unistd.h>
40 #endif
41 #include <string.h>
42 #ifdef HAVE_SYS_SOCKET_H
43 #include <sys/socket.h>
44 #endif
45 #include <mono/utils/mono-poll.h>
46 #ifdef HAVE_EPOLL
47 #include <sys/epoll.h>
48 #endif
49 #ifdef HAVE_KQUEUE
50 #include <sys/event.h>
51 #endif
52
53
54 #ifndef DISABLE_SOCKETS
55 #include "mono/io-layer/socket-wrappers.h"
56 #endif
57
58 #include "threadpool.h"
59
60 #define THREAD_WANTS_A_BREAK(t) ((t->state & (ThreadState_StopRequested | \
61                                                 ThreadState_SuspendRequested)) != 0)
62
63 #define SPIN_TRYLOCK(i) (InterlockedCompareExchange (&(i), 1, 0) == 0)
64 #define SPIN_LOCK(i) do { \
65                                 if (SPIN_TRYLOCK (i)) \
66                                         break; \
67                         } while (1)
68
69 #define SPIN_UNLOCK(i) i = 0
70 #define SMALL_STACK (128 * (sizeof (gpointer) / 4) * 1024)
71
72 /* DEBUG: prints tp data every 2s */
73 #undef DEBUG 
74
75 /* mono_thread_pool_init called */
76 static volatile int tp_inited;
77
78 enum {
79         POLL_BACKEND,
80         EPOLL_BACKEND,
81         KQUEUE_BACKEND
82 };
83
84 typedef struct {
85         CRITICAL_SECTION io_lock; /* access to sock_to_state */
86         int inited; // 0 -> not initialized , 1->initializing, 2->initialized, 3->cleaned up
87         MonoGHashTable *sock_to_state;
88
89         gint event_system;
90         gpointer event_data;
91         void (*modify) (gpointer event_data, int fd, int operation, int events, gboolean is_new);
92         void (*wait) (gpointer sock_data);
93         void (*shutdown) (gpointer event_data);
94 } SocketIOData;
95
96 static SocketIOData socket_io_data;
97
98 /* Keep in sync with the System.MonoAsyncCall class which provides GC tracking */
99 typedef struct {
100         MonoObject         object;
101         MonoMethodMessage *msg;
102         MonoMethod        *cb_method;
103         MonoDelegate      *cb_target;
104         MonoObject        *state;
105         MonoObject        *res;
106         MonoArray         *out_args;
107 } ASyncCall;
108
109 typedef struct {
110         MonoSemType lock;
111         MonoCQ *queue; /* GC root */
112         MonoSemType new_job;
113         volatile gint waiting; /* threads waiting for a work item */
114
115         /**/
116         volatile gint pool_status; /* 0 -> not initialized, 1 -> initialized, 2 -> cleaning up */
117         /* min, max, n and busy -> Interlocked */
118         volatile gint min_threads;
119         volatile gint max_threads;
120         volatile gint nthreads;
121         volatile gint busy_threads;
122
123         void (*async_invoke) (gpointer data);
124         void *pc_nitems; /* Performance counter for total number of items in added */
125         void *pc_nthreads; /* Performance counter for total number of active threads */
126         /**/
127         volatile gint destroy_thread;
128         volatile gint ignore_times; /* Used when there's a thread being created or destroyed */
129         volatile gint sp_lock; /* spin lock used to protect ignore_times */
130         volatile gint64 last_check;
131         volatile gint64 time_sum;
132         volatile gint n_sum;
133         gint64 averages [2];
134         gboolean is_io;
135 } ThreadPool;
136
137 static ThreadPool async_tp;
138 static ThreadPool async_io_tp;
139
140 static void async_invoke_thread (gpointer data);
141 static MonoObject *mono_async_invoke (ThreadPool *tp, MonoAsyncResult *ares);
142 static void threadpool_free_queue (ThreadPool *tp);
143 static void threadpool_append_job (ThreadPool *tp, MonoObject *ar);
144 static void threadpool_append_jobs (ThreadPool *tp, MonoObject **jobs, gint njobs);
145 static void threadpool_init (ThreadPool *tp, int min_threads, int max_threads, void (*async_invoke) (gpointer));
146 static void threadpool_start_idle_threads (ThreadPool *tp);
147 static void threadpool_kill_idle_threads (ThreadPool *tp);
148 static gboolean threadpool_start_thread (ThreadPool *tp);
149 static void monitor_thread (gpointer data);
150 static void socket_io_cleanup (SocketIOData *data);
151 static MonoObject *get_io_event (MonoMList **list, gint event);
152 static int get_events_from_list (MonoMList *list);
153 static int get_event_from_state (MonoSocketAsyncResult *state);
154
155 static MonoClass *async_call_klass;
156 static MonoClass *socket_async_call_klass;
157 static MonoClass *process_async_call_klass;
158
159 static GPtrArray *wsqs;
160 CRITICAL_SECTION wsqs_lock;
161
162 /* Hooks */
163 static MonoThreadPoolFunc tp_start_func;
164 static MonoThreadPoolFunc tp_finish_func;
165 static gpointer tp_hooks_user_data;
166 static MonoThreadPoolItemFunc tp_item_begin_func;
167 static MonoThreadPoolItemFunc tp_item_end_func;
168 static gpointer tp_item_user_data;
169
170 enum {
171         AIO_OP_FIRST,
172         AIO_OP_ACCEPT = 0,
173         AIO_OP_CONNECT,
174         AIO_OP_RECEIVE,
175         AIO_OP_RECEIVEFROM,
176         AIO_OP_SEND,
177         AIO_OP_SENDTO,
178         AIO_OP_RECV_JUST_CALLBACK,
179         AIO_OP_SEND_JUST_CALLBACK,
180         AIO_OP_READPIPE,
181         AIO_OP_CONSOLE2,
182         AIO_OP_DISCONNECT,
183         AIO_OP_ACCEPTRECEIVE,
184         AIO_OP_RECEIVE_BUFFERS,
185         AIO_OP_SEND_BUFFERS,
186         AIO_OP_LAST
187 };
188
189 #include <mono/metadata/tpool-poll.c>
190 #ifdef HAVE_EPOLL
191 #include <mono/metadata/tpool-epoll.c>
192 #elif defined(HAVE_KQUEUE)
193 #include <mono/metadata/tpool-kqueue.c>
194 #endif
195 /*
196  * Functions to check whenever a class is given system class. We need to cache things in MonoDomain since some of the
197  * assemblies can be unloaded.
198  */
199
200 static gboolean
201 is_system_type (MonoDomain *domain, MonoClass *klass)
202 {
203         if (domain->system_image == NULL)
204                 domain->system_image = mono_image_loaded ("System");
205
206         return klass->image == domain->system_image;
207 }
208
209 static gboolean
210 is_corlib_type (MonoDomain *domain, MonoClass *klass)
211 {
212         return klass->image == mono_defaults.corlib;
213 }
214
215 /*
216  * Note that we call it is_socket_type() where 'socket' refers to the image
217  * that contains the System.Net.Sockets.Socket type.
218  * For moonlight there is a System.Net.Sockets.Socket class in both System.dll and System.Net.dll.
219 */
220 static gboolean
221 is_socket_type (MonoDomain *domain, MonoClass *klass)
222 {
223         static const char *version = NULL;
224         static gboolean moonlight;
225
226         if (is_system_type (domain, klass))
227                 return TRUE;
228
229         /* If moonlight, check if the type is in System.Net.dll too */
230         if (version == NULL) {
231                 version = mono_get_runtime_info ()->framework_version;
232                 moonlight = !strcmp (version, "2.1");
233         }
234
235         if (!moonlight)
236                 return FALSE;
237
238         if (domain->system_net_dll == NULL)
239                 domain->system_net_dll = mono_image_loaded ("System.Net");
240         
241         return klass->image == domain->system_net_dll;
242 }
243
244 #define check_type_cached(domain, ASSEMBLY, _class, _namespace, _name, loc) do { \
245         if (*loc) \
246                 return *loc == _class; \
247         if (is_##ASSEMBLY##_type (domain, _class) && !strcmp (_name, _class->name) && !strcmp (_namespace, _class->name_space)) { \
248                 *loc = _class; \
249                 return TRUE; \
250         } \
251         return FALSE; \
252 } while (0) \
253
254 #define check_corlib_type_cached(domain, _class, _namespace, _name, loc) check_type_cached (domain, corlib, _class, _namespace, _name, loc)
255
256 #define check_socket_type_cached(domain, _class, _namespace, _name, loc) check_type_cached (domain, socket, _class, _namespace, _name, loc)
257
258 #define check_system_type_cached(domain, _class, _namespace, _name, loc) check_type_cached (domain, system, _class, _namespace, _name, loc)
259
260 static gboolean
261 is_corlib_asyncresult (MonoDomain *domain, MonoClass *klass)
262 {
263         check_corlib_type_cached (domain, klass, "System.Runtime.Remoting.Messaging", "AsyncResult", &domain->corlib_asyncresult_class);
264 }
265
266 static gboolean
267 is_socket (MonoDomain *domain, MonoClass *klass)
268 {
269         check_socket_type_cached (domain, klass, "System.Net.Sockets", "Socket", &domain->socket_class);
270 }
271
272 static gboolean
273 is_socketasyncresult (MonoDomain *domain, MonoClass *klass)
274 {
275         return (klass->nested_in &&
276                         is_socket (domain, klass->nested_in) &&
277                         !strcmp (klass->name, "SocketAsyncResult"));
278 }
279
280 static gboolean
281 is_socketasynccall (MonoDomain *domain, MonoClass *klass)
282 {
283         return (klass->nested_in &&
284                         is_socket (domain, klass->nested_in) &&
285                         !strcmp (klass->name, "SocketAsyncCall"));
286 }
287
288 static gboolean
289 is_appdomainunloaded_exception (MonoDomain *domain, MonoClass *klass)
290 {
291         check_corlib_type_cached (domain, klass, "System", "AppDomainUnloadedException", &domain->ad_unloaded_ex_class);
292 }
293
294 static gboolean
295 is_sd_process (MonoDomain *domain, MonoClass *klass)
296 {
297         check_system_type_cached (domain, klass, "System.Diagnostics", "Process", &domain->process_class);
298 }
299
300 static gboolean
301 is_sdp_asyncreadhandler (MonoDomain *domain, MonoClass *klass)
302 {
303
304         return (klass->nested_in &&
305                         is_sd_process (domain, klass->nested_in) &&
306                 !strcmp (klass->name, "AsyncReadHandler"));
307 }
308
309
310 #ifdef DISABLE_SOCKETS
311
312 #define socket_io_cleanup(x)
313
314 static int
315 get_event_from_state (MonoSocketAsyncResult *state)
316 {
317         g_assert_not_reached ();
318         return -1;
319 }
320
321 static int
322 get_events_from_list (MonoMList *list)
323 {
324         return 0;
325 }
326
327 #else
328
329 static void
330 socket_io_cleanup (SocketIOData *data)
331 {
332         EnterCriticalSection (&data->io_lock);
333         if (data->inited != 2) {
334                 LeaveCriticalSection (&data->io_lock);
335                 return;
336         }
337         data->inited = 3;
338         data->shutdown (data->event_data);
339         LeaveCriticalSection (&data->io_lock);
340 }
341
342 static int
343 get_event_from_state (MonoSocketAsyncResult *state)
344 {
345         switch (state->operation) {
346         case AIO_OP_ACCEPT:
347         case AIO_OP_RECEIVE:
348         case AIO_OP_RECV_JUST_CALLBACK:
349         case AIO_OP_RECEIVEFROM:
350         case AIO_OP_READPIPE:
351         case AIO_OP_ACCEPTRECEIVE:
352         case AIO_OP_RECEIVE_BUFFERS:
353                 return MONO_POLLIN;
354         case AIO_OP_SEND:
355         case AIO_OP_SEND_JUST_CALLBACK:
356         case AIO_OP_SENDTO:
357         case AIO_OP_CONNECT:
358         case AIO_OP_SEND_BUFFERS:
359         case AIO_OP_DISCONNECT:
360                 return MONO_POLLOUT;
361         default: /* Should never happen */
362                 g_message ("get_event_from_state: unknown value in switch!!!");
363                 return 0;
364         }
365 }
366
367 static int
368 get_events_from_list (MonoMList *list)
369 {
370         MonoSocketAsyncResult *state;
371         int events = 0;
372
373         while (list && (state = (MonoSocketAsyncResult *)mono_mlist_get_data (list))) {
374                 events |= get_event_from_state (state);
375                 list = mono_mlist_next (list);
376         }
377
378         return events;
379 }
380
381 #define ICALL_RECV(x)   ves_icall_System_Net_Sockets_Socket_Receive_internal (\
382                                 (SOCKET)(gssize)x->handle, x->buffer, x->offset, x->size,\
383                                  x->socket_flags, &x->error);
384
385 #define ICALL_SEND(x)   ves_icall_System_Net_Sockets_Socket_Send_internal (\
386                                 (SOCKET)(gssize)x->handle, x->buffer, x->offset, x->size,\
387                                  x->socket_flags, &x->error);
388
389 #endif /* !DISABLE_SOCKETS */
390
391 static void
392 threadpool_jobs_inc (MonoObject *obj)
393 {
394         if (obj)
395                 InterlockedIncrement (&obj->vtable->domain->threadpool_jobs);
396 }
397
398 static gboolean
399 threadpool_jobs_dec (MonoObject *obj)
400 {
401         MonoDomain *domain;
402         int remaining_jobs;
403
404         if (obj == NULL)
405                 return FALSE;
406
407         domain = obj->vtable->domain;
408         remaining_jobs = InterlockedDecrement (&domain->threadpool_jobs);
409         if (remaining_jobs == 0 && domain->cleanup_semaphore) {
410                 ReleaseSemaphore (domain->cleanup_semaphore, 1, NULL);
411                 return TRUE;
412         }
413         return FALSE;
414 }
415
416 static MonoObject *
417 get_io_event (MonoMList **list, gint event)
418 {
419         MonoObject *state;
420         MonoMList *current;
421         MonoMList *prev;
422
423         current = *list;
424         prev = NULL;
425         state = NULL;
426         while (current) {
427                 state = mono_mlist_get_data (current);
428                 if (get_event_from_state ((MonoSocketAsyncResult *) state) == event)
429                         break;
430
431                 state = NULL;
432                 prev = current;
433                 current = mono_mlist_next (current);
434         }
435
436         if (current) {
437                 if (prev) {
438                         mono_mlist_set_next (prev, mono_mlist_next (current));
439                 } else {
440                         *list = mono_mlist_next (*list);
441                 }
442         }
443
444         return state;
445 }
446
447 /*
448  * select/poll wake up when a socket is closed, but epoll just removes
449  * the socket from its internal list without notification.
450  */
451 void
452 mono_thread_pool_remove_socket (int sock)
453 {
454         MonoMList *list;
455         MonoSocketAsyncResult *state;
456         MonoObject *ares;
457
458         if (socket_io_data.inited == 0)
459                 return;
460
461         EnterCriticalSection (&socket_io_data.io_lock);
462         if (socket_io_data.sock_to_state == NULL) {
463                 LeaveCriticalSection (&socket_io_data.io_lock);
464                 return;
465         }
466         list = mono_g_hash_table_lookup (socket_io_data.sock_to_state, GINT_TO_POINTER (sock));
467         if (list)
468                 mono_g_hash_table_remove (socket_io_data.sock_to_state, GINT_TO_POINTER (sock));
469         LeaveCriticalSection (&socket_io_data.io_lock);
470         
471         while (list) {
472                 state = (MonoSocketAsyncResult *) mono_mlist_get_data (list);
473                 if (state->operation == AIO_OP_RECEIVE)
474                         state->operation = AIO_OP_RECV_JUST_CALLBACK;
475                 else if (state->operation == AIO_OP_SEND)
476                         state->operation = AIO_OP_SEND_JUST_CALLBACK;
477
478                 ares = get_io_event (&list, MONO_POLLIN);
479                 threadpool_append_job (&async_io_tp, ares);
480                 if (list) {
481                         ares = get_io_event (&list, MONO_POLLOUT);
482                         threadpool_append_job (&async_io_tp, ares);
483                 }
484         }
485 }
486
487 static void
488 init_event_system (SocketIOData *data)
489 {
490 #ifdef HAVE_EPOLL
491         if (data->event_system == EPOLL_BACKEND) {
492                 data->event_data = tp_epoll_init (data);
493                 if (data->event_data == NULL) {
494                         if (g_getenv ("MONO_DEBUG"))
495                                 g_message ("Falling back to poll()");
496                         data->event_system = POLL_BACKEND;
497                 }
498         }
499 #elif defined(HAVE_KQUEUE)
500         if (data->event_system == KQUEUE_BACKEND)
501                 data->event_data = tp_kqueue_init (data);
502 #endif
503         if (data->event_system == POLL_BACKEND)
504                 data->event_data = tp_poll_init (data);
505 }
506
507 static void
508 socket_io_init (SocketIOData *data)
509 {
510         int inited;
511
512         if (data->inited >= 2) // 2 -> initialized, 3-> cleaned up
513                 return;
514
515         inited = InterlockedCompareExchange (&data->inited, 1, 0);
516         if (inited >= 1) {
517                 while (TRUE) {
518                         if (data->inited >= 2)
519                                 return;
520                         SleepEx (1, FALSE);
521                 }
522         }
523
524         EnterCriticalSection (&data->io_lock);
525         data->sock_to_state = mono_g_hash_table_new_type (g_direct_hash, g_direct_equal, MONO_HASH_VALUE_GC);
526 #ifdef HAVE_EPOLL
527         data->event_system = EPOLL_BACKEND;
528 #elif defined(HAVE_KQUEUE)
529         data->event_system = KQUEUE_BACKEND;
530 #else
531         data->event_system = POLL_BACKEND;
532 #endif
533         if (g_getenv ("MONO_DISABLE_AIO") != NULL)
534                 data->event_system = POLL_BACKEND;
535
536         init_event_system (data);
537         mono_thread_create_internal (mono_get_root_domain (), data->wait, data, TRUE, SMALL_STACK);
538         LeaveCriticalSection (&data->io_lock);
539         data->inited = 2;
540         threadpool_start_thread (&async_io_tp);
541 }
542
543 static void
544 socket_io_add (MonoAsyncResult *ares, MonoSocketAsyncResult *state)
545 {
546         MonoMList *list;
547         SocketIOData *data = &socket_io_data;
548         int fd;
549         gboolean is_new;
550         int ievt;
551
552         socket_io_init (&socket_io_data);
553         if (mono_runtime_is_shutting_down () || data->inited == 3 || data->sock_to_state == NULL)
554                 return;
555         if (async_tp.pool_status == 2)
556                 return;
557
558         MONO_OBJECT_SETREF (state, ares, ares);
559
560         fd = GPOINTER_TO_INT (state->handle);
561         EnterCriticalSection (&data->io_lock);
562         if (data->sock_to_state == NULL) {
563                 LeaveCriticalSection (&data->io_lock);
564                 return;
565         }
566         list = mono_g_hash_table_lookup (data->sock_to_state, GINT_TO_POINTER (fd));
567         if (list == NULL) {
568                 list = mono_mlist_alloc ((MonoObject*)state);
569                 is_new = TRUE;
570         } else {
571                 list = mono_mlist_append (list, (MonoObject*)state);
572                 is_new = FALSE;
573         }
574
575         mono_g_hash_table_replace (data->sock_to_state, state->handle, list);
576         ievt = get_events_from_list (list);
577         LeaveCriticalSection (&data->io_lock);
578         data->modify (data->event_data, fd, state->operation, ievt, is_new);
579 }
580
581 #ifndef DISABLE_SOCKETS
582 static gboolean
583 socket_io_filter (MonoObject *target, MonoObject *state)
584 {
585         gint op;
586         MonoSocketAsyncResult *sock_res;
587         MonoClass *klass;
588         MonoDomain *domain;
589
590         if (target == NULL || state == NULL)
591                 return FALSE;
592
593         domain = target->vtable->domain;
594         klass = target->vtable->klass;
595         if (socket_async_call_klass == NULL && is_socketasynccall (domain, klass))
596                 socket_async_call_klass = klass;
597
598         if (process_async_call_klass == NULL && is_sdp_asyncreadhandler (domain, klass))
599                 process_async_call_klass = klass;
600
601         if (klass != socket_async_call_klass && klass != process_async_call_klass)
602                 return FALSE;
603
604         sock_res = (MonoSocketAsyncResult *) state;
605         op = sock_res->operation;
606         if (op < AIO_OP_FIRST || op >= AIO_OP_LAST)
607                 return FALSE;
608
609         return TRUE;
610 }
611 #endif /* !DISABLE_SOCKETS */
612
613 /* Returns the exception thrown when invoking, if any */
614 static MonoObject *
615 mono_async_invoke (ThreadPool *tp, MonoAsyncResult *ares)
616 {
617         ASyncCall *ac = (ASyncCall *)ares->object_data;
618         MonoObject *res, *exc = NULL;
619         MonoArray *out_args = NULL;
620         HANDLE wait_event = NULL;
621
622         if (ares->execution_context) {
623                 /* use captured ExecutionContext (if available) */
624                 MONO_OBJECT_SETREF (ares, original_context, mono_thread_get_execution_context ());
625                 mono_thread_set_execution_context (ares->execution_context);
626         } else {
627                 ares->original_context = NULL;
628         }
629
630         if (ac == NULL) {
631                 /* Fast path from ThreadPool.*QueueUserWorkItem */
632                 void *pa = ares->async_state;
633                 res = mono_runtime_delegate_invoke (ares->async_delegate, &pa, &exc);
634         } else {
635                 MonoObject *cb_exc = NULL;
636
637                 ac->msg->exc = NULL;
638                 res = mono_message_invoke (ares->async_delegate, ac->msg, &exc, &out_args);
639                 MONO_OBJECT_SETREF (ac, res, res);
640                 MONO_OBJECT_SETREF (ac, msg->exc, exc);
641                 MONO_OBJECT_SETREF (ac, out_args, out_args);
642
643                 mono_monitor_enter ((MonoObject *) ares);
644                 ares->completed = 1;
645                 if (ares->handle != NULL)
646                         wait_event = mono_wait_handle_get_handle ((MonoWaitHandle *) ares->handle);
647                 mono_monitor_exit ((MonoObject *) ares);
648                 /* notify listeners */
649                 if (wait_event != NULL)
650                         SetEvent (wait_event);
651
652                 /* call async callback if cb_method != null*/
653                 if (ac != NULL && ac->cb_method) {
654                         void *pa = &ares;
655                         cb_exc = NULL;
656                         mono_runtime_invoke (ac->cb_method, ac->cb_target, pa, &cb_exc);
657                         exc = cb_exc;
658                 } else {
659                         exc = NULL;
660                 }
661         }
662
663         /* restore original thread execution context if flow isn't suppressed, i.e. non null */
664         if (ares->original_context) {
665                 mono_thread_set_execution_context (ares->original_context);
666                 ares->original_context = NULL;
667         }
668         return exc;
669 }
670
671 static void
672 threadpool_start_idle_threads (ThreadPool *tp)
673 {
674         int n;
675         guint32 stack_size;
676
677         stack_size = (!tp->is_io) ? 0 : SMALL_STACK;
678         do {
679                 while (1) {
680                         n = tp->nthreads;
681                         if (n >= tp->min_threads)
682                                 return;
683                         if (InterlockedCompareExchange (&tp->nthreads, n + 1, n) == n)
684                                 break;
685                 }
686                 mono_perfcounter_update_value (tp->pc_nthreads, TRUE, 1);
687                 mono_thread_create_internal (mono_get_root_domain (), tp->async_invoke, tp, TRUE, stack_size);
688                 SleepEx (100, TRUE);
689         } while (1);
690 }
691
692 static void
693 threadpool_init (ThreadPool *tp, int min_threads, int max_threads, void (*async_invoke) (gpointer))
694 {
695         memset (tp, 0, sizeof (ThreadPool));
696         tp->min_threads = min_threads;
697         tp->max_threads = max_threads;
698         tp->async_invoke = async_invoke;
699         tp->queue = mono_cq_create ();
700         MONO_SEM_INIT (&tp->new_job, 0);
701 }
702
703 static void *
704 init_perf_counter (const char *category, const char *counter)
705 {
706         MonoString *category_str;
707         MonoString *counter_str;
708         MonoString *machine;
709         MonoDomain *root;
710         MonoBoolean custom;
711         int type;
712
713         if (category == NULL || counter == NULL)
714                 return NULL;
715         root = mono_get_root_domain ();
716         category_str = mono_string_new (root, category);
717         counter_str = mono_string_new (root, counter);
718         machine = mono_string_new (root, ".");
719         return mono_perfcounter_get_impl (category_str, counter_str, NULL, machine, &type, &custom);
720 }
721
722 #ifdef DEBUG
723 static void
724 print_pool_info (ThreadPool *tp)
725 {
726
727 //      if (tp->tail - tp->head == 0)
728 //              return;
729
730         g_print ("Pool status? %d\n", InterlockedCompareExchange (&tp->pool_status, 0, 0));
731         g_print ("Min. threads: %d\n", InterlockedCompareExchange (&tp->min_threads, 0, 0));
732         g_print ("Max. threads: %d\n", InterlockedCompareExchange (&tp->max_threads, 0, 0));
733         g_print ("nthreads: %d\n", InterlockedCompareExchange (&tp->nthreads, 0, 0));
734         g_print ("busy threads: %d\n", InterlockedCompareExchange (&tp->busy_threads, 0, 0));
735         g_print ("Waiting: %d\n", InterlockedCompareExchange (&tp->waiting, 0, 0));
736         g_print ("Queued: %d\n", (tp->tail - tp->head));
737         if (tp == &async_tp) {
738                 int i;
739                 EnterCriticalSection (&wsqs_lock);
740                 for (i = 0; i < wsqs->len; i++) {
741                         g_print ("\tWSQ %d: %d\n", i, mono_wsq_count (g_ptr_array_index (wsqs, i)));
742                 }
743                 LeaveCriticalSection (&wsqs_lock);
744         } else {
745                 g_print ("\tSockets: %d\n", mono_g_hash_table_size (socket_io_data.sock_to_state));
746         }
747         g_print ("-------------\n");
748 }
749
750 static void
751 signal_handler (int signo)
752 {
753         ThreadPool *tp;
754
755         tp = &async_tp;
756         g_print ("\n-----Non-IO-----\n");
757         print_pool_info (tp);
758         tp = &async_io_tp;
759         g_print ("\n-----IO-----\n");
760         print_pool_info (tp);
761         alarm (2);
762 }
763 #endif
764
765 static void
766 monitor_thread (gpointer unused)
767 {
768         ThreadPool *pools [2];
769         MonoInternalThread *thread;
770         guint32 ms;
771         gboolean need_one;
772         int i;
773
774         pools [0] = &async_tp;
775         pools [1] = &async_io_tp;
776         thread = mono_thread_internal_current ();
777         ves_icall_System_Threading_Thread_SetName_internal (thread, mono_string_new (mono_domain_get (), "Threadpool monitor"));
778         while (1) {
779                 ms = 500;
780                 do {
781                         guint32 ts;
782                         ts = mono_msec_ticks ();
783                         if (SleepEx (ms, TRUE) == 0)
784                                 break;
785                         ms -= (mono_msec_ticks () - ts);
786                         if (mono_runtime_is_shutting_down ())
787                                 break;
788                         if (THREAD_WANTS_A_BREAK (thread))
789                                 mono_thread_interruption_checkpoint ();
790                 } while (ms > 0);
791
792                 if (mono_runtime_is_shutting_down ())
793                         break;
794
795                 for (i = 0; i < 2; i++) {
796                         ThreadPool *tp;
797                         tp = pools [i];
798                         if (tp->waiting > 0)
799                                 continue;
800                         need_one = (mono_cq_count (tp->queue) > 0);
801                         if (!need_one && !tp->is_io) {
802                                 EnterCriticalSection (&wsqs_lock);
803                                 for (i = 0; wsqs != NULL && i < wsqs->len; i++) {
804                                         MonoWSQ *wsq;
805                                         wsq = g_ptr_array_index (wsqs, i);
806                                         if (mono_wsq_count (wsq) != 0) {
807                                                 need_one = TRUE;
808                                                 break;
809                                         }
810                                 }
811                                 LeaveCriticalSection (&wsqs_lock);
812                         }
813                         if (need_one)
814                                 threadpool_start_thread (tp);
815                 }
816         }
817 }
818
819 void
820 mono_thread_pool_init ()
821 {
822         gint threads_per_cpu = 1;
823         gint thread_count;
824         gint cpu_count = mono_cpu_count ();
825         int result;
826
827         if (tp_inited == 2)
828                 return;
829
830         result = InterlockedCompareExchange (&tp_inited, 1, 0);
831         if (result == 1) {
832                 while (1) {
833                         SleepEx (1, FALSE);
834                         if (tp_inited == 2)
835                                 return;
836                 }
837         }
838
839         MONO_GC_REGISTER_ROOT_FIXED (socket_io_data.sock_to_state);
840         InitializeCriticalSection (&socket_io_data.io_lock);
841         if (g_getenv ("MONO_THREADS_PER_CPU") != NULL) {
842                 threads_per_cpu = atoi (g_getenv ("MONO_THREADS_PER_CPU"));
843                 if (threads_per_cpu < 1)
844                         threads_per_cpu = 1;
845         }
846
847         thread_count = MIN (cpu_count * threads_per_cpu, 100 * cpu_count);
848         threadpool_init (&async_tp, thread_count, MAX (100 * cpu_count, thread_count), async_invoke_thread);
849         threadpool_init (&async_io_tp, cpu_count * 2, cpu_count * 4, async_invoke_thread);
850         async_io_tp.is_io = TRUE;
851
852         async_call_klass = mono_class_from_name (mono_defaults.corlib, "System", "MonoAsyncCall");
853         g_assert (async_call_klass);
854
855         InitializeCriticalSection (&wsqs_lock);
856         wsqs = g_ptr_array_sized_new (MAX (100 * cpu_count, thread_count));
857         mono_wsq_init ();
858
859         async_tp.pc_nitems = init_perf_counter ("Mono Threadpool", "Work Items Added");
860         g_assert (async_tp.pc_nitems);
861
862         async_io_tp.pc_nitems = init_perf_counter ("Mono Threadpool", "IO Work Items Added");
863         g_assert (async_io_tp.pc_nitems);
864
865         async_tp.pc_nthreads = init_perf_counter ("Mono Threadpool", "# of Threads");
866         g_assert (async_tp.pc_nthreads);
867
868         async_io_tp.pc_nthreads = init_perf_counter ("Mono Threadpool", "# of IO Threads");
869         g_assert (async_io_tp.pc_nthreads);
870         tp_inited = 2;
871 #ifdef DEBUG
872         signal (SIGALRM, signal_handler);
873         alarm (2);
874 #endif
875 }
876
877 static MonoAsyncResult *
878 create_simple_asyncresult (MonoObject *target, MonoObject *state)
879 {
880         MonoDomain *domain = mono_domain_get ();
881         MonoAsyncResult *ares;
882
883         /* Don't call mono_async_result_new() to avoid capturing the context */
884         ares = (MonoAsyncResult *) mono_object_new (domain, mono_defaults.asyncresult_class);
885         MONO_OBJECT_SETREF (ares, async_delegate, target);
886         MONO_OBJECT_SETREF (ares, async_state, state);
887         return ares;
888 }
889
890 void
891 icall_append_io_job (MonoObject *target, MonoSocketAsyncResult *state)
892 {
893         MonoAsyncResult *ares;
894
895         ares = create_simple_asyncresult (target, (MonoObject *) state);
896         socket_io_add (ares, state);
897 }
898
899 MonoAsyncResult *
900 mono_thread_pool_add (MonoObject *target, MonoMethodMessage *msg, MonoDelegate *async_callback,
901                       MonoObject *state)
902 {
903         MonoDomain *domain = mono_domain_get ();
904         MonoAsyncResult *ares;
905         ASyncCall *ac;
906
907         ac = (ASyncCall*)mono_object_new (domain, async_call_klass);
908         MONO_OBJECT_SETREF (ac, msg, msg);
909         MONO_OBJECT_SETREF (ac, state, state);
910
911         if (async_callback) {
912                 ac->cb_method = mono_get_delegate_invoke (((MonoObject *)async_callback)->vtable->klass);
913                 MONO_OBJECT_SETREF (ac, cb_target, async_callback);
914         }
915
916         ares = mono_async_result_new (domain, NULL, ac->state, NULL, (MonoObject*)ac);
917         MONO_OBJECT_SETREF (ares, async_delegate, target);
918
919 #ifndef DISABLE_SOCKETS
920         if (socket_io_filter (target, state)) {
921                 socket_io_add (ares, (MonoSocketAsyncResult *) state);
922                 return ares;
923         }
924 #endif
925         threadpool_append_job (&async_tp, (MonoObject *) ares);
926         return ares;
927 }
928
929 MonoObject *
930 mono_thread_pool_finish (MonoAsyncResult *ares, MonoArray **out_args, MonoObject **exc)
931 {
932         ASyncCall *ac;
933         HANDLE wait_event;
934
935         *exc = NULL;
936         *out_args = NULL;
937
938         /* check if already finished */
939         mono_monitor_enter ((MonoObject *) ares);
940         
941         if (ares->endinvoke_called) {
942                 *exc = (MonoObject *) mono_get_exception_invalid_operation (NULL);
943                 mono_monitor_exit ((MonoObject *) ares);
944                 return NULL;
945         }
946
947         ares->endinvoke_called = 1;
948         /* wait until we are really finished */
949         if (!ares->completed) {
950                 if (ares->handle == NULL) {
951                         wait_event = CreateEvent (NULL, TRUE, FALSE, NULL);
952                         g_assert(wait_event != 0);
953                         MONO_OBJECT_SETREF (ares, handle, (MonoObject *) mono_wait_handle_new (mono_object_domain (ares), wait_event));
954                 } else {
955                         wait_event = mono_wait_handle_get_handle ((MonoWaitHandle *) ares->handle);
956                 }
957                 mono_monitor_exit ((MonoObject *) ares);
958                 WaitForSingleObjectEx (wait_event, INFINITE, TRUE);
959         } else {
960                 mono_monitor_exit ((MonoObject *) ares);
961         }
962
963         ac = (ASyncCall *) ares->object_data;
964         g_assert (ac != NULL);
965         *exc = ac->msg->exc; /* FIXME: GC add write barrier */
966         *out_args = ac->out_args;
967
968         return ac->res;
969 }
970
971 static void
972 threadpool_kill_idle_threads (ThreadPool *tp)
973 {
974         gint n;
975
976         n = (gint) InterlockedCompareExchange (&tp->max_threads, 0, -1);
977         while (n) {
978                 n--;
979                 MONO_SEM_POST (&tp->new_job);
980         }
981 }
982
983 void
984 mono_thread_pool_cleanup (void)
985 {
986         if (InterlockedExchange (&async_io_tp.pool_status, 2) == 1) {
987                 socket_io_cleanup (&socket_io_data); /* Empty when DISABLE_SOCKETS is defined */
988                 threadpool_kill_idle_threads (&async_io_tp);
989         }
990
991         if (async_io_tp.queue != NULL) {
992                 MONO_SEM_DESTROY (&async_io_tp.new_job);
993                 threadpool_free_queue (&async_io_tp);
994         }
995
996
997         if (InterlockedExchange (&async_tp.pool_status, 2) == 1) {
998                 threadpool_kill_idle_threads (&async_tp);
999                 threadpool_free_queue (&async_tp);
1000         }
1001
1002         if (wsqs) {
1003                 EnterCriticalSection (&wsqs_lock);
1004                 mono_wsq_cleanup ();
1005                 if (wsqs)
1006                         g_ptr_array_free (wsqs, TRUE);
1007                 wsqs = NULL;
1008                 LeaveCriticalSection (&wsqs_lock);
1009                 MONO_SEM_DESTROY (&async_tp.new_job);
1010         }
1011 }
1012
1013 static gboolean
1014 threadpool_start_thread (ThreadPool *tp)
1015 {
1016         gint n;
1017         guint32 stack_size;
1018
1019         stack_size = (!tp->is_io) ? 0 : SMALL_STACK;
1020         while (!mono_runtime_is_shutting_down () && (n = tp->nthreads) < tp->max_threads) {
1021                 if (InterlockedCompareExchange (&tp->nthreads, n + 1, n) == n) {
1022                         mono_perfcounter_update_value (tp->pc_nthreads, TRUE, 1);
1023                         mono_thread_create_internal (mono_get_root_domain (), tp->async_invoke, tp, TRUE, stack_size);
1024                         return TRUE;
1025                 }
1026         }
1027
1028         return FALSE;
1029 }
1030
1031 static void
1032 pulse_on_new_job (ThreadPool *tp)
1033 {
1034         if (tp->waiting)
1035                 MONO_SEM_POST (&tp->new_job);
1036 }
1037
1038 void
1039 icall_append_job (MonoObject *ar)
1040 {
1041         threadpool_append_jobs (&async_tp, &ar, 1);
1042 }
1043
1044 static void
1045 threadpool_append_job (ThreadPool *tp, MonoObject *ar)
1046 {
1047         threadpool_append_jobs (tp, &ar, 1);
1048 }
1049
1050 static void
1051 threadpool_append_jobs (ThreadPool *tp, MonoObject **jobs, gint njobs)
1052 {
1053         static int job_counter;
1054         MonoObject *ar;
1055         gint i;
1056
1057         if (mono_runtime_is_shutting_down ())
1058                 return;
1059
1060         if (tp->pool_status == 0 && InterlockedCompareExchange (&tp->pool_status, 1, 0) == 0) {
1061                 if (!tp->is_io) {
1062                         mono_thread_create_internal (mono_get_root_domain (), monitor_thread, NULL, TRUE, SMALL_STACK);
1063                         threadpool_start_thread (tp);
1064                 }
1065                 /* Create on demand up to min_threads to avoid startup penalty for apps that don't use
1066                  * the threadpool that much
1067                 * mono_thread_create_internal (mono_get_root_domain (), threadpool_start_idle_threads, tp, TRUE, SMALL_STACK);
1068                 */
1069         }
1070
1071         for (i = 0; i < njobs; i++) {
1072                 ar = jobs [i];
1073                 if (ar == NULL || mono_domain_is_unloading (ar->vtable->domain))
1074                         continue; /* Might happen when cleaning domain jobs */
1075                 if (!tp->is_io && (InterlockedIncrement (&job_counter) % 10) == 0) {
1076                         MonoAsyncResult *o = (MonoAsyncResult *) ar;
1077                         o->add_time = mono_100ns_ticks ();
1078                 }
1079                 threadpool_jobs_inc (ar); 
1080                 mono_perfcounter_update_value (tp->pc_nitems, TRUE, 1);
1081                 if (!tp->is_io && mono_wsq_local_push (ar))
1082                         continue;
1083
1084                 mono_cq_enqueue (tp->queue, ar);
1085         }
1086
1087         for (i = 0; tp->waiting > 0 && i < MIN(njobs, tp->max_threads); i++)
1088                 pulse_on_new_job (tp);
1089 }
1090
1091 static void
1092 threadpool_clear_queue (ThreadPool *tp, MonoDomain *domain)
1093 {
1094         MonoObject *obj;
1095         MonoMList *other;
1096
1097         other = NULL;
1098         while (mono_cq_dequeue (tp->queue, &obj)) {
1099                 if (obj == NULL)
1100                         continue;
1101                 if (obj->vtable->domain != domain)
1102                         other = mono_mlist_prepend (other, obj);
1103                 threadpool_jobs_dec (obj);
1104         }
1105
1106         while (other) {
1107                 threadpool_append_job (tp, (MonoObject *) mono_mlist_get_data (other));
1108                 other = mono_mlist_next (other);
1109         }
1110 }
1111
1112 /*
1113  * Clean up the threadpool of all domain jobs.
1114  * Can only be called as part of the domain unloading process as
1115  * it will wait for all jobs to be visible to the interruption code. 
1116  */
1117 gboolean
1118 mono_thread_pool_remove_domain_jobs (MonoDomain *domain, int timeout)
1119 {
1120         HANDLE sem_handle;
1121         int result = TRUE;
1122         guint32 start_time = 0;
1123
1124         g_assert (domain->state == MONO_APPDOMAIN_UNLOADING);
1125
1126         threadpool_clear_queue (&async_tp, domain);
1127         threadpool_clear_queue (&async_io_tp, domain);
1128
1129         /*
1130          * There might be some threads out that could be about to execute stuff from the given domain.
1131          * We avoid that by setting up a semaphore to be pulsed by the thread that reaches zero.
1132          */
1133         sem_handle = CreateSemaphore (NULL, 0, 1, NULL);
1134
1135         domain->cleanup_semaphore = sem_handle;
1136         /*
1137          * The memory barrier here is required to have global ordering between assigning to cleanup_semaphone
1138          * and reading threadpool_jobs.
1139          * Otherwise this thread could read a stale version of threadpool_jobs and wait forever.
1140          */
1141         mono_memory_write_barrier ();
1142
1143         if (domain->threadpool_jobs && timeout != -1)
1144                 start_time = mono_msec_ticks ();
1145         while (domain->threadpool_jobs) {
1146                 WaitForSingleObject (sem_handle, timeout);
1147                 if (timeout != -1 && (mono_msec_ticks () - start_time) > timeout) {
1148                         result = FALSE;
1149                         break;
1150                 }
1151         }
1152
1153         domain->cleanup_semaphore = NULL;
1154         CloseHandle (sem_handle);
1155         return result;
1156 }
1157
1158 static void
1159 threadpool_free_queue (ThreadPool *tp)
1160 {
1161         mono_cq_destroy (tp->queue);
1162         tp->queue = NULL;
1163 }
1164
1165 gboolean
1166 mono_thread_pool_is_queue_array (MonoArray *o)
1167 {
1168         // gpointer obj = o;
1169
1170         // FIXME: need some fix in sgen code.
1171         return FALSE;
1172 }
1173
1174 static MonoWSQ *
1175 add_wsq (void)
1176 {
1177         int i;
1178         MonoWSQ *wsq;
1179
1180         EnterCriticalSection (&wsqs_lock);
1181         wsq = mono_wsq_create ();
1182         if (wsqs == NULL) {
1183                 LeaveCriticalSection (&wsqs_lock);
1184                 return NULL;
1185         }
1186         for (i = 0; i < wsqs->len; i++) {
1187                 if (g_ptr_array_index (wsqs, i) == NULL) {
1188                         wsqs->pdata [i] = wsq;
1189                         LeaveCriticalSection (&wsqs_lock);
1190                         return wsq;
1191                 }
1192         }
1193         g_ptr_array_add (wsqs, wsq);
1194         LeaveCriticalSection (&wsqs_lock);
1195         return wsq;
1196 }
1197
1198 static void
1199 remove_wsq (MonoWSQ *wsq)
1200 {
1201         gpointer data;
1202
1203         if (wsq == NULL)
1204                 return;
1205
1206         EnterCriticalSection (&wsqs_lock);
1207         if (wsqs == NULL) {
1208                 LeaveCriticalSection (&wsqs_lock);
1209                 return;
1210         }
1211         g_ptr_array_remove_fast (wsqs, wsq);
1212         data = NULL;
1213         /*
1214          * Only clean this up when shutting down, any other case will error out
1215          * if we're removing a queue that still has work items.
1216          */
1217         if (mono_runtime_is_shutting_down ()) {
1218                 while (mono_wsq_local_pop (&data)) {
1219                         threadpool_jobs_dec (data);
1220                         data = NULL;
1221                 }
1222         }
1223         mono_wsq_destroy (wsq);
1224         LeaveCriticalSection (&wsqs_lock);
1225 }
1226
1227 static void
1228 try_steal (MonoWSQ *local_wsq, gpointer *data, gboolean retry)
1229 {
1230         int i;
1231         int ms;
1232
1233         if (wsqs == NULL || data == NULL || *data != NULL)
1234                 return;
1235
1236         ms = 0;
1237         do {
1238                 if (mono_runtime_is_shutting_down ())
1239                         return;
1240
1241                 EnterCriticalSection (&wsqs_lock);
1242                 for (i = 0; wsqs != NULL && i < wsqs->len; i++) {
1243                         MonoWSQ *wsq;
1244
1245                         wsq = wsqs->pdata [i];
1246                         if (wsq == local_wsq || mono_wsq_count (wsq) == 0)
1247                                 continue;
1248                         mono_wsq_try_steal (wsqs->pdata [i], data, ms);
1249                         if (*data != NULL) {
1250                                 LeaveCriticalSection (&wsqs_lock);
1251                                 return;
1252                         }
1253                 }
1254                 LeaveCriticalSection (&wsqs_lock);
1255                 ms += 10;
1256         } while (retry && ms < 11);
1257 }
1258
1259 static gboolean
1260 dequeue_or_steal (ThreadPool *tp, gpointer *data, MonoWSQ *local_wsq)
1261 {
1262         if (mono_runtime_is_shutting_down ())
1263                 return FALSE;
1264         mono_cq_dequeue (tp->queue, (MonoObject **) data);
1265         if (!tp->is_io && !*data)
1266                 try_steal (local_wsq, data, FALSE);
1267         return (*data != NULL);
1268 }
1269
1270 static void
1271 process_idle_times (ThreadPool *tp, gint64 t)
1272 {
1273         gint64 ticks;
1274         gint64 avg;
1275         gboolean compute_avg;
1276         gint new_threads;
1277         gint64 per1;
1278
1279         if (tp->ignore_times || t <= 0)
1280                 return;
1281
1282         compute_avg = FALSE;
1283         ticks = mono_100ns_ticks ();
1284         t = ticks - t;
1285         SPIN_LOCK (tp->sp_lock);
1286         if (tp->ignore_times) {
1287                 SPIN_UNLOCK (tp->sp_lock);
1288                 return;
1289         }
1290         tp->time_sum += t;
1291         tp->n_sum++;
1292         if (tp->last_check == 0)
1293                 tp->last_check = ticks;
1294         else if (tp->last_check > 0 && (ticks - tp->last_check) > 5000000) {
1295                 tp->ignore_times = 1;
1296                 compute_avg = TRUE;
1297         }
1298         SPIN_UNLOCK (tp->sp_lock);
1299
1300         if (!compute_avg)
1301                 return;
1302
1303         //printf ("Items: %d Time elapsed: %.3fs\n", tp->n_sum, (ticks - tp->last_check) / 10000.0);
1304         tp->last_check = ticks;
1305         new_threads = 0;
1306         avg = tp->time_sum / tp->n_sum;
1307         if (tp->averages [1] == 0) {
1308                 tp->averages [1] = avg;
1309         } else {
1310                 per1 = ((100 * (ABS (avg - tp->averages [1]))) / tp->averages [1]);
1311                 if (per1 > 5) {
1312                         if (avg > tp->averages [1]) {
1313                                 if (tp->averages [1] < tp->averages [0]) {
1314                                         new_threads = -1;
1315                                 } else {
1316                                         new_threads = 1;
1317                                 }
1318                         } else if (avg < tp->averages [1] && tp->averages [1] < tp->averages [0]) {
1319                                 new_threads = 1;
1320                         }
1321                 } else {
1322                         int min, n;
1323                         min = tp->min_threads;
1324                         n = tp->nthreads;
1325                         if ((n - min) < min && tp->busy_threads == n)
1326                                 new_threads = 1;
1327                 }
1328                 /*
1329                 if (new_threads != 0) {
1330                         printf ("n: %d per1: %lld avg=%lld avg1=%lld avg0=%lld\n", new_threads, per1, avg, tp->averages [1], tp->averages [0]);
1331                 }
1332                 */
1333         }
1334
1335         tp->time_sum = 0;
1336         tp->n_sum = 0;
1337
1338         tp->averages [0] = tp->averages [1];
1339         tp->averages [1] = avg;
1340         tp->ignore_times = 0;
1341
1342         if (new_threads == -1) {
1343                 if (tp->destroy_thread == 0 && InterlockedCompareExchange (&tp->destroy_thread, 1, 0) == 0)
1344                         pulse_on_new_job (tp);
1345         }
1346 }
1347
1348 static gboolean
1349 should_i_die (ThreadPool *tp)
1350 {
1351         gboolean result = FALSE;
1352         if (tp->destroy_thread == 1 && InterlockedCompareExchange (&tp->destroy_thread, 0, 1) == 1)
1353                 result = (tp->nthreads > tp->min_threads);
1354         return result;
1355 }
1356
1357 static void
1358 async_invoke_thread (gpointer data)
1359 {
1360         MonoDomain *domain;
1361         MonoInternalThread *thread;
1362         MonoWSQ *wsq;
1363         ThreadPool *tp;
1364         gboolean must_die;
1365         const gchar *name;
1366   
1367         tp = data;
1368         wsq = NULL;
1369         if (!tp->is_io)
1370                 wsq = add_wsq ();
1371
1372         thread = mono_thread_internal_current ();
1373
1374         mono_profiler_thread_start (thread->tid);
1375         name = (tp->is_io) ? "IO Threadpool worker" : "Threadpool worker";
1376         mono_thread_set_name_internal (thread, mono_string_new (mono_domain_get (), name), FALSE);
1377
1378         if (tp_start_func)
1379                 tp_start_func (tp_hooks_user_data);
1380
1381         data = NULL;
1382         for (;;) {
1383                 MonoAsyncResult *ar;
1384                 MonoClass *klass;
1385                 gboolean is_io_task;
1386                 gboolean is_socket;
1387                 int n_naps = 0;
1388
1389                 is_io_task = FALSE;
1390                 ar = (MonoAsyncResult *) data;
1391                 if (ar) {
1392                         InterlockedIncrement (&tp->busy_threads);
1393                         domain = ((MonoObject *)ar)->vtable->domain;
1394 #ifndef DISABLE_SOCKETS
1395                         klass = ((MonoObject *) data)->vtable->klass;
1396                         is_io_task = !is_corlib_asyncresult (domain, klass);
1397                         is_socket = FALSE;
1398                         if (is_io_task) {
1399                                 MonoSocketAsyncResult *state = (MonoSocketAsyncResult *) data;
1400                                 is_socket = is_socketasyncresult (domain, klass);
1401                                 ar = state->ares;
1402                                 switch (state->operation) {
1403                                 case AIO_OP_RECEIVE:
1404                                         state->total = ICALL_RECV (state);
1405                                         break;
1406                                 case AIO_OP_SEND:
1407                                         state->total = ICALL_SEND (state);
1408                                         break;
1409                                 }
1410                         }
1411 #endif
1412                         /* worker threads invokes methods in different domains,
1413                          * so we need to set the right domain here */
1414                         g_assert (domain);
1415
1416                         if (mono_domain_is_unloading (domain) || mono_runtime_is_shutting_down ()) {
1417                                 threadpool_jobs_dec ((MonoObject *)ar);
1418                                 data = NULL;
1419                                 ar = NULL;
1420                                 InterlockedDecrement (&tp->busy_threads);
1421                         } else {
1422                                 mono_thread_push_appdomain_ref (domain);
1423                                 if (threadpool_jobs_dec ((MonoObject *)ar)) {
1424                                         data = NULL;
1425                                         ar = NULL;
1426                                         mono_thread_pop_appdomain_ref ();
1427                                         InterlockedDecrement (&tp->busy_threads);
1428                                         continue;
1429                                 }
1430
1431                                 if (mono_domain_set (domain, FALSE)) {
1432                                         MonoObject *exc;
1433
1434                                         if (tp_item_begin_func)
1435                                                 tp_item_begin_func (tp_item_user_data);
1436
1437                                         if (!is_io_task && ar->add_time > 0)
1438                                                 process_idle_times (tp, ar->add_time);
1439                                         exc = mono_async_invoke (tp, ar);
1440                                         if (tp_item_end_func)
1441                                                 tp_item_end_func (tp_item_user_data);
1442                                         if (exc)
1443                                                 mono_internal_thread_unhandled_exception (exc);
1444                                         if (is_socket && tp->is_io) {
1445                                                 MonoSocketAsyncResult *state = (MonoSocketAsyncResult *) data;
1446
1447                                                 if (state->completed && state->callback) {
1448                                                         MonoAsyncResult *cb_ares;
1449                                                         cb_ares = create_simple_asyncresult ((MonoObject *) state->callback,
1450                                                                                                 (MonoObject *) state);
1451                                                         icall_append_job ((MonoObject *) cb_ares);
1452                                                 }
1453                                         }
1454                                         mono_domain_set (mono_get_root_domain (), TRUE);
1455                                 }
1456                                 mono_thread_pop_appdomain_ref ();
1457                                 InterlockedDecrement (&tp->busy_threads);
1458                                 /* If the callee changes the background status, set it back to TRUE */
1459                                 mono_thread_clr_state (thread , ~ThreadState_Background);
1460                                 if (!mono_thread_test_state (thread , ThreadState_Background))
1461                                         ves_icall_System_Threading_Thread_SetState (thread, ThreadState_Background);
1462                         }
1463                 }
1464
1465                 ar = NULL;
1466                 data = NULL;
1467                 must_die = should_i_die (tp);
1468                 if (!must_die && (tp->is_io || !mono_wsq_local_pop (&data)))
1469                         dequeue_or_steal (tp, &data, wsq);
1470
1471                 n_naps = 0;
1472                 while (!must_die && !data && n_naps < 4) {
1473                         gboolean res;
1474
1475                         InterlockedIncrement (&tp->waiting);
1476
1477                         // Another thread may have added a job into its wsq since the last call to dequeue_or_steal
1478                         // Check all the queues again before entering the wait loop
1479                         dequeue_or_steal (tp, &data, wsq);
1480                         if (data) {
1481                                 InterlockedDecrement (&tp->waiting);
1482                                 break;
1483                         }
1484
1485                         mono_gc_set_skip_thread (TRUE);
1486
1487 #if defined(__OpenBSD__)
1488                         while (mono_cq_count (tp->queue) == 0 && (res = mono_sem_wait (&tp->new_job, TRUE)) == -1) {// && errno == EINTR) {
1489 #else
1490                         while (mono_cq_count (tp->queue) == 0 && (res = mono_sem_timedwait (&tp->new_job, 2000, TRUE)) == -1) {// && errno == EINTR) {
1491 #endif
1492                                 if (mono_runtime_is_shutting_down ())
1493                                         break;
1494                                 if (THREAD_WANTS_A_BREAK (thread))
1495                                         mono_thread_interruption_checkpoint ();
1496                         }
1497                         InterlockedDecrement (&tp->waiting);
1498
1499                         mono_gc_set_skip_thread (FALSE);
1500
1501                         if (mono_runtime_is_shutting_down ())
1502                                 break;
1503                         must_die = should_i_die (tp);
1504                         dequeue_or_steal (tp, &data, wsq);
1505                         n_naps++;
1506                 }
1507
1508                 if (!data && !tp->is_io && !mono_runtime_is_shutting_down ()) {
1509                         mono_wsq_local_pop (&data);
1510                         if (data && must_die) {
1511                                 InterlockedCompareExchange (&tp->destroy_thread, 1, 0);
1512                                 pulse_on_new_job (tp);
1513                         }
1514                 }
1515
1516                 if (!data) {
1517                         gint nt;
1518                         gboolean down;
1519                         while (1) {
1520                                 nt = tp->nthreads;
1521                                 down = mono_runtime_is_shutting_down ();
1522                                 if (!down && nt <= tp->min_threads)
1523                                         break;
1524                                 if (down || InterlockedCompareExchange (&tp->nthreads, nt - 1, nt) == nt) {
1525                                         mono_perfcounter_update_value (tp->pc_nthreads, TRUE, -1);
1526                                         if (!tp->is_io) {
1527                                                 remove_wsq (wsq);
1528                                         }
1529
1530                                         mono_profiler_thread_end (thread->tid);
1531
1532                                         if (tp_finish_func)
1533                                                 tp_finish_func (tp_hooks_user_data);
1534                                         return;
1535                                 }
1536                         }
1537                 }
1538         }
1539
1540         g_assert_not_reached ();
1541 }
1542
1543 void
1544 ves_icall_System_Threading_ThreadPool_GetAvailableThreads (gint *workerThreads, gint *completionPortThreads)
1545 {
1546         *workerThreads = async_tp.max_threads - async_tp.busy_threads;
1547         *completionPortThreads = async_io_tp.max_threads - async_io_tp.busy_threads;
1548 }
1549
1550 void
1551 ves_icall_System_Threading_ThreadPool_GetMaxThreads (gint *workerThreads, gint *completionPortThreads)
1552 {
1553         *workerThreads = async_tp.max_threads;
1554         *completionPortThreads = async_io_tp.max_threads;
1555 }
1556
1557 void
1558 ves_icall_System_Threading_ThreadPool_GetMinThreads (gint *workerThreads, gint *completionPortThreads)
1559 {
1560         *workerThreads = async_tp.min_threads;
1561         *completionPortThreads = async_io_tp.min_threads;
1562 }
1563
1564 MonoBoolean
1565 ves_icall_System_Threading_ThreadPool_SetMinThreads (gint workerThreads, gint completionPortThreads)
1566 {
1567         gint max_threads;
1568         gint max_io_threads;
1569
1570         max_threads = async_tp.max_threads;
1571         if (workerThreads <= 0 || workerThreads > max_threads)
1572                 return FALSE;
1573
1574         max_io_threads = async_io_tp.max_threads;
1575         if (completionPortThreads <= 0 || completionPortThreads > max_io_threads)
1576                 return FALSE;
1577
1578         InterlockedExchange (&async_tp.min_threads, workerThreads);
1579         InterlockedExchange (&async_io_tp.min_threads, completionPortThreads);
1580         if (workerThreads > async_tp.nthreads)
1581                 mono_thread_create_internal (mono_get_root_domain (), threadpool_start_idle_threads, &async_tp, TRUE, SMALL_STACK);
1582         if (completionPortThreads > async_io_tp.nthreads)
1583                 mono_thread_create_internal (mono_get_root_domain (), threadpool_start_idle_threads, &async_io_tp, TRUE, SMALL_STACK);
1584         return TRUE;
1585 }
1586
1587 MonoBoolean
1588 ves_icall_System_Threading_ThreadPool_SetMaxThreads (gint workerThreads, gint completionPortThreads)
1589 {
1590         gint min_threads;
1591         gint min_io_threads;
1592         gint cpu_count;
1593
1594         cpu_count = mono_cpu_count ();
1595         min_threads = async_tp.min_threads;
1596         if (workerThreads < min_threads || workerThreads < cpu_count)
1597                 return FALSE;
1598
1599         /* We don't really have the concept of completion ports. Do we care here? */
1600         min_io_threads = async_io_tp.min_threads;
1601         if (completionPortThreads < min_io_threads || completionPortThreads < cpu_count)
1602                 return FALSE;
1603
1604         InterlockedExchange (&async_tp.max_threads, workerThreads);
1605         InterlockedExchange (&async_io_tp.max_threads, completionPortThreads);
1606         return TRUE;
1607 }
1608
1609 /**
1610  * mono_install_threadpool_thread_hooks
1611  * @start_func: the function to be called right after a new threadpool thread is created. Can be NULL.
1612  * @finish_func: the function to be called right before a thredpool thread is exiting. Can be NULL.
1613  * @user_data: argument passed to @start_func and @finish_func.
1614  *
1615  * @start_fun will be called right after a threadpool thread is created and @finish_func right before a threadpool thread exits.
1616  * The calls will be made from the thread itself.
1617  */
1618 void
1619 mono_install_threadpool_thread_hooks (MonoThreadPoolFunc start_func, MonoThreadPoolFunc finish_func, gpointer user_data)
1620 {
1621         tp_start_func = start_func;
1622         tp_finish_func = finish_func;
1623         tp_hooks_user_data = user_data;
1624 }
1625
1626 /**
1627  * mono_install_threadpool_item_hooks
1628  * @begin_func: the function to be called before a threadpool work item processing starts.
1629  * @end_func: the function to be called after a threadpool work item is finished.
1630  * @user_data: argument passed to @begin_func and @end_func.
1631  *
1632  * The calls will be made from the thread itself and from the same AppDomain
1633  * where the work item was executed.
1634  *
1635  */
1636 void
1637 mono_install_threadpool_item_hooks (MonoThreadPoolItemFunc begin_func, MonoThreadPoolItemFunc end_func, gpointer user_data)
1638 {
1639         tp_item_begin_func = begin_func;
1640         tp_item_end_func = end_func;
1641         tp_item_user_data = user_data;
1642 }
1643
1644 void
1645 mono_internal_thread_unhandled_exception (MonoObject* exc)
1646 {
1647         if (mono_runtime_unhandled_exception_policy_get () == MONO_UNHANDLED_POLICY_CURRENT) {
1648                 gboolean unloaded;
1649                 MonoClass *klass;
1650
1651                 klass = exc->vtable->klass;
1652                 unloaded = is_appdomainunloaded_exception (exc->vtable->domain, klass);
1653                 if (!unloaded && klass != mono_defaults.threadabortexception_class) {
1654                         mono_unhandled_exception (exc);
1655                         if (mono_environment_exitcode_get () == 1)
1656                                 exit (255);
1657                 }
1658                 if (klass == mono_defaults.threadabortexception_class)
1659                  mono_thread_internal_reset_abort (mono_thread_internal_current ());
1660         }
1661 }