2006-08-17 Zoltan Varga <vargaz@gmail.com>
[mono.git] / mono / metadata / profiler.c
index e31492883f046dd4166a2bfd90a30a75906c197b..d9bda6f7292079a556dde092e97cb71635fdcb61 100644 (file)
@@ -1,11 +1,29 @@
+/*
+ * profiler.c: Profiler interface for Mono
+ *
+ * Author:
+ *   Paolo Molaro (lupus@ximian.com)
+ *
+ * (C) 2001-2003 Ximian, Inc.
+ * (C) 2003-2006 Novell, Inc.
+ */
 
+#include "config.h"
 #include "mono/metadata/profiler-private.h"
 #include "mono/metadata/debug-helpers.h"
 #include "mono/metadata/mono-debug.h"
+#include "mono/metadata/debug-mono-symfile.h"
+#include "mono/metadata/metadata-internals.h"
 #include "mono/metadata/class-internals.h"
+#include "mono/metadata/domain-internals.h"
+#include "mono/metadata/gc-internal.h"
 #include "mono/io-layer/io-layer.h"
 #include <string.h>
+#include <sys/time.h>
 #include <gmodule.h>
+#ifdef HAVE_BACKTRACE_SYMBOLS
+#include <execinfo.h>
+#endif
 
 static MonoProfiler * current_profiler = NULL;
 
@@ -31,8 +49,10 @@ static MonoProfileClassFunc   class_end_unload;
 
 static MonoProfileMethodFunc   jit_start;
 static MonoProfileMethodResult jit_end;
+static MonoProfileJitResult    jit_end2;
 static MonoProfileMethodResult man_unman_transition;
 static MonoProfileAllocFunc    allocation_cb;
+static MonoProfileStatFunc     statistical_cb;
 static MonoProfileMethodFunc   method_enter;
 static MonoProfileMethodFunc   method_leave;
 
@@ -43,11 +63,27 @@ static MonoProfileCoverageFilterFunc coverage_filter_cb;
 
 static MonoProfileFunc shutdown_callback;
 
+static MonoProfileGCFunc        gc_event;
+static MonoProfileGCResizeFunc  gc_heap_resize;
+
+#define mono_profiler_coverage_lock() EnterCriticalSection (&profiler_coverage_mutex)
+#define mono_profiler_coverage_unlock() LeaveCriticalSection (&profiler_coverage_mutex)
 static CRITICAL_SECTION profiler_coverage_mutex;
 
 /* this is directly accessible to other mono libs. */
 MonoProfileFlags mono_profiler_events;
 
+/**
+ * mono_profiler_install:
+ * @prof: a MonoProfiler structure pointer, or a pointer to a derived structure.
+ * @callback: the function to invoke at shutdown
+ *
+ * Use mono_profiler_install to activate profiling in the Mono runtime.
+ * Typically developers of new profilers will create a new structure whose
+ * first field is a MonoProfiler and put any extra information that they need
+ * to access from the various profiling callbacks there.
+ *
+ */
 void
 mono_profiler_install (MonoProfiler *prof, MonoProfileFunc callback)
 {
@@ -58,18 +94,46 @@ mono_profiler_install (MonoProfiler *prof, MonoProfileFunc callback)
        InitializeCriticalSection (&profiler_coverage_mutex);
 }
 
+/**
+ * mono_profiler_set_events:
+ * @events: an ORed set of values made up of MONO_PROFILER_ flags
+ *
+ * The events descriped in the @events argument is a set of flags
+ * that represent which profiling events must be triggered.  For
+ * example if you have registered a set of methods for tracking
+ * JIT compilation start and end with mono_profiler_install_jit_compile,
+ * you will want to pass the MONO_PROFILE_JIT_COMPILATION flag to
+ * this routine.
+ *
+ * You can call mono_profile_set_events more than once and you can
+ * do this at runtime to modify which methods are invoked.
+ */
 void
 mono_profiler_set_events (MonoProfileFlags events)
 {
        mono_profiler_events = events;
 }
 
+/**
+ * mono_profiler_get_events:
+ *
+ * Returns a list of active events that will be intercepted. 
+ */
 MonoProfileFlags
 mono_profiler_get_events (void)
 {
        return mono_profiler_events;
 }
 
+/**
+ * mono_profiler_install_enter_leave:
+ * @enter: the routine to be called on each method entry
+ * @fleave: the routine to be called each time a method returns
+ *
+ * Use this routine to install routines that will be called everytime
+ * a method enters and leaves.   The routines will receive as an argument
+ * the MonoMethod representing the method that is entering or leaving.
+ */
 void
 mono_profiler_install_enter_leave (MonoProfileMethodFunc enter, MonoProfileMethodFunc fleave)
 {
@@ -77,6 +141,14 @@ mono_profiler_install_enter_leave (MonoProfileMethodFunc enter, MonoProfileMetho
        method_leave = fleave;
 }
 
+/**
+ * mono_profiler_install_jit_compile:
+ * @start: the routine to be called when the JIT process starts.
+ * @end: the routine to be called when the JIT process ends.
+ *
+ * Use this routine to install routines that will be called when JIT 
+ * compilation of a method starts and completes.
+ */
 void 
 mono_profiler_install_jit_compile (MonoProfileMethodFunc start, MonoProfileMethodResult end)
 {
@@ -84,6 +156,12 @@ mono_profiler_install_jit_compile (MonoProfileMethodFunc start, MonoProfileMetho
        jit_end = end;
 }
 
+void 
+mono_profiler_install_jit_end (MonoProfileJitResult end)
+{
+       jit_end2 = end;
+}
+
 void 
 mono_profiler_install_thread (MonoProfileThreadFunc start, MonoProfileThreadFunc end)
 {
@@ -103,6 +181,12 @@ mono_profiler_install_allocation (MonoProfileAllocFunc callback)
        allocation_cb = callback;
 }
 
+void 
+mono_profiler_install_statistical (MonoProfileStatFunc callback)
+{
+       statistical_cb = callback;
+}
+
 void 
 mono_profiler_install_coverage_filter (MonoProfileCoverageFilterFunc callback)
 {
@@ -172,10 +256,14 @@ mono_profiler_method_jit (MonoMethod *method)
 }
 
 void 
-mono_profiler_method_end_jit (MonoMethod *method, int result)
+mono_profiler_method_end_jit (MonoMethod *method, MonoJitInfo* jinfo, int result)
 {
-       if ((mono_profiler_events & MONO_PROFILE_JIT_COMPILATION) && jit_end)
-               jit_end (current_profiler, method, result);
+       if ((mono_profiler_events & MONO_PROFILE_JIT_COMPILATION)) {
+               if (jit_end)
+                       jit_end (current_profiler, method, result);
+               if (jit_end2)
+                       jit_end2 (current_profiler, method, jinfo, result);
+       }
 }
 
 void 
@@ -193,14 +281,21 @@ mono_profiler_allocation (MonoObject *obj, MonoClass *klass)
 }
 
 void
-mono_profiler_thread_start (guint32 tid)
+mono_profiler_stat_hit (guchar *ip, void *context)
+{
+       if ((mono_profiler_events & MONO_PROFILE_STATISTICAL) && statistical_cb)
+               statistical_cb (current_profiler, ip, context);
+}
+
+void
+mono_profiler_thread_start (gsize tid)
 {
        if ((mono_profiler_events & MONO_PROFILE_THREADS) && thread_start)
                thread_start (current_profiler, tid);
 }
 
 void 
-mono_profiler_thread_end (guint32 tid)
+mono_profiler_thread_end (gsize tid)
 {
        if ((mono_profiler_events & MONO_PROFILE_THREADS) && thread_end)
                thread_end (current_profiler, tid);
@@ -337,6 +432,28 @@ mono_profiler_shutdown (void)
                shutdown_callback (current_profiler);
 }
 
+void
+mono_profiler_gc_heap_resize (gint64 new_size)
+{
+       if ((mono_profiler_events & MONO_PROFILE_GC) && gc_heap_resize)
+               gc_heap_resize (current_profiler, new_size);
+}
+
+void
+mono_profiler_gc_event (MonoGCEvent event, int generation)
+{
+       if ((mono_profiler_events & MONO_PROFILE_GC) && gc_event)
+               gc_event (current_profiler, event, generation);
+}
+
+void
+mono_profiler_install_gc (MonoProfileGCFunc callback, MonoProfileGCResizeFunc heap_resize_callback)
+{
+       mono_gc_enable_events ();
+       gc_event = callback;
+       gc_heap_resize = heap_resize_callback;
+}
+
 static GHashTable *coverage_hash = NULL;
 
 MonoProfileCoverageInfo* 
@@ -348,7 +465,7 @@ mono_profiler_coverage_alloc (MonoMethod *method, int entries)
                if (! (*coverage_filter_cb) (current_profiler, method))
                        return NULL;
 
-       EnterCriticalSection (&profiler_coverage_mutex);
+       mono_profiler_coverage_lock ();
        if (!coverage_hash)
                coverage_hash = g_hash_table_new (NULL, NULL);
 
@@ -357,7 +474,7 @@ mono_profiler_coverage_alloc (MonoMethod *method, int entries)
        res->entries = entries;
 
        g_hash_table_insert (coverage_hash, method, res);
-       LeaveCriticalSection (&profiler_coverage_mutex);
+       mono_profiler_coverage_unlock ();
 
        return res;
 }
@@ -368,9 +485,9 @@ mono_profiler_coverage_free (MonoMethod *method)
 {
        MonoProfileCoverageInfo* info;
 
-       EnterCriticalSection (&profiler_coverage_mutex);
+       mono_profiler_coverage_lock ();
        if (!coverage_hash) {
-               LeaveCriticalSection (&profiler_coverage_mutex);
+               mono_profiler_coverage_unlock ();
                return;
        }
 
@@ -379,29 +496,44 @@ mono_profiler_coverage_free (MonoMethod *method)
                g_free (info);
                g_hash_table_remove (coverage_hash, method);
        }
-       LeaveCriticalSection (&profiler_coverage_mutex);
+       mono_profiler_coverage_unlock ();
 }
 
+/**
+ * mono_profiler_coverage_get:
+ * @prof: The profiler handle, installed with mono_profiler_install
+ * @method: the method to gather information from.
+ * @func: A routine that will be called back with the results
+ *
+ * If the MONO_PROFILER_INS_COVERAGE flag was active during JIT compilation
+ * it is posisble to obtain coverage information about a give method.
+ *
+ * The function @func will be invoked repeatedly with instances of the
+ * MonoProfileCoverageEntry structure.
+ */
 void 
 mono_profiler_coverage_get (MonoProfiler *prof, MonoMethod *method, MonoProfileCoverageFunc func)
 {
        MonoProfileCoverageInfo* info;
        int i, offset;
-       guint32 line, col;
-       unsigned char *start, *end, *cil_code;
+       guint32 code_size;
+       const unsigned char *start, *end, *cil_code;
        MonoMethodHeader *header;
        MonoProfileCoverageEntry entry;
+       MonoDebugMethodInfo *debug_minfo;
 
-       EnterCriticalSection (&profiler_coverage_mutex);
+       mono_profiler_coverage_lock ();
        info = g_hash_table_lookup (coverage_hash, method);
-       LeaveCriticalSection (&profiler_coverage_mutex);
+       mono_profiler_coverage_unlock ();
 
        if (!info)
                return;
 
-       header = ((MonoMethodNormal *)method)->header;
-       start = (unsigned char*)header->code;
-       end = start + header->code_size;
+       header = mono_method_get_header (method);
+       start = mono_method_header_get_code (header, &code_size, NULL);
+       debug_minfo = mono_debug_lookup_method (method);
+
+       end = start + code_size;
        for (i = 0; i < info->entries; ++i) {
                cil_code = info->data [i].cil_code;
                if (cil_code && cil_code >= start && cil_code < end) {
@@ -409,21 +541,34 @@ mono_profiler_coverage_get (MonoProfiler *prof, MonoMethod *method, MonoProfileC
                        entry.iloffset = offset;
                        entry.method = method;
                        entry.counter = info->data [i].count;
-                       /* the debug interface doesn't support column info, sigh */
-                       col = line = 1;
-                       entry.filename = mono_debug_source_location_from_il_offset (method, offset, &line);
-                       entry.line = line;
-                       entry.col = col;
+                       entry.line = entry.col = 1;
+                       entry.filename = NULL;
+                       if (debug_minfo) {
+                               MonoDebugSourceLocation *location;
+
+                               location = mono_debug_symfile_lookup_location (debug_minfo, offset);
+                               if (location) {
+                                       entry.line = location->row;
+                                       entry.col = location->column;
+                                       entry.filename = g_strdup (location->source_file);
+                                       mono_debug_free_source_location (location);
+                               }
+                       }
+
                        func (prof, &entry);
+                       g_free (entry.filename);
                }
        }
 }
 
+#ifndef DISABLE_PROFILER
 /*
  * Small profiler extracted from mint: we should move it in a loadable module
  * and improve it to do graphs and more accurate timestamping with rdtsc.
  */
 
+static FILE* poutput = NULL;
+
 #define USE_X86TSC 0
 #define USE_WIN32COUNTER 0
 #if USE_X86TSC
@@ -557,8 +702,6 @@ struct _MonoProfiler {
        MonoMethod *max_jit_method;
        int         methods_jitted;
        
-       /* tls_id is the id for the TLS slot where MonoProfiler is stored */
-       int         tls_id;
        GSList     *per_thread;
        
        /* chain of callers for the current thread */
@@ -586,8 +729,8 @@ struct _MethodCallProfile {
 struct _AllocInfo {
        AllocInfo *next;
        MonoClass *klass;
-       guint count;
-       guint mem;
+       guint64 count;
+       guint64 mem;
 };
 
 struct _CallerInfo {
@@ -607,20 +750,33 @@ create_profiler (void)
 {
        MonoProfiler *prof = g_new0 (MonoProfiler, 1);
 
-       prof->methods = g_hash_table_new (NULL, NULL);
+       prof->methods = g_hash_table_new (mono_aligned_addr_hash, NULL);
        MONO_TIMER_INIT (prof->jit_timer);
        prof->mempool = mono_mempool_new ();
        return prof;
 }
 #if 1
-#define GET_THREAD_PROF(prof) do {\
-               MonoProfiler *_tprofiler = TlsGetValue ((prof)->tls_id);        \
-               if (!_tprofiler) {      \
-                       _tprofiler = create_profiler ();        \
-                       prof->per_thread = g_slist_prepend (prof->per_thread, _tprofiler);      \
-                       TlsSetValue ((prof)->tls_id, _tprofiler);       \
-               }       \
-               prof = _tprofiler;      \
+
+#ifdef HAVE_KW_THREAD
+       static __thread MonoProfiler * tls_profiler;
+#      define GET_PROFILER() tls_profiler
+#      define SET_PROFILER(x) tls_profiler = (x)
+#      define ALLOC_PROFILER() /* nop */
+#else
+       static guint32 profiler_thread_id = -1;
+#      define GET_PROFILER() ((MonoProfiler *)TlsGetValue (profiler_thread_id))
+#      define SET_PROFILER(x) TlsSetValue (profiler_thread_id, x);
+#      define ALLOC_PROFILER() profiler_thread_id = TlsAlloc ()
+#endif
+
+#define GET_THREAD_PROF(prof) do {                                                           \
+               MonoProfiler *_tprofiler = GET_PROFILER ();                                  \
+               if (!_tprofiler) {                                                           \
+                       _tprofiler = create_profiler ();                                     \
+                       prof->per_thread = g_slist_prepend (prof->per_thread, _tprofiler);   \
+                       SET_PROFILER (_tprofiler);                                           \
+               }                                                                            \
+               prof = _tprofiler;                                                           \
        } while (0)
 #else
 /* thread unsafe but faster variant */
@@ -645,8 +801,9 @@ method_get_name (MonoMethod* method)
 {
        char *sig, *res;
        
-       sig = mono_signature_get_desc (method->signature, FALSE);
-       res = g_strdup_printf ("%s.%s::%s(%s)", method->klass->name_space, method->klass->name,
+       sig = mono_signature_get_desc (mono_method_signature (method), FALSE);
+       res = g_strdup_printf ("%s%s%s::%s(%s)", method->klass->name_space,
+                       method->klass->name_space ? "." : "", method->klass->name,
                method->name, sig);
        g_free (sig);
        return res;
@@ -663,35 +820,38 @@ output_profile (GList *funcs)
        guint64 total_calls = 0;
 
        if (funcs)
-               g_print ("Time(ms) Count   P/call(ms) Method name\n");
+               fprintf (poutput, "Time(ms) Count   P/call(ms) Method name\n");
        for (tmp = funcs; tmp; tmp = tmp->next) {
                p = tmp->data;
                total_calls += p->count;
                if (!(gint)(p->total*1000))
                        continue;
                m = method_get_name (p->method);
-               printf ("########################\n");
-               printf ("% 8.3f ", (double) (p->total * 1000));
-               printf ("%7llu ", p->count);
-               printf ("% 8.3f ", (double) (p->total * 1000)/(double)p->count);
-               printf ("  %s\n", m);
+               fprintf (poutput, "########################\n");
+               fprintf (poutput, "% 8.3f ", (double) (p->total * 1000));
+               fprintf (poutput, "%7llu ", (unsigned long long)p->count);
+               fprintf (poutput, "% 8.3f ", (double) (p->total * 1000)/(double)p->count);
+               fprintf (poutput, "  %s\n", m);
 
                g_free (m);
                /* callers */
                output_callers (p);
        }
-       printf ("Total number of calls: %lld\n", total_calls);
+       fprintf (poutput, "Total number of calls: %lld\n", (long long)total_calls);
 }
 
 typedef struct {
        MethodProfile *mp;
-       guint count;
+       guint64 count;
 } NewobjProfile;
 
 static gint
 compare_newobj_profile (NewobjProfile *profa, NewobjProfile *profb)
 {
-       return (gint)profb->count - (gint)profa->count;
+       if (profb->count == profa->count)
+               return 0;
+       else
+               return profb->count > profa->count ? 1 : -1;
 }
 
 static void
@@ -699,7 +859,7 @@ build_newobj_profile (MonoClass *class, MethodProfile *mprof, GList **funcs)
 {
        NewobjProfile *prof = g_new (NewobjProfile, 1);
        AllocInfo *tmp;
-       guint count = 0;
+       guint64 count = 0;
        
        prof->mp = mprof;
        /* we use the total amount of memory to sort */
@@ -750,7 +910,7 @@ output_callers (MethodProfile *p) {
        CallerInfo *cinfo;
        char *m;
        
-       g_print ("  Callers (with count) that contribute at least for 1%%:\n");
+       fprintf (poutput, "  Callers (with count) that contribute at least for 1%%:\n");
        total_callers = 0;
        for (cinfo = p->caller_info; cinfo; cinfo = cinfo->next) {
                total_callers += cinfo->count;
@@ -762,11 +922,16 @@ output_callers (MethodProfile *p) {
                if (percent < 1)
                        continue;
                m = method_get_name (cinfo->caller);
-               g_print ("    %8d % 3d %% %s\n", cinfo->count, percent, m);
+               fprintf (poutput, "    %8d % 3d %% %s\n", cinfo->count, percent, m);
                g_free (m);
        }
 }
 
+/* This isn't defined on older glib versions and on some platforms */
+#ifndef G_GUINT64_FORMAT
+#define G_GUINT64_FORMAT "ul"
+#endif
+
 static void
 output_newobj_profile (GList *proflist)
 {
@@ -778,13 +943,13 @@ output_newobj_profile (GList *proflist)
        const char* isarray;
        char buf [256];
        char *m;
-       guint total = 0;
+       guint64 total = 0;
        GSList *sorted, *tmps;
 
-       g_print ("\nAllocation profiler\n");
+       fprintf (poutput, "\nAllocation profiler\n");
 
        if (proflist)
-               g_print ("%-9s %s\n", "Total mem", "Method");
+               fprintf (poutput, "%-9s %s\n", "Total mem", "Method");
        for (tmp = proflist; tmp; tmp = tmp->next) {
                p = tmp->data;
                total += p->count;
@@ -792,7 +957,7 @@ output_newobj_profile (GList *proflist)
                        continue;
                mp = p->mp;
                m = method_get_name (mp->method);
-               g_print ("########################\n%8d KB %s\n", p->count / 1024, m);
+               fprintf (poutput, "########################\n%8" G_GUINT64_FORMAT " KB %s\n", (p->count / 1024), m);
                g_free (m);
                sorted = sort_alloc_list (mp->alloc_info);
                for (tmps = sorted; tmps; tmps = tmps->next) {
@@ -806,14 +971,14 @@ output_newobj_profile (GList *proflist)
                        } else {
                                isarray = "";
                        }
-                       g_snprintf (buf, sizeof (buf), "%s.%s%s",
-                               klass->name_space, klass->name, isarray);
-                       g_print ("    %8d KB %8d %-48s\n", ainfo->mem / 1024, ainfo->count, buf);
+                       g_snprintf (buf, sizeof (buf), "%s%s%s%s",
+                               klass->name_space, klass->name_space ? "." : "", klass->name, isarray);
+                       fprintf (poutput, "    %8" G_GUINT64_FORMAT " KB %8" G_GUINT64_FORMAT " %-48s\n", (ainfo->mem / 1024), ainfo->count, buf);
                }
                /* callers */
                output_callers (mp);
        }
-       g_print ("Total memory allocated: %d KB\n", total / 1024);
+       fprintf (poutput, "Total memory allocated: %" G_GUINT64_FORMAT " KB\n", total / 1024);
 }
 
 static void
@@ -978,13 +1143,7 @@ simple_allocation (MonoProfiler *prof, MonoObject *obj, MonoClass *klass)
                profile_info->alloc_info = tmp;
        }
        tmp->count++;
-       if (klass == mono_defaults.string_class) {
-               tmp->mem += sizeof (MonoString) + 2 * mono_string_length ((MonoString*)obj) + 2;
-       } else if (klass->parent == mono_defaults.array_class) {
-               tmp->mem += sizeof (MonoArray) + mono_array_element_size (klass) * mono_array_length ((MonoArray*)obj);
-       } else {
-               tmp->mem += mono_class_instance_size (klass);
-       }
+       tmp->mem += mono_object_get_size (obj);
 }
 
 static void
@@ -1009,6 +1168,169 @@ simple_method_end_jit (MonoProfiler *prof, MonoMethod *method, int result)
        }
 }
 
+/* about 10 minutes of samples */
+#define MAX_PROF_SAMPLES (1000*60*10)
+static int prof_counts = 0;
+static int prof_ucounts = 0;
+static gpointer* prof_addresses = NULL;
+static GHashTable *prof_table = NULL;
+
+static void
+simple_stat_hit (MonoProfiler *prof, guchar *ip, void *context)
+{
+       int pos;
+
+       if (prof_counts >= MAX_PROF_SAMPLES)
+               return;
+       pos = InterlockedIncrement (&prof_counts);
+       prof_addresses [pos - 1] = ip;
+}
+
+static int
+compare_methods_prof (gconstpointer a, gconstpointer b)
+{
+       int ca = GPOINTER_TO_UINT (g_hash_table_lookup (prof_table, a));
+       int cb = GPOINTER_TO_UINT (g_hash_table_lookup (prof_table, b));
+       return cb-ca;
+}
+
+static void
+prof_foreach (char *method, gpointer c, gpointer data)
+{
+       GList **list = data;
+       *list = g_list_insert_sorted (*list, method, compare_methods_prof);
+}
+
+typedef struct Addr2LineData Addr2LineData;
+
+struct Addr2LineData {
+       Addr2LineData *next;
+       FILE *pipein;
+       FILE *pipeout;
+       char *binary;
+       int child_pid;
+};
+
+static Addr2LineData *addr2line_pipes = NULL;
+
+static char*
+try_addr2line (const char* binary, gpointer ip)
+{
+       char buf [1024];
+       char *res;
+       Addr2LineData *addr2line;
+
+       for (addr2line = addr2line_pipes; addr2line; addr2line = addr2line->next) {
+               if (strcmp (binary, addr2line->binary) == 0)
+                       break;
+       }
+       if (!addr2line) {
+               const char *addr_argv[] = {"addr2line", "-f", "-e", binary, NULL};
+               int child_pid;
+               int ch_in, ch_out;
+               if (!g_spawn_async_with_pipes (NULL, (char**)addr_argv, NULL, G_SPAWN_SEARCH_PATH, NULL, NULL,
+                               &child_pid, &ch_in, &ch_out, NULL, NULL)) {
+                       return g_strdup (binary);
+               }
+               addr2line = g_new0 (Addr2LineData, 1);
+               addr2line->child_pid = child_pid;
+               addr2line->binary = g_strdup (binary);
+               addr2line->pipein = fdopen (ch_in, "w");
+               addr2line->pipeout = fdopen (ch_out, "r");
+               addr2line->next = addr2line_pipes;
+               addr2line_pipes = addr2line;
+       }
+       fprintf (addr2line->pipein, "%p\n", ip);
+       fflush (addr2line->pipein);
+       /* we first get the func name and then file:lineno in a second line */
+       if (fgets (buf, sizeof (buf), addr2line->pipeout) && buf [0] != '?') {
+               char *end = strchr (buf, '\n');
+               if (end)
+                       *end = 0;
+               res = g_strdup_printf ("%s(%s", binary, buf);
+               /* discard the filename/line info */
+               fgets (buf, sizeof (buf), addr2line->pipeout);
+       } else {
+               res = g_strdup (binary);
+       }
+       return res;
+}
+
+static void
+stat_prof_report (void)
+{
+       MonoJitInfo *ji;
+       int count = prof_counts;
+       int i, c;
+       char *mn;
+       gpointer ip;
+       GList *tmp, *sorted = NULL;
+       int pcount = ++ prof_counts;
+
+       prof_counts = MAX_PROF_SAMPLES;
+       for (i = 0; i < count; ++i) {
+               ip = prof_addresses [i];
+               ji = mono_jit_info_table_find (mono_domain_get (), ip);
+               if (ji) {
+                       mn = mono_method_full_name (ji->method, TRUE);
+               } else {
+#ifdef HAVE_BACKTRACE_SYMBOLS
+                       char **names;
+                       char *send;
+                       int no_func;
+                       prof_ucounts++;
+                       names = backtrace_symbols (&ip, 1);
+                       send = strchr (names [0], '+');
+                       if (send) {
+                               *send = 0;
+                               no_func = 0;
+                       } else {
+                               no_func = 1;
+                       }
+                       send = strchr (names [0], '[');
+                       if (send)
+                               *send = 0;
+                       if (no_func && names [0][0]) {
+                               char *endp = strchr (names [0], 0);
+                               while (--endp >= names [0] && g_ascii_isspace (*endp))
+                                       *endp = 0;
+                               mn = try_addr2line (names [0], ip);
+                       } else {
+                               mn = g_strdup (names [0]);
+                       }
+                       free (names);
+#else
+                       prof_ucounts++;
+                       mn = g_strdup_printf ("unmanaged [%p]", ip);
+#endif
+               }
+               c = GPOINTER_TO_UINT (g_hash_table_lookup (prof_table, mn));
+               c++;
+               g_hash_table_insert (prof_table, mn, GUINT_TO_POINTER (c));
+               if (c > 1)
+                       g_free (mn);
+       }
+       fprintf (poutput, "prof counts: total/unmanaged: %d/%d\n", pcount, prof_ucounts);
+       g_hash_table_foreach (prof_table, (GHFunc)prof_foreach, &sorted);
+       for (tmp = sorted; tmp; tmp = tmp->next) {
+               double perc;
+               c = GPOINTER_TO_UINT (g_hash_table_lookup (prof_table, tmp->data));
+               perc = c*100.0/count;
+               fprintf (poutput, "%7d\t%5.2f %% %s\n", c, perc, (char*)tmp->data);
+       }
+       g_list_free (sorted);
+}
+
+static void
+simple_appdomain_unload (MonoProfiler *prof, MonoDomain *domain)
+{
+       /* FIXME: we should actually record partial data for each domain, 
+        * since the ip->ji->method mappings are going away at domain unload time.
+        */
+       if (domain == mono_get_root_domain ())
+               stat_prof_report ();
+}
+
 static void
 simple_shutdown (MonoProfiler *prof)
 {
@@ -1022,10 +1344,10 @@ simple_shutdown (MonoProfiler *prof)
                merge_thread_data (prof, tprof);
        }
 
-       printf("Total time spent compiling %d methods (sec): %.4g\n", prof->methods_jitted, prof->jit_time);
+       fprintf (poutput, "Total time spent compiling %d methods (sec): %.4g\n", prof->methods_jitted, prof->jit_time);
        if (prof->max_jit_method) {
                str = method_get_name (prof->max_jit_method);
-               printf("Slowest method to compile (sec): %.4g: %s\n", prof->max_jit_time, str);
+               fprintf (poutput, "Slowest method to compile (sec): %.4g: %s\n", prof->max_jit_time, str);
                g_free (str);
        }
        g_hash_table_foreach (prof->methods, (GHFunc)build_profile, &profile);
@@ -1036,6 +1358,10 @@ simple_shutdown (MonoProfiler *prof)
        g_hash_table_foreach (prof->methods, (GHFunc)build_newobj_profile, &profile);
        output_newobj_profile (profile);
        g_list_free (profile);
+
+       g_free (prof_addresses);
+       prof_addresses = NULL;
+       g_hash_table_destroy (prof_table);
 }
 
 static void
@@ -1043,54 +1369,92 @@ mono_profiler_install_simple (const char *desc)
 {
        MonoProfiler *prof;
        gchar **args, **ptr;
-       MonoProfileFlags flags = MONO_PROFILE_ENTER_LEAVE|MONO_PROFILE_JIT_COMPILATION|MONO_PROFILE_ALLOCATIONS;
+       MonoProfileFlags flags = 0;
 
        MONO_TIMER_STARTUP;
+       poutput = stdout;
+
+       if (!desc)
+               desc = "alloc,time,jit";
 
        if (desc) {
                /* Parse options */
                if (strstr (desc, ":"))
                        desc = strstr (desc, ":") + 1;
                else
-                       desc = NULL;
-               args = g_strsplit (desc ? desc : "", ",", -1);
+                       desc = "alloc,time,jit";
+               args = g_strsplit (desc, ",", -1);
 
                for (ptr = args; ptr && *ptr; ptr++) {
                        const char *arg = *ptr;
 
-                       if (!strcmp (arg, "-time"))
-                               flags &= ~MONO_PROFILE_ENTER_LEAVE;
-                       else
-                          if (!strcmp (arg, "-alloc"))
-                                  flags &= ~MONO_PROFILE_ALLOCATIONS;
-                          else {
-                                  fprintf (stderr, "profiler : Unknown argument '%s'.\n", arg);
-                                  return;
-                          }
+                       if (!strcmp (arg, "time"))
+                               flags |= MONO_PROFILE_ENTER_LEAVE;
+                       else if (!strcmp (arg, "alloc"))
+                               flags |= MONO_PROFILE_ALLOCATIONS;
+                       else if (!strcmp (arg, "stat"))
+                               flags |= MONO_PROFILE_STATISTICAL | MONO_PROFILE_APPDOMAIN_EVENTS;
+                       else if (!strcmp (arg, "jit"))
+                               flags |= MONO_PROFILE_JIT_COMPILATION;
+                       else if (strncmp (arg, "file=", 5) == 0) {
+                               poutput = fopen (arg + 5, "wb");
+                               if (!poutput) {
+                                       poutput = stdout;
+                                       fprintf (stderr, "profiler : cannot open profile output file '%s'.\n", arg + 5);
+                               }
+                       } else {
+                               fprintf (stderr, "profiler : Unknown argument '%s'.\n", arg);
+                               return;
+                       }
                }
        }
 
        prof = create_profiler ();
-       prof->tls_id = TlsAlloc ();
-       TlsSetValue (prof->tls_id, prof);
+       ALLOC_PROFILER ();
+       SET_PROFILER (prof);
+
+       /* statistical profiler data */
+       prof_addresses = g_new0 (gpointer, MAX_PROF_SAMPLES);
+       prof_table = g_hash_table_new (g_str_hash, g_str_equal);
 
        mono_profiler_install (prof, simple_shutdown);
-       /* later do also object creation */
        mono_profiler_install_enter_leave (simple_method_enter, simple_method_leave);
        mono_profiler_install_jit_compile (simple_method_jit, simple_method_end_jit);
        mono_profiler_install_allocation (simple_allocation);
+       mono_profiler_install_appdomain (NULL, NULL, simple_appdomain_unload, NULL);
+       mono_profiler_install_statistical (simple_stat_hit);
        mono_profiler_set_events (flags);
 }
 
+#endif /* DISABLE_PROFILER */
+
 typedef void (*ProfilerInitializer) (const char*);
 #define INITIALIZER_NAME "mono_profiler_startup"
 
+/**
+ * mono_profiler_load:
+ * @desc: arguments to configure the profiler
+ *
+ * Invoke this method to initialize the profiler.   This will drive the
+ * loading of the internal ("default") or any external profilers.
+ *
+ * This routine is invoked by Mono's driver, but must be called manually
+ * if you embed Mono into your application.
+ */
 void 
 mono_profiler_load (const char *desc)
 {
+#ifndef DISABLE_PROFILER
        if (!desc || (strcmp ("default", desc) == 0) || (strncmp (desc, "default:", 8) == 0)) {
                mono_profiler_install_simple (desc);
-       } else {
+               return;
+       }
+#else
+       if (!desc) {
+               desc = "default";
+       }
+#endif
+       {
                GModule *pmodule;
                const char* col = strchr (desc, ':');
                char* libname;