Merge pull request #601 from knocte/sock_improvements

[mono.git] / mono / mini / mini-amd64.c
diff --git a/mono/mini/mini-amd64.c b/mono/mini/mini-amd64.c

index 21f842f016f1f3478c803047d73e4fdfe9b5a263..979cb899203caf1cc1312f9be875d931eba03e81 100644 (file)
--- a/mono/mini/mini-amd64.c
+++ b/mono/mini/mini-amd64.c
@@ -999,6 +999,9 @@ get_call_info (MonoGenericSharingContext *gsctx, MonoMemPool *mp, MonoMethodSign
                                 break;
                         }
                         /* fall through */
+#if defined( __native_client_codegen__ )
+               case MONO_TYPE_TYPEDBYREF:
+#endif
                 case MONO_TYPE_VALUETYPE: {
                         guint32 tmp_gr = 0, tmp_fr = 0, tmp_stacksize = 0;
  
@@ -1009,10 +1012,12 @@ get_call_info (MonoGenericSharingContext *gsctx, MonoMemPool *mp, MonoMethodSign
                         }
                         break;
                 }
+#if !defined( __native_client_codegen__ )
                 case MONO_TYPE_TYPEDBYREF:
                         /* Same as a valuetype with size 24 */
                         cinfo->vtype_retaddr = TRUE;
                         break;
+#endif
                 case MONO_TYPE_VOID:
                         break;
                 default:
@@ -1116,7 +1121,7 @@ get_call_info (MonoGenericSharingContext *gsctx, MonoMemPool *mp, MonoMethodSign
                         add_valuetype (gsctx, sig, ainfo, sig->params [i], FALSE, &gr, &fr, &stack_size);
                         break;
                 case MONO_TYPE_TYPEDBYREF:
-#ifdef HOST_WIN32
+#if defined( HOST_WIN32 ) || defined( __native_client_codegen__ )
                         add_valuetype (gsctx, sig, ainfo, sig->params [i], FALSE, &gr, &fr, &stack_size);
  #else
                         stack_size += sizeof (MonoTypedRef);
@@ -1657,7 +1662,7 @@ mono_arch_fill_argument_info (MonoCompile *cfg)
                 case ArgInIReg:
                 case ArgInFloatSSEReg:
                 case ArgInDoubleSSEReg:
-                       if ((MONO_TYPE_ISSTRUCT (sig->ret) && !mono_class_from_mono_type (sig->ret)->enumtype) || (sig->ret->type == MONO_TYPE_TYPEDBYREF)) {
+                       if ((MONO_TYPE_ISSTRUCT (sig->ret) && !mono_class_from_mono_type (sig->ret)->enumtype) || ((sig->ret->type == MONO_TYPE_TYPEDBYREF) && cinfo->vtype_retaddr)) {
                                 cfg->vret_addr->opcode = OP_REGVAR;
                                 cfg->vret_addr->inst_c0 = cinfo->ret.reg;
                         }
@@ -1771,7 +1776,7 @@ mono_arch_allocate_vars (MonoCompile *cfg)
                 case ArgInIReg:
                 case ArgInFloatSSEReg:
                 case ArgInDoubleSSEReg:
-                       if ((MONO_TYPE_ISSTRUCT (sig->ret) && !mono_class_from_mono_type (sig->ret)->enumtype) || (sig->ret->type == MONO_TYPE_TYPEDBYREF)) {
+                       if ((MONO_TYPE_ISSTRUCT (sig->ret) && !mono_class_from_mono_type (sig->ret)->enumtype) || ((sig->ret->type == MONO_TYPE_TYPEDBYREF) && cinfo->vtype_retaddr)) {
                                 if (cfg->globalra) {
                                         cfg->vret_addr->opcode = OP_REGVAR;
                                         cfg->vret_addr->inst_c0 = cinfo->ret.reg;
@@ -2998,23 +3003,26 @@ emit_call_body (MonoCompile *cfg, guint8 *code, guint32 patch_type, gconstpointe
                         }
                 }
                 else {
-                       if (cfg->abs_patches && g_hash_table_lookup (cfg->abs_patches, data)) {
-                               /* 
-                                * This is not really an optimization, but required because the
-                                * generic class init trampolines use R11 to pass the vtable.
-                                */
-                               near_call = TRUE;
+                       MonoJumpInfo *jinfo = NULL;
+
+                       if (cfg->abs_patches)
+                               jinfo = g_hash_table_lookup (cfg->abs_patches, data);
+                       if (jinfo) {
+                               if (jinfo->type == MONO_PATCH_INFO_JIT_ICALL_ADDR) {
+                                       if ((((guint64)data) >> 32) == 0)
+                                               near_call = TRUE;
+                                       no_patch = TRUE;
+                               } else {
+                                       /* 
+                                        * This is not really an optimization, but required because the
+                                        * generic class init trampolines use R11 to pass the vtable.
+                                        */
+                                       near_call = TRUE;
+                               }
                         } else {
                                 MonoJitICallInfo *info = mono_find_jit_icall_by_addr (data);
                                 if (info) {
-                                       if ((cfg->method->wrapper_type == MONO_WRAPPER_MANAGED_TO_NATIVE) && 
-                                               strstr (cfg->method->name, info->name)) {
-                                               /* A call to the wrapped function */
-                                               if ((((guint64)data) >> 32) == 0)
-                                                       near_call = TRUE;
-                                               no_patch = TRUE;
-                                       }
-                                       else if (info->func == info->wrapper) {
+                                       if (info->func == info->wrapper) {
                                                 /* No wrapper */
                                                 if ((((guint64)info->func) >> 32) == 0)
                                                         near_call = TRUE;
@@ -3039,7 +3047,10 @@ emit_call_body (MonoCompile *cfg, guint8 *code, guint32 patch_type, gconstpointe
  #ifdef MONO_ARCH_NOMAP32BIT
                 near_call = FALSE;
  #endif
-
+#if defined(__native_client__)
+               /* Always use near_call == TRUE for Native Client */
+               near_call = TRUE;
+#endif
                 /* The 64bit XEN kernel does not honour the MAP_32BIT flag. (#522894) */
                 if (optimize_for_xen)
                         near_call = FALSE;
@@ -3835,16 +3846,6 @@ amd64_pop_reg (code, AMD64_RAX);
  #define bb_is_loop_start(bb) ((bb)->loop_body_start && (bb)->nesting)
  
  #ifndef DISABLE_JIT
-
-#if defined(__native_client__) || defined(__native_client_codegen__)
-void mono_nacl_gc()
-{
-#ifdef __native_client_gc__
-       __nacl_suspend_thread_if_needed();
-#endif
-}
-#endif
-
  void
  mono_arch_output_basic_block (MonoCompile *cfg, MonoBasicBlock *bb)
  {
@@ -4084,6 +4085,12 @@ mono_arch_output_basic_block (MonoCompile *cfg, MonoBasicBlock *bb)
                         amd64_alu_reg_reg (code, X86_CMP, ins->sreg1, ins->sreg2);
                         break;
                 case OP_COMPARE_IMM:
+#if defined(__mono_ilp32__)
+                        /* Comparison of pointer immediates should be 4 bytes to avoid sign-extend problems */
+                       g_assert (amd64_is_imm32 (ins->inst_imm));
+                       amd64_alu_reg_imm_size (code, X86_CMP, ins->sreg1, ins->inst_imm, 4);
+                       break;
+#endif
                 case OP_LCOMPARE_IMM:
                         g_assert (amd64_is_imm32 (ins->inst_imm));
                         amd64_alu_reg_imm (code, X86_CMP, ins->sreg1, ins->inst_imm);
@@ -4305,6 +4312,7 @@ mono_arch_output_basic_block (MonoCompile *cfg, MonoBasicBlock *bb)
                         break;
                 }
                 case OP_ADDCC:
+               case OP_LADDCC:
                 case OP_LADD:
                         amd64_alu_reg_reg (code, X86_ADD, ins->sreg1, ins->sreg2);
                         break;
@@ -4321,6 +4329,7 @@ mono_arch_output_basic_block (MonoCompile *cfg, MonoBasicBlock *bb)
                         amd64_alu_reg_imm (code, X86_ADC, ins->dreg, ins->inst_imm);
                         break;
                 case OP_SUBCC:
+               case OP_LSUBCC:
                 case OP_LSUB:
                         amd64_alu_reg_reg (code, X86_SUB, ins->sreg1, ins->sreg2);
                         break;
@@ -4412,6 +4421,10 @@ mono_arch_output_basic_block (MonoCompile *cfg, MonoBasicBlock *bb)
                 }
                 case OP_LDIV:
                 case OP_LREM:
+#if defined( __native_client_codegen__ )
+                       amd64_alu_reg_imm (code, X86_CMP, ins->sreg2, 0);
+                       EMIT_COND_SYSTEM_EXCEPTION (X86_CC_EQ, TRUE, "DivideByZeroException");
+#endif
                         /* Regalloc magic makes the div/rem cases the same */
                         if (ins->sreg2 == AMD64_RDX) {
                                 amd64_mov_membase_reg (code, AMD64_RSP, -8, AMD64_RDX, 8);
@@ -4424,6 +4437,10 @@ mono_arch_output_basic_block (MonoCompile *cfg, MonoBasicBlock *bb)
                         break;
                 case OP_LDIV_UN:
                 case OP_LREM_UN:
+#if defined( __native_client_codegen__ )
+                       amd64_alu_reg_imm (code, X86_CMP, ins->sreg2, 0);
+                       EMIT_COND_SYSTEM_EXCEPTION (X86_CC_EQ, TRUE, "DivideByZeroException");
+#endif
                         if (ins->sreg2 == AMD64_RDX) {
                                 amd64_mov_membase_reg (code, AMD64_RSP, -8, AMD64_RDX, 8);
                                 amd64_alu_reg_reg (code, X86_XOR, AMD64_RDX, AMD64_RDX);
@@ -4435,6 +4452,10 @@ mono_arch_output_basic_block (MonoCompile *cfg, MonoBasicBlock *bb)
                         break;
                 case OP_IDIV:
                 case OP_IREM:
+#if defined( __native_client_codegen__ )
+                       amd64_alu_reg_imm (code, X86_CMP, ins->sreg2, 0);
+                       EMIT_COND_SYSTEM_EXCEPTION (X86_CC_EQ, TRUE, "DivideByZeroException");
+#endif
                         if (ins->sreg2 == AMD64_RDX) {
                                 amd64_mov_membase_reg (code, AMD64_RSP, -8, AMD64_RDX, 8);
                                 amd64_cdq_size (code, 4);
@@ -4446,6 +4467,10 @@ mono_arch_output_basic_block (MonoCompile *cfg, MonoBasicBlock *bb)
                         break;
                 case OP_IDIV_UN:
                 case OP_IREM_UN:
+#if defined( __native_client_codegen__ )
+                       amd64_alu_reg_imm_size (code, X86_CMP, ins->sreg2, 0, 4);
+                       EMIT_COND_SYSTEM_EXCEPTION (X86_CC_EQ, TRUE, "DivideByZeroException");
+#endif
                         if (ins->sreg2 == AMD64_RDX) {
                                 amd64_mov_membase_reg (code, AMD64_RSP, -8, AMD64_RDX, 8);
                                 amd64_alu_reg_reg (code, X86_XOR, AMD64_RDX, AMD64_RDX);
@@ -6391,8 +6416,18 @@ mono_arch_output_basic_block (MonoCompile *cfg, MonoBasicBlock *bb)
                         break;
                 }
                 case OP_NACL_GC_SAFE_POINT: {
-#if defined(__native_client_codegen__)
-                       code = emit_call (cfg, code, MONO_PATCH_INFO_ABS, (gpointer)mono_nacl_gc, TRUE);
+#if defined(__native_client_codegen__) && defined(__native_client_gc__)
+                       if (cfg->compile_aot)
+                               code = emit_call (cfg, code, MONO_PATCH_INFO_ABS, (gpointer)mono_nacl_gc, TRUE);
+                       else {
+                               guint8 *br [1];
+
+                               amd64_mov_reg_imm_size (code, AMD64_R11, (gpointer)&__nacl_thread_suspension_needed, 4);
+                               amd64_test_membase_imm_size (code, AMD64_R11, 0, 0xFFFFFFFF, 4);
+                               br[0] = code; x86_branch8 (code, X86_CC_EQ, 0, FALSE);
+                               code = emit_call (cfg, code, MONO_PATCH_INFO_ABS, (gpointer)mono_nacl_gc, TRUE);
+                               amd64_patch (br[0], code);
+                       }
  #endif
                         break;
                 }
@@ -8124,7 +8159,7 @@ mono_arch_build_imt_thunk (MonoVTable *vtable, MonoDomain *domain, MonoIMTCheckI
                         if (item->check_target_idx || fail_case) {
                                 if (!item->compare_done || fail_case) {
                                         if (amd64_is_imm32 (item->key))
-                                               amd64_alu_reg_imm (code, X86_CMP, MONO_ARCH_IMT_REG, (guint32)(gssize)item->key);
+                                               amd64_alu_reg_imm_size (code, X86_CMP, MONO_ARCH_IMT_REG, (guint32)(gssize)item->key, sizeof(gpointer));
                                         else {
                                                 amd64_mov_reg_imm (code, MONO_ARCH_IMT_SCRATCH_REG, item->key);
                                                 amd64_alu_reg_reg (code, X86_CMP, MONO_ARCH_IMT_REG, MONO_ARCH_IMT_SCRATCH_REG);
@@ -8150,7 +8185,7 @@ mono_arch_build_imt_thunk (MonoVTable *vtable, MonoDomain *domain, MonoIMTCheckI
                                 /* enable the commented code to assert on wrong method */
  #if 0
                                 if (amd64_is_imm32 (item->key))
-                                       amd64_alu_reg_imm (code, X86_CMP, MONO_ARCH_IMT_REG, (guint32)(gssize)item->key);
+                                       amd64_alu_reg_imm_size (code, X86_CMP, MONO_ARCH_IMT_REG, (guint32)(gssize)item->key, sizeof(gpointer));
                                 else {
                                         amd64_mov_reg_imm (code, MONO_ARCH_IMT_SCRATCH_REG, item->key);
                                         amd64_alu_reg_reg (code, X86_CMP, MONO_ARCH_IMT_REG, MONO_ARCH_IMT_SCRATCH_REG);
@@ -8175,7 +8210,7 @@ mono_arch_build_imt_thunk (MonoVTable *vtable, MonoDomain *domain, MonoIMTCheckI
                         }
                 } else {
                         if (amd64_is_imm32 (item->key))
-                               amd64_alu_reg_imm (code, X86_CMP, MONO_ARCH_IMT_REG, (guint32)(gssize)item->key);
+                               amd64_alu_reg_imm_size (code, X86_CMP, MONO_ARCH_IMT_REG, (guint32)(gssize)item->key, sizeof (gpointer));
                         else {
                                 amd64_mov_reg_imm (code, MONO_ARCH_IMT_SCRATCH_REG, item->key);
                                 amd64_alu_reg_reg (code, X86_CMP, MONO_ARCH_IMT_REG, MONO_ARCH_IMT_SCRATCH_REG);