arm64: codea/abgabe_aa.0
[uebersetzerbau-ss10.git] / asmb / asmb.s
index 28942c8d2aaef9c3411f016b9891c28419f436f9..6597fb060921b50267aee5ff72cf88233696f7cc 100644 (file)
@@ -13,20 +13,20 @@ constc0:
        .rept 16
        .byte 0xc0
        .endr
+const00:
+       .rept 16
+       .byte 0x00
+       .endr
 
        .text
 .globl asmb
-       .type   asmb, @function
 asmb:
-.LFB2:
-       xor %rdx, %rdx
-
-       //soll einfach null sein
-       pxor %xmm14, %xmm14
+       //speicheradresse des parameters zurueckgeben
+       mov %rdi, %rax
 
 .nextround:
        //speicheradresse des pointers zeigt auf 16*8 feld = 128bit
-       movdqu (%rdi, %rdx, 8), %xmm11
+       movdqu (%rdi), %xmm11
 
        // -64 - c
        movdqa constc0, %xmm9
@@ -39,117 +39,21 @@ asmb:
 
 .differenz:
        // Y = min(X, 'a' - 'A')
-       pminub const20, %xmm9
+       pand const20, %xmm9
 
        // c += Y
        paddb %xmm9, %xmm11
 
        // retuniere an die richtige speicheradresse
-       movdqu %xmm11, (%rdi, %rdx, 8)
+       movdqu %xmm11, (%rdi)
 
        //entspricht ein byte dem nullbyte dann steht an jener stelle 0xff sonst 0x00
-       pcmpeqb %xmm14, %xmm11
+       pcmpeqb const00, %xmm11
        //hol die MSBs aller bytes raus
        pmovmskb %xmm11, %ecx
-       add $2, %rdx
+       add $16, %rdi
 
        //ist %ecx gleich null? dann die naechsten 16byte bitte
        jecxz .nextround
 
-       //speicheradresse des parameters zurueckgeben (wird noch modifziert)
-       mov %rdi, %rax
-
-       //===============
-       //ab hier uebler hax um nach \0 trotzdem die gleichen bytes wie
-       //input zu haben, also um selbiges verhalten wie asmb_ref zu erzwingen
-
-       //\0 byte stelle durch rausfinden des MSB des %ecx
-       bsf %ecx, %r11d
-
-       //das ergebnis zweimal abspeichern
-       mov %r11d, %ecx
-
-       //hint: in %xmm9 ist differenz gespeichert (vgl .differenz)
-
-       //leider shiften nur mit immediate! :(
-       btr $3, %r11d
-       jnc .rechtsshift1
-       psrldq $8, %xmm9
-
-.rechtsshift1:
-       btr $2, %r11d
-       jnc .rechtsshift2
-       psrldq $4, %xmm9
-
-.rechtsshift2:
-       btr $1, %r11d
-       jnc .rechtsshift3
-       psrldq $2, %xmm9
-
-.rechtsshift3:
-       btr $0, %r11d
-       jnc .linksshift
-       psrldq $1, %xmm9
-#==================
-.linksshift:
-       btr $3, %ecx
-       jnc .linksshift1
-       pslldq $8, %xmm9
-
-.linksshift1:
-       btr $2, %ecx
-       jnc .linksshift2
-       pslldq $4, %xmm9
-
-.linksshift2:
-       btr $1, %ecx
-       jnc .linksshift3
-       pslldq $2, %xmm9
-
-.linksshift3:
-       btr $0, %ecx
-       jnc .endshift
-       pslldq $1, %xmm9
-
-.endshift:
-       //betreffende speicherstelle in %xmm11 laden
-       movdqu -16(%rax, %rdx, 8), %xmm11
-       //und overhead wieder subtrahieren
-       psubb %xmm9, %xmm11
-
-       //ergebnis zurueckspielen und fertig \o/
-       movdqu %xmm11, -16(%rax, %rdx, 8)
-
        ret
-.LFE2:
-       .size   asmb, .-asmb
-       .section        .eh_frame,"a",@progbits
-.Lframe1:
-       .long   .LECIE1-.LSCIE1
-.LSCIE1:
-       .long   0x0
-       .byte   0x1
-       .string "zR"
-       .uleb128 0x1
-       .sleb128 -8
-       .byte   0x10
-       .uleb128 0x1
-       .byte   0x3
-       .byte   0xc
-       .uleb128 0x7
-       .uleb128 0x8
-       .byte   0x90
-       .uleb128 0x1
-       .align 8
-.LECIE1:
-.LSFDE1:
-       .long   .LEFDE1-.LASFDE1
-.LASFDE1:
-       .long   .LASFDE1-.Lframe1
-       .long   .LFB2
-       .long   .LFE2-.LFB2
-       .uleb128 0x0
-       .align 8
-.LEFDE1:
-       .ident  "GCC: (Debian 4.3.2-1.1) 4.3.2"
-       .section        .note.GNU-stack,"",@progbits