asm{a,b}: spass
[uebersetzerbau-ss10.git] / asma / asma.s
index 1799b6345db18c7eb5a579b587f518426b65e399..d2bacedb9fb85fe397711d01446626ff96be90c9 100644 (file)
@@ -1,54 +1,58 @@
        .file   "asma.c"
+
+       .data
+       .align 16
+const65:
+       .rept 16
+       .byte 0x65
+       .endr
+const20:
+       .rept 16
+       .byte 0x20
+       .endr
+constc0:
+       .rept 16
+       .byte 0xc0
+       .endr
+
        .text
 .globl asma
        .type   asma, @function
 asma:
 .LFB2:
-       /*init %xmm1 mit "'Z' + 1 + min_t - 'A'" fuer jedes byte
-       * 'Z' + 1 + min_t - 'A' = 90 + 1 - 128 - 65 = -102
-       * 102 = 01100110
-       * ~102 = 10011001
-       * (~102)+1 = 10011010 = 0x9A */
-       mov $0x9a9a9a9a9a9a9a9a, %rbx
-       movq %rbx, %xmm1
-       pslldq $8, %xmm1
-       movq %rbx, %xmm1
-
-       //init %xmm2 mit "'a'-'A'= 97-65 = 32 = 0x20
-       mov $0x2020202020202020, %rbx
-       movq %rbx, %xmm2
-       pslldq $8, %xmm2
-       movq %rbx, %xmm2
+       // folgendes kann umgeformt werden (max_t = 127)
+       // X = 'Z' + 1 + min_t - 'A' > c + min_t - 'A' ? 0xff : 0
+       // X =      -c + max_t + 'A' > - 'Z' -1 + max_t + 'A' ? 0xff : 0
+       // X =         -c + 127 + 65 > - 90 - 1 + 127 + 65 ? 0xff : 0
+       // X =               -c - 64 > 101 ? 0xff : 0
+       // X =               -64 - c > 101 ? 0xff : 0
+       // ...
+       // 101 = 0x65
+       // -64 = 0xc0
 
-       //speicheradresse des pointers zeigt auf 16*8 feld = 128bit
-       movdqu (%rdi), %xmm4
-       movdqu (%rdi), %xmm5
+       // speicheradresse des pointers zeigt auf 16*8 feld = 128bit
+       movdqu (%rdi), %xmm11
 
-       /*addiere in %xmm4 "min_t-'A'"
-       * = -128 - 65 = 63 = 0x3f */
-       mov $0x3f3f3f3f3f3f3f3f, %rbx
-       movq %rbx, %xmm3
-       pslldq $8, %xmm3
-       movq %rbx, %xmm3
+       // -64 - c
+       movdqa constc0, %xmm9
+       psubb %xmm11, %xmm9
 
-       //c+min_t-'A'
-       paddb %xmm3, %xmm4
+       // "Packed COMpare Greater Than (Byte)"
+       // achtung beim intuitiven lesen des befehles. 'kleiner'
+       // ist mit 'groesser' vertauscht und vice versa
+       pcmpgtb const65, %xmm9
 
-       /*"Packed COMpare Greater Than (Byte)"
-       * X = 'Z' + 1 + min_t - 'A' > c + min_t - 'A' ? 0xff : 0
-       * achtung beim intuitiven lesen des befehles. 'kleiner' 
-       * ist mit 'groesser' vertauscht und vice versa */
-       pcmpgtb %xmm4, %xmm1
+       // Y = min(X, 'a' - 'A')
+       // mit 'a'-'A'= 97-65 = 32 = 0x20
+       pand const20, %xmm9
 
-       //Y = min(X, 'a' - 'A')
-       pminub %xmm2, %xmm1
+       // c += Y
+       paddb %xmm9, %xmm11
 
-       //c += Y
-       paddb %xmm1, %xmm5
-
-       //retuniere an die richtige speicheradresse
+       // retuniere an die richtige speicheradresse
        mov %rdi, %rax
-       movapd %xmm5, (%rax)
+       movdqu %xmm11, (%rax)
+
        ret
 .LFE2:
        .size   asma, .-asma