.file "asma.c"
+
+.section .rodata
+.align 128
+const9a:
+ .rept 16
+ .byte 0x9a
+ .endr
+const20:
+ .rept 16
+ .byte 0x20
+ .endr
+const3f:
+ .rept 16
+ .byte 0x3f
+ .endr
+
.text
.globl asma
.type asma, @function
asma:
.LFB2:
+ /*init %xmm8 mit "'Z' + 1 + min_t - 'A'" fuer jedes byte
+ * 'Z' + 1 + min_t - 'A' = 90 + 1 - 128 - 65 = -102
+ * 102 = 01100110
+ * ~102 = 10011001
+ * (~102)+1 = 10011010 = 0x9A */
+ movdqa const9a, %xmm8
-/* unsigned char *asma(unsigned char *s)
-{
- int i;
- for (i=0; i<16; i++) {
- unsigned char c=s[i];
- c += (c>=’A’ && c<=’Z’) ? ’a’-’A’ : 0;
- s[i] = c;
- }
- return s;
-}
-
-Schreiben Sie diese Funktion in Assembler unter Verwendung von pcmpgtb. Dabei ist folgende Äquivalenz hilfreich:
-(c>=’A’ && c<=’Z’) ? ’a’-’A’ : 0;
+ //speicheradresse des pointers zeigt auf 16*8 feld = 128bit
+ movdqu (%rdi), %xmm11
-ist (bei Verwendung von Überlauf-Arithmetik) äquivalent zu
-min(’Z’+1+min_t-’A’ > c+min_t-’A’ ? 0xff : 0, ’a’-’A’)
+ /*addiere in %xmm11 "min_t-'A'"
+ * = -128 - 65 = 63 = 0x3f
+ * c+min_t-'A' */
+ paddb const3f, %xmm11
-wobei min_t der minimale Wert des Datentyps ist, den der Vergleich behandelt (bei pcmpgtb also -128). Zusätzlich zu dem oben genannten dürften die Befehle pminub, paddb, und psubb nützlich sein. */
- #clear %xmm1
- pxor %xmm1, %xmm1
+ /*"Packed COMpare Greater Than (Byte)"
+ * X = 'Z' + 1 + min_t - 'A' > c + min_t - 'A' ? 0xff : 0
+ * achtung beim intuitiven lesen des befehles. 'kleiner'
+ * ist mit 'groesser' vertauscht und vice versa */
+ pcmpgtb %xmm11, %xmm8
- #speicheradresse des pointers zeigt auf 16*8 feld = 128bit
- movdqa (%rdi), %xmm1
+ /*Y = min(X, 'a' - 'A')
+ * mit "'a'-'A'= 97-65 = 32 = 0x20 */
+ pminub const20, %xmm8
- #todo
- #pcmpgtb %xmm1, %xmm2
+ //retuniere an die richtige speicheradresse
+ mov %rdi, %rax
+ //c += Y
+ paddb (%rax), %xmm8
+ movapd %xmm8, (%rax)
- movq %xmm1, (%rax)
ret
.LFE2:
.size asma, .-asma