.data .align 16 const65: .rept 16 .byte 0x65 .endr const20: .rept 16 .byte 0x20 .endr constc0: .rept 16 .byte 0xc0 .endr .text .globl asma asma: // folgendes kann umgeformt werden (max_t = 127) // X = 'Z' + 1 + min_t - 'A' > c + min_t - 'A' ? 0xff : 0 // X = -c + max_t + 'A' > - 'Z' -1 + max_t + 'A' ? 0xff : 0 // X = -c + 127 + 65 > - 90 - 1 + 127 + 65 ? 0xff : 0 // X = -c - 64 > 101 ? 0xff : 0 // X = -64 - c > 101 ? 0xff : 0 // ... // 101 = 0x65 // -64 = 0xc0 // speicheradresse des pointers zeigt auf 16*8 feld = 128bit movdqu (%rdi), %xmm11 // -64 - c movdqa constc0, %xmm9 psubb %xmm11, %xmm9 // "Packed COMpare Greater Than (Byte)" // achtung beim intuitiven lesen des befehles. 'kleiner' // ist mit 'groesser' vertauscht und vice versa pcmpgtb const65, %xmm9 // Y = min(X, 'a' - 'A') // mit 'a'-'A'= 97-65 = 32 = 0x20 pand const20, %xmm9 // c += Y paddb %xmm9, %xmm11 // retuniere an die richtige speicheradresse mov %rdi, %rax movdqu %xmm11, (%rax) ret