* ~102 = 10011001
* (~102)+1 = 10011010 = 0x9A */
mov $0x9a9a9a9a9a9a9a9a, %rax
- movq %rax, %xmm15
- movddup %xmm15, %xmm8
+ movq %rax, %xmm8
+ punpcklbw %xmm8, %xmm8
//init %xmm9 mit "'a'-'A'= 97-65 = 32 = 0x20
mov $0x2020202020202020, %rax
- movq %rax, %xmm15
- movddup %xmm15, %xmm9
-
- //speicheradresse des pointers zeigt auf 16*8 feld = 128bit
- movdqu (%rdi, %rdx, 8), %xmm11
- movdqu (%rdi, %rdx, 8), %xmm12
+ movq %rax, %xmm9
+ punpcklbw %xmm9, %xmm9
/*addiere in %xmm11 "min_t-'A'"
* = -128 - 65 = 63 = 0x3f */
mov $0x3f3f3f3f3f3f3f3f, %rax
- movq %rax, %xmm15
- movddup %xmm15, %xmm10
+ movq %rax, %xmm10
+ punpcklbw %xmm10, %xmm10
.nextround:
//speicheradresse des pointers zeigt auf 16*8 feld = 128bit