asma: geht jetzt endlich
[uebersetzerbau-ss10.git] / asma / asma.s
1         .file   "asma.c"
2         .text
3 .globl asma
4         .type   asma, @function
5 asma:
6 .LFB2:
7         /*init %xmm1 mit "'Z' + 1 + min_t - 'A'" fuer jedes byte
8         * 'Z' + 1 + min_t - 'A' = 90 + 1 - 128 - 65 = -102
9         * 102 = 01100110
10         * ~102 = 10011001
11         * (~102)+1 = 10011010 = 0x9A */
12         mov $0x9a9a9a9a9a9a9a9a, %rbx
13         movq %rbx, %xmm1
14         pslldq $8, %xmm1
15         movq %rbx, %xmm1
16
17         //init %xmm2 mit "'a'-'A'= 97-65 = 32 = 0x20
18         mov $0x2020202020202020, %rbx
19         movq %rbx, %xmm2
20         pslldq $8, %xmm2
21         movq %rbx, %xmm2
22
23         //speicheradresse des pointers zeigt auf 16*8 feld = 128bit
24         movdqu (%rdi), %xmm4
25         movdqu (%rdi), %xmm5
26
27         /*addiere in %xmm4 "min_t-'A'"
28         * = -128 - 65 = 63 = 0x3f */
29         mov $0x3f3f3f3f3f3f3f3f, %rbx
30         movq %rbx, %xmm3
31         pslldq $8, %xmm3
32         movq %rbx, %xmm3
33
34         //c+min_t-'A'
35         paddb %xmm3, %xmm4
36
37         /*"Packed COMpare Greater Than (Byte)"
38         * X = 'Z' + 1 + min_t - 'A' > c + min_t - 'A' ? 0xff : 0
39         * achtung beim intuitiven lesen des befehles. 'kleiner' 
40         * ist mit 'groesser' vertauscht und vice versa */
41         pcmpgtb %xmm4, %xmm1
42
43         //Y = min(X, 'a' - 'A')
44         pminub %xmm2, %xmm1
45
46         //c += Y
47         paddb %xmm1, %xmm5
48
49         //retuniere an die richtige speicheradresse
50         mov %rdi, %rax
51         movapd %xmm5, (%rax)
52         ret
53 .LFE2:
54         .size   asma, .-asma
55         .section        .eh_frame,"a",@progbits
56 .Lframe1:
57         .long   .LECIE1-.LSCIE1
58 .LSCIE1:
59         .long   0x0
60         .byte   0x1
61         .string "zR"
62         .uleb128 0x1
63         .sleb128 -8
64         .byte   0x10
65         .uleb128 0x1
66         .byte   0x3
67         .byte   0xc
68         .uleb128 0x7
69         .uleb128 0x8
70         .byte   0x90
71         .uleb128 0x1
72         .align 8
73 .LECIE1:
74 .LSFDE1:
75         .long   .LEFDE1-.LASFDE1
76 .LASFDE1:
77         .long   .LASFDE1-.Lframe1
78         .long   .LFB2
79         .long   .LFE2-.LFB2
80         .uleb128 0x0
81         .align 8
82 .LEFDE1:
83         .ident  "GCC: (Debian 4.3.2-1.1) 4.3.2"
84         .section        .note.GNU-stack,"",@progbits