copyleft: gplv3 added and set repo to public
[calu.git] / progs / deepjit.s
index 871879aed2da7e32eaa8a5c86586a324a33808ed..cb946a73611dfe9ba2de575babfca740b2854979 100644 (file)
@@ -1,3 +1,24 @@
+;    `Deep Thought', a softcore CPU implemented on a FPGA
+;
+;   Copyright (C) 2010 Markus Hofstaetter <markus.manrow@gmx.at>
+;   Copyright (C) 2010 Martin Perner <e0725782@student.tuwien.ac.at>
+;   Copyright (C) 2010 Stefan Rebernig <stefan.rebernig@gmail.com>
+;   Copyright (C) 2010 Manfred Schwarz <e0725898@student.tuwien.ac.at>
+;   Copyright (C) 2010 Bernhard Urban <lewurm@gmail.com>
+;
+;   This program is free software: you can redistribute it and/or modify
+;   it under the terms of the GNU General Public License as published by
+;   the Free Software Foundation, either version 3 of the License, or
+;   (at your option) any later version.
+;
+;   This program is distributed in the hope that it will be useful,
+;   but WITHOUT ANY WARRANTY; without even the implied warranty of
+;   MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
+;   GNU General Public License for more details.
+;
+;   You should have received a copy of the GNU General Public License
+;   along with this program.  If not, see <http://www.gnu.org/licenses/>.
+
 #define PROGINSTR stw r0, PDATA(r13)
 #include "dt_inc.s"
 .data
@@ -22,20 +43,16 @@ inputdata:
 ;* 8
 .fill 1, 0x2A38
 
-stack:
-.fill 256, 0
-
 ;needed for jumps
 ;assuming that no more than 42 instr are used
 instrtable:
 .fill 42, 0
 
 prog_eof:
-.ifill pop r0
+.ifill pop r7
 .ifill ret+
 
 prog_mul:
-.ifill pop r6
 .ifill pop r7
 .ifill ldis r8, 0;0xed400004
 .ifill mov r0, r7;0xe1038000
@@ -48,60 +65,51 @@ prog_mul:
 .ifill adddnz r8, r8, r6;0x00443001
 .ifill subi r7, r7, 2;0xe1bb8010
 .fill 0x0b7ffe83;brnz+ loop
-.ifill push r8
+.ifill mov r6, r8
 
 prog_consts:
-.fill 0xed300004;ldis r6, CONST
 .ifill push r6
+.fill 0xed300004;ldis r6, CONST
 
 prog_add:
-.ifill pop r6
 .ifill pop r7
-.ifill add r7, r7, r6;0xe03bb000
-.ifill push r7
+.ifill add r6, r7, r6;0xe03bb000
 
 prog_sub:
-.ifill pop r6
 .ifill pop r7
 .ifill sub r7, r7, r6;0xe0bbb000
-.ifill push r7
+.ifill mov r6, r7
 
 prog_lessthan:
-.ifill pop r6
 .ifill pop r7
 .ifill cmp r7, r6;0xec3b0000
-.ifill pushlt r14
-.ifill pushge r15
+.ifill movdlt r6, r14
+.ifill movge r6, r15
 
 prog_dup:
-.ifill fetch r6
 .ifill push r6
 
 prog_jmp:
-.ifill pop r6
 .ifill cmpi r6,0;0xecb00000
+.ifill pop r6
 ;static calced
-.fill 1, 0x1b000103;breq- vm_next
-.fill 1, 0xeb000003;br+ CONST
+.fill 1, 0x0b000003;brne+ CONST
 
 prog_imm:
-.fill 1, 0xed400000;ldil r6, CONST
-.fill 1, 0xed400002;ldih r6, CONST
 .ifill push r6
+.fill 1, 0xed300000;ldil r6, CONST
+.fill 1, 0xed300002;ldih r6, CONST
 
 prog_pop:
-.ifill disc
+.ifill pop r6
 
 prog_xch:
-.ifill pop r6
 .ifill pop r7
 .ifill push r6
-.ifill push r7
+.ifill mov r6, r7
 
 prog_not:
-.ifill pop r6
 .ifill not r6;0xe4b7fffa
-.ifill push r6
 
 .text
 .org 0
@@ -116,8 +124,13 @@ main:
        call+ u_init
        call+ u_recv_byte
 
-       ldis r1, 0x48
-       call+ u_send_byte
+       ; benchprolog
+       call t_init
+       call t_stop
+       ldis r1, 0
+       call t_valset
+       call t_start
+       ; /benchprolog
 
        ;set address of input
        ldis r1, inputdata@lo
@@ -156,10 +169,25 @@ main:
        ;call jit'ed prog
        call+ prog_start
 
+       ; benchepilog
+       push r6
+       call+ t_init
+       call+ t_stop
+       call+ t_valget
+       subi r0, r0, 0xc ; offset abziehen
+       pop r3
+       push r0
+       push r3
+       ; /benchepilog
+
+       ;send result
        call+ u_init
-
-       mov r1, r0
-       call+ u_send_byte
+       pop r1
+       call u_send_byte
+       call u_send_newline
+       pop r1
+       call u_send_uint
+       call u_send_newline
 
        br+ main
 
@@ -184,14 +212,13 @@ jit:
 
        ;backup defer table address
        mov r10, r9
-       ;decrement address to input by 1
-       subi r1, r1, 1
+       br+ vm_loop_1
 
 vm_default:    
 vm_loop:
        ;increment input address
        addi r1, r1, 1
-
+vm_loop_1:
        ;store address of next instruction in table
        stw r2, 0(r3)
        ;increment instr. table
@@ -222,7 +249,7 @@ vm_eof:
        ldil r7, prog_jmp@lo
        ldih r7, prog_jmp@hi
        ;load branch template
-       ldw r7, 12(r7)
+       ldw r7, 8(r7)
 
        ;if actual and base are equal, no entry
        cmp r9, r10
@@ -252,7 +279,7 @@ vm_defer:
        addi r10, r10, 8
        cmp r10, r9
        reteq+
-       brnq- vm_defer
+       br+ vm_defer
 
 ;case *
 ;42
@@ -282,11 +309,9 @@ vm_mul:
        PROGINSTR
        ldw r0, 44(r14)
        PROGINSTR
-       ldw r0, 48(r14)
-       PROGINSTR
 
        ;increment address
-       addi r2, r2, 13
+       addi r2, r2, 12
 
        br+ vm_loop
 
@@ -302,13 +327,9 @@ vm_add:
        PROGINSTR
        ldw r0, 4(r4)
        PROGINSTR
-       ldw r0, 8(r4)
-       PROGINSTR
-       ldw r0, 12(r4)
-       PROGINSTR
 
        ;increment address
-       addi r2, r2, 4
+       addi r2, r2, 2
 
        br+ vm_loop
 
@@ -326,11 +347,9 @@ vm_sub:
        PROGINSTR
        ldw r0, 8(r4)
        PROGINSTR
-       ldw r0, 12(r4)
-       PROGINSTR
 
        ;increment address
-       addi r2, r2, 4
+       addi r2, r2, 3
 
        br+ vm_loop
 
@@ -339,6 +358,8 @@ vm_sub:
 vm_consts:
        ;program instruction (3)
        ldw r0, 0(r15)
+       PROGINSTR
+       ldw r0, 4(r15)
        ;the first instr. loads r6 with the number
        ;thus we shall emulate this
 
@@ -352,8 +373,6 @@ vm_consts:
 
        ;store this 'dynamic' instruction
        PROGINSTR
-       ldw r0, 4(r15)
-       PROGINSTR
 
        ;increment address
        addi r2, r2, 2
@@ -376,11 +395,9 @@ vm_lessthan:
        PROGINSTR
        ldw r0, 12(r4)
        PROGINSTR
-       ldw r0, 16(r4)
-       PROGINSTR
 
        ;increment address
-       addi r2, r2, 5
+       addi r2, r2, 4
 
        br+ vm_loop
 
@@ -393,11 +410,9 @@ vm_dup:
        ;program instruction (3)
        ldw r0, 0(r4)
        PROGINSTR
-       ldw r0, 4(r4)
-       PROGINSTR
 
        ;increment address
-       addi r2, r2, 2
+       addi r2, r2, 1
 
        br+ vm_loop
 
@@ -433,29 +448,26 @@ vm_imm:
        ldil r4, prog_imm@lo
        ldih r4, prog_imm@hi
 
+       ldw r0, 0(r4)
+       PROGINSTR
+
        ;save r6 to r7
        mov r7, r6
 
        ;generate 1st instr
-       ldw r0, 0(r4)
+       ldw r0, 4(r4)
        andx r6, 0xFFFF
        lls r6, r6, 3
        or r0, r0, r6
        PROGINSTR
 
        ;generate 2nd instr
-       ldw r0, 4(r4)
+       ldw r0, 8(r4)
        andxh r7, 0xFFFF
        lrs r7, r7, 13
        or r0, r0, r7
        PROGINSTR
 
-       ;now we program the instructions that will save the
-       ;immediate onto the stack and increment the later
-
-       ldw r0, 8(r4)
-       PROGINSTR
-
        ;increment address
        addi r2, r2, 3
 
@@ -475,23 +487,18 @@ vm_jmp:
        ldil r4, prog_jmp@lo
        ldih r4, prog_jmp@hi
 
-       ;program instruction (2)
-       ;pop r6
-       ldw r0, 0(r4)
-       PROGINSTR
-
        ;compare to 0
        ;cmpi r6,0
-       ldw r0, 4(r4)
+       ldw r0, 0(r4)
        PROGINSTR
 
-       ;breq+ vm_next
-       ;is statically known
-       ldw r0, 8(r4)
+       ;program instruction (2)
+       ;pop r6
+       ldw r0, 4(r4)
        PROGINSTR
 
        ;we add the offset to this instruction
-       addi r8, r2, 3
+       addi r8, r2, 2
 
 
        ;we know calculate the jump destination
@@ -528,12 +535,12 @@ vm_jmp:
        ;shift to the position of imm in br
        lls r8, r8, 7
        ;load template br
-       ldw r0, 12(r4)
+       ldw r0, 8(r4)
        or r0, r0, r8
        PROGINSTR
 
        ;increment address
-       addi r2, r2, 4
+       addi r2, r2, 3
 
        br+ vm_loop
 
@@ -559,7 +566,7 @@ vm_possign:
        ;increment defer table address
        addi r9, r9, 8
        ;increment address
-       addi r2, r2, 4
+       addi r2, r2, 3
        br+ vm_loop
 
 ;case P
@@ -592,11 +599,9 @@ vm_xch:
        PROGINSTR
        ldw r0, 8(r4)
        PROGINSTR
-       ldw r0, 12(r4)
-       PROGINSTR
 
        ;increment address
-       addi r2, r2, 4
+       addi r2, r2, 3
 
        br+ vm_loop
 
@@ -610,17 +615,12 @@ vm_not:
        ;program instruction (3)
        ldw r0, 0(r4)
        PROGINSTR
-       ldw r0, 4(r4)
-       PROGINSTR
-       ldw r0, 8(r4)
-       PROGINSTR
 
        ;increment address
-       addi r2, r2, 3
+       addi r2, r2, 1
 
        br+ vm_loop
 
-prog_start:
 
 .data
 jumptable: