Fix MB calculation in the reporting of the MTRR hole
[coreboot.git] / src / cpu / x86 / mtrr / mtrr.c
1 /*
2  * mtrr.c: setting MTRR to decent values for cache initialization on P6
3  *
4  * Derived from intel_set_mtrr in intel_subr.c and mtrr.c in linux kernel
5  *
6  * Copyright 2000 Silicon Integrated System Corporation
7  *
8  *      This program is free software; you can redistribute it and/or modify
9  *      it under the terms of the GNU General Public License as published by
10  *      the Free Software Foundation; either version 2 of the License, or
11  *      (at your option) any later version.
12  *
13  *      This program is distributed in the hope that it will be useful,
14  *      but WITHOUT ANY WARRANTY; without even the implied warranty of
15  *      MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
16  *      GNU General Public License for more details.
17  *
18  *      You should have received a copy of the GNU General Public License
19  *      along with this program; if not, write to the Free Software
20  *      Foundation, Inc., 675 Mass Ave, Cambridge, MA 02139, USA.
21  *
22  *
23  * Reference: Intel Architecture Software Developer's Manual, Volume 3: System Programming
24  */
25
26 /*
27         2005.1 yhlu add NC support to spare mtrrs for 64G memory above installed
28         2005.6 Eric add address bit in x86_setup_mtrrs
29         2005.6 yhlu split x86_setup_var_mtrrs and x86_setup_fixed_mtrrs,
30                 for AMD, it will not use x86_setup_fixed_mtrrs
31 */
32
33 #include <stddef.h>
34 #include <console/console.h>
35 #include <device/device.h>
36 #include <cpu/x86/msr.h>
37 #include <cpu/x86/mtrr.h>
38 #include <cpu/x86/cache.h>
39 #include <cpu/x86/lapic.h>
40 #include <arch/cpu.h>
41 #include <arch/acpi.h>
42
43 #if CONFIG_GFXUMA
44 extern uint64_t uma_memory_base, uma_memory_size;
45 #endif
46
47 static unsigned int mtrr_msr[] = {
48         MTRRfix64K_00000_MSR, MTRRfix16K_80000_MSR, MTRRfix16K_A0000_MSR,
49         MTRRfix4K_C0000_MSR, MTRRfix4K_C8000_MSR, MTRRfix4K_D0000_MSR, MTRRfix4K_D8000_MSR,
50         MTRRfix4K_E0000_MSR, MTRRfix4K_E8000_MSR, MTRRfix4K_F0000_MSR, MTRRfix4K_F8000_MSR,
51 };
52
53 void enable_fixed_mtrr(void)
54 {
55         msr_t msr;
56
57         msr = rdmsr(MTRRdefType_MSR);
58         msr.lo |= 0xc00;
59         wrmsr(MTRRdefType_MSR, msr);
60 }
61
62 static void enable_var_mtrr(void)
63 {
64         msr_t msr;
65
66         msr = rdmsr(MTRRdefType_MSR);
67         msr.lo |= MTRRdefTypeEn;
68         wrmsr(MTRRdefType_MSR, msr);
69 }
70
71 /* setting variable mtrr, comes from linux kernel source */
72 static void set_var_mtrr(
73         unsigned int reg, unsigned long basek, unsigned long sizek,
74         unsigned char type, unsigned address_bits)
75 {
76         msr_t base, mask;
77         unsigned address_mask_high;
78
79         if (reg >= 8)
80                 return;
81
82         // it is recommended that we disable and enable cache when we
83         // do this.
84         if (sizek == 0) {
85                 disable_cache();
86
87                 msr_t zero;
88                 zero.lo = zero.hi = 0;
89                 /* The invalid bit is kept in the mask, so we simply clear the
90                    relevant mask register to disable a range. */
91                 wrmsr (MTRRphysMask_MSR(reg), zero);
92
93                 enable_cache();
94                 return;
95         }
96
97
98         address_mask_high = ((1u << (address_bits - 32u)) - 1u);
99
100         base.hi = basek >> 22;
101         base.lo  = basek << 10;
102
103         printk(BIOS_SPEW, "ADDRESS_MASK_HIGH=%#x\n", address_mask_high);
104
105         if (sizek < 4*1024*1024) {
106                 mask.hi = address_mask_high;
107                 mask.lo = ~((sizek << 10) -1);
108         }
109         else {
110                 mask.hi = address_mask_high & (~((sizek >> 22) -1));
111                 mask.lo = 0;
112         }
113
114         // it is recommended that we disable and enable cache when we
115         // do this.
116         disable_cache();
117
118         /* Bit 32-35 of MTRRphysMask should be set to 1 */
119         base.lo |= type;
120         mask.lo |= MTRRphysMaskValid;
121         wrmsr (MTRRphysBase_MSR(reg), base);
122         wrmsr (MTRRphysMask_MSR(reg), mask);
123
124         enable_cache();
125 }
126
127 /* fms: find most sigificant bit set, stolen from Linux Kernel Source. */
128 static inline unsigned int fms(unsigned int x)
129 {
130         int r;
131
132         __asm__("bsrl %1,%0\n\t"
133                 "jnz 1f\n\t"
134                 "movl $0,%0\n"
135                 "1:" : "=r" (r) : "g" (x));
136         return r;
137 }
138
139 /* fls: find least sigificant bit set */
140 static inline unsigned int fls(unsigned int x)
141 {
142         int r;
143
144         __asm__("bsfl %1,%0\n\t"
145                 "jnz 1f\n\t"
146                 "movl $32,%0\n"
147                 "1:" : "=r" (r) : "g" (x));
148         return r;
149 }
150
151 /* setting up variable and fixed mtrr
152  *
153  * From Intel Vol. III Section 9.12.4, the Range Size and Base Alignment has some kind of requirement:
154  *      1. The range size must be 2^N byte for N >= 12 (i.e 4KB minimum).
155  *      2. The base address must be 2^N aligned, where the N here is equal to the N in previous
156  *         requirement. So a 8K range must be 8K aligned not 4K aligned.
157  *
158  * These requirement is meet by "decompositing" the ramsize into Sum(Cn * 2^n, n = [0..N], Cn = [0, 1]).
159  * For Cm = 1, there is a WB range of 2^m size at base address Sum(Cm * 2^m, m = [N..n]).
160  * A 124MB (128MB - 4MB SMA) example:
161  *      ramsize = 124MB == 64MB (at 0MB) + 32MB (at 64MB) + 16MB (at 96MB ) + 8MB (at 112MB) + 4MB (120MB).
162  * But this wastes a lot of MTRR registers so we use another more "aggresive" way with Uncacheable Regions.
163  *
164  * In the Uncacheable Region scheme, we try to cover the whole ramsize by one WB region as possible,
165  * If (an only if) this can not be done we will try to decomposite the ramesize, the mathematical formula
166  * whould be ramsize = Sum(Cn * 2^n, n = [0..N], Cn = [-1, 0, 1]). For Cn = -1, a Uncachable Region is used.
167  * The same 124MB example:
168  *      ramsize = 124MB == 128MB WB (at 0MB) + 4MB UC (at 124MB)
169  * or a 156MB (128MB + 32MB - 4MB SMA) example:
170  *      ramsize = 156MB == 128MB WB (at 0MB) + 32MB WB (at 128MB) + 4MB UC (at 156MB)
171  */
172 /* 2 MTRRS are reserved for the operating system */
173 #if 1
174 #define BIOS_MTRRS 6
175 #define OS_MTRRS   2
176 #else
177 #define BIOS_MTRRS 8
178 #define OS_MTRRS   0
179 #endif
180 #define MTRRS        (BIOS_MTRRS + OS_MTRRS)
181
182 static int total_mtrrs = MTRRS;
183 static int bios_mtrrs = BIOS_MTRRS;
184
185 static void detect_var_mtrrs(void)
186 {
187         msr_t msr;
188
189         msr = rdmsr(MTRRcap_MSR);
190
191         total_mtrrs = msr.lo & 0xff;
192         bios_mtrrs = total_mtrrs - 2;
193 }
194
195 static void set_fixed_mtrrs(unsigned int first, unsigned int last, unsigned char type)
196 {
197         unsigned int i;
198         unsigned int fixed_msr = NUM_FIXED_RANGES >> 3;
199         msr_t msr;
200         msr.lo = msr.hi = 0; /* Shut up gcc */
201         for(i = first; i < last; i++) {
202                 /* When I switch to a new msr read it in */
203                 if (fixed_msr != i >> 3) {
204                         /* But first write out the old msr */
205                         if (fixed_msr < (NUM_FIXED_RANGES >> 3)) {
206                                 disable_cache();
207                                 wrmsr(mtrr_msr[fixed_msr], msr);
208                                 enable_cache();
209                         }
210                         fixed_msr = i>>3;
211                         msr = rdmsr(mtrr_msr[fixed_msr]);
212                 }
213                 if ((i & 7) < 4) {
214                         msr.lo &= ~(0xff << ((i&3)*8));
215                         msr.lo |= type << ((i&3)*8);
216                 } else {
217                         msr.hi &= ~(0xff << ((i&3)*8));
218                         msr.hi |= type << ((i&3)*8);
219                 }
220         }
221         /* Write out the final msr */
222         if (fixed_msr < (NUM_FIXED_RANGES >> 3)) {
223                 disable_cache();
224                 wrmsr(mtrr_msr[fixed_msr], msr);
225                 enable_cache();
226         }
227 }
228
229 static unsigned fixed_mtrr_index(unsigned long addrk)
230 {
231         unsigned index;
232         index = (addrk - 0) >> 6;
233         if (index >= 8) {
234                 index = ((addrk - 8*64) >> 4) + 8;
235         }
236         if (index >= 24) {
237                 index = ((addrk - (8*64 + 16*16)) >> 2) + 24;
238         }
239         if (index > NUM_FIXED_RANGES) {
240                 index = NUM_FIXED_RANGES;
241         }
242         return index;
243 }
244
245 static unsigned int range_to_mtrr(unsigned int reg,
246         unsigned long range_startk, unsigned long range_sizek,
247         unsigned long next_range_startk, unsigned char type,
248         unsigned int address_bits, unsigned int above4gb)
249 {
250         unsigned long hole_startk = 0, hole_sizek = 0;
251
252         if (!range_sizek) {
253                 /* If there's no MTRR hole, this function will bail out
254                  * here when called for the hole.
255                  */
256                 printk(BIOS_SPEW, "Zero-sized MTRR range @%ldKB\n", range_startk);
257                 return reg;
258         }
259
260         if (reg >= bios_mtrrs) {
261                 printk(BIOS_ERR, "Warning: Out of MTRRs for base: %4ldMB, range: %ldMB, type %s\n",
262                                 range_startk >>10, range_sizek >> 10,
263                                 (type==MTRR_TYPE_UNCACHEABLE)?"UC":
264                                    ((type==MTRR_TYPE_WRBACK)?"WB":"Other") );
265                 return reg;
266         }
267
268         if (above4gb == 2 && type == MTRR_TYPE_WRBACK && range_sizek % 0x4000) {
269                 /*
270                  * If this range is not divisible by 16MB then instead
271                  * make a larger range and carve out an uncached hole.
272                  */
273                 hole_startk = range_startk + range_sizek;
274                 hole_sizek = 0x4000 - (range_sizek % 0x4000);
275                 range_sizek += hole_sizek;
276         }
277
278         while(range_sizek) {
279                 unsigned long max_align, align;
280                 unsigned long sizek;
281                 /* Compute the maximum size I can make a range */
282                 max_align = fls(range_startk);
283                 align = fms(range_sizek);
284                 if (align > max_align) {
285                         align = max_align;
286                 }
287                 sizek = 1 << align;
288                 printk(BIOS_DEBUG, "Setting variable MTRR %d, base: %4ldMB, range: %4ldMB, type %s\n",
289                         reg, range_startk >>10, sizek >> 10,
290                         (type==MTRR_TYPE_UNCACHEABLE)?"UC":
291                             ((type==MTRR_TYPE_WRBACK)?"WB":"Other")
292                         );
293
294                 /* if range is above 4GB, MTRR is needed
295                  * only if above4gb flag is set
296                  */
297                 if (range_startk < 0x100000000ull / 1024 || above4gb)
298                         set_var_mtrr(reg++, range_startk, sizek, type, address_bits);
299                 range_startk += sizek;
300                 range_sizek -= sizek;
301                 if (reg >= bios_mtrrs) {
302                         printk(BIOS_ERR, "Running out of variable MTRRs!\n");
303                         break;
304                 }
305         }
306
307         if (hole_sizek) {
308                 printk(BIOS_DEBUG, "Adding hole at %ldMB-%ldMB\n",
309                        hole_startk >> 10, (hole_startk + hole_sizek) >> 10);
310                 reg = range_to_mtrr(reg, hole_startk, hole_sizek,
311                               next_range_startk, MTRR_TYPE_UNCACHEABLE,
312                               address_bits, above4gb);
313         }
314
315         return reg;
316 }
317
318 static unsigned long resk(uint64_t value)
319 {
320         unsigned long resultk;
321         if (value < (1ULL << 42)) {
322                 resultk = value >> 10;
323         }
324         else {
325                 resultk = 0xffffffff;
326         }
327         return resultk;
328 }
329
330 static void set_fixed_mtrr_resource(void *gp, struct device *dev, struct resource *res)
331 {
332         unsigned int start_mtrr;
333         unsigned int last_mtrr;
334         start_mtrr = fixed_mtrr_index(resk(res->base));
335         last_mtrr  = fixed_mtrr_index(resk((res->base + res->size)));
336         if (start_mtrr >= NUM_FIXED_RANGES) {
337                 return;
338         }
339         printk(BIOS_DEBUG, "Setting fixed MTRRs(%d-%d) Type: WB\n",
340                 start_mtrr, last_mtrr);
341         set_fixed_mtrrs(start_mtrr, last_mtrr, MTRR_TYPE_WRBACK);
342
343 }
344
345 #ifndef CONFIG_VAR_MTRR_HOLE
346 #define CONFIG_VAR_MTRR_HOLE 1
347 #endif
348
349 struct var_mtrr_state {
350         unsigned long range_startk, range_sizek;
351         unsigned int reg;
352         unsigned long hole_startk, hole_sizek;
353         unsigned int address_bits;
354         unsigned int above4gb; /* Set if MTRRs are needed for DRAM above 4GB */
355 };
356
357 void set_var_mtrr_resource(void *gp, struct device *dev, struct resource *res)
358 {
359         struct var_mtrr_state *state = gp;
360         unsigned long basek, sizek;
361         if (state->reg >= bios_mtrrs)
362                 return;
363         basek = resk(res->base);
364         sizek = resk(res->size);
365         /* See if I can merge with the last range
366          * Either I am below 1M and the fixed mtrrs handle it, or
367          * the ranges touch.
368          */
369         if ((basek <= 1024) || (state->range_startk + state->range_sizek == basek)) {
370                 unsigned long endk = basek + sizek;
371                 state->range_sizek = endk - state->range_startk;
372                 return;
373         }
374         /* Write the range mtrrs */
375         if (state->range_sizek != 0) {
376 #if CONFIG_VAR_MTRR_HOLE
377                 if (state->hole_sizek == 0 && state->above4gb != 2) {
378                         /* We need to put that on to hole */
379                         unsigned long endk = basek + sizek;
380                         state->hole_startk = state->range_startk + state->range_sizek;
381                         state->hole_sizek  = basek - state->hole_startk;
382                         state->range_sizek = endk - state->range_startk;
383                         return;
384                 }
385 #endif
386                 state->reg = range_to_mtrr(state->reg, state->range_startk,
387                         state->range_sizek, basek, MTRR_TYPE_WRBACK,
388                         state->address_bits, state->above4gb);
389 #if CONFIG_VAR_MTRR_HOLE
390                 state->reg = range_to_mtrr(state->reg, state->hole_startk,
391                         state->hole_sizek, basek, MTRR_TYPE_UNCACHEABLE,
392                         state->address_bits, state->above4gb);
393 #endif
394                 state->range_startk = 0;
395                 state->range_sizek = 0;
396                 state->hole_startk = 0;
397                 state->hole_sizek = 0;
398         }
399         /* Allocate an msr */
400         printk(BIOS_SPEW, " Allocate an msr - basek = %08lx, sizek = %08lx,\n", basek, sizek);
401         state->range_startk = basek;
402         state->range_sizek  = sizek;
403 }
404
405 void x86_setup_fixed_mtrrs(void)
406 {
407         /* Try this the simple way of incrementally adding together
408          * mtrrs.  If this doesn't work out we can get smart again
409          * and clear out the mtrrs.
410          */
411
412         printk(BIOS_DEBUG, "\n");
413         /* Initialized the fixed_mtrrs to uncached */
414         printk(BIOS_DEBUG, "Setting fixed MTRRs(%d-%d) Type: UC\n",
415                 0, NUM_FIXED_RANGES);
416         set_fixed_mtrrs(0, NUM_FIXED_RANGES, MTRR_TYPE_UNCACHEABLE);
417
418         /* Now see which of the fixed mtrrs cover ram.
419                  */
420         search_global_resources(
421                 IORESOURCE_MEM | IORESOURCE_CACHEABLE, IORESOURCE_MEM | IORESOURCE_CACHEABLE,
422                 set_fixed_mtrr_resource, NULL);
423         printk(BIOS_DEBUG, "DONE fixed MTRRs\n");
424
425         /* enable fixed MTRR */
426         printk(BIOS_SPEW, "call enable_fixed_mtrr()\n");
427         enable_fixed_mtrr();
428
429 }
430
431 void x86_setup_var_mtrrs(unsigned int address_bits, unsigned int above4gb)
432 /* this routine needs to know how many address bits a given processor
433  * supports.  CPUs get grumpy when you set too many bits in
434  * their mtrr registers :(  I would generically call cpuid here
435  * and find out how many physically supported but some cpus are
436  * buggy, and report more bits then they actually support.
437  * If above4gb flag is set, variable MTRR ranges must be used to
438  * set cacheability of DRAM above 4GB. If above4gb flag is clear,
439  * some other mechanism is controlling cacheability of DRAM above 4GB.
440  */
441 {
442         /* Try this the simple way of incrementally adding together
443          * mtrrs.  If this doesn't work out we can get smart again
444          * and clear out the mtrrs.
445          */
446         struct var_mtrr_state var_state;
447
448         /* Cache as many memory areas as possible */
449         /* FIXME is there an algorithm for computing the optimal set of mtrrs?
450          * In some cases it is definitely possible to do better.
451          */
452         var_state.range_startk = 0;
453         var_state.range_sizek = 0;
454         var_state.hole_startk = 0;
455         var_state.hole_sizek = 0;
456         var_state.reg = 0;
457         var_state.address_bits = address_bits;
458         var_state.above4gb = above4gb;
459
460         /* Detect number of variable MTRRs */
461         if (above4gb == 2)
462                 detect_var_mtrrs();
463
464         search_global_resources(
465                 IORESOURCE_MEM | IORESOURCE_CACHEABLE, IORESOURCE_MEM | IORESOURCE_CACHEABLE,
466                 set_var_mtrr_resource, &var_state);
467
468 #if (CONFIG_GFXUMA == 1) /* UMA or SP. */
469         /* For now we assume the UMA space is at the end of memory below 4GB */
470         if (var_state.hole_startk || var_state.hole_sizek) {
471                 printk(BIOS_DEBUG, "Warning: Can't set up MTRR hole for UMA due to pre-existing MTRR hole.\n");
472         } else {
473 #if CONFIG_VAR_MTRR_HOLE
474                 // Increase the base range and set up UMA as an UC hole instead
475                 if (above4gb != 2)
476                         var_state.range_sizek += (uma_memory_size >> 10);
477
478                 var_state.hole_startk = (uma_memory_base >> 10);
479                 var_state.hole_sizek = (uma_memory_size >> 10);
480 #endif
481         }
482 #endif
483         /* Write the last range */
484         var_state.reg = range_to_mtrr(var_state.reg, var_state.range_startk,
485                 var_state.range_sizek, 0, MTRR_TYPE_WRBACK,
486                 var_state.address_bits, var_state.above4gb);
487 #if CONFIG_VAR_MTRR_HOLE
488         var_state.reg = range_to_mtrr(var_state.reg, var_state.hole_startk,
489                 var_state.hole_sizek, 0, MTRR_TYPE_UNCACHEABLE,
490                 var_state.address_bits, var_state.above4gb);
491 #endif
492         printk(BIOS_DEBUG, "DONE variable MTRRs\n");
493         printk(BIOS_DEBUG, "Clear out the extra MTRR's\n");
494         /* Clear out the extra MTRR's */
495         while(var_state.reg < total_mtrrs) {
496                 set_var_mtrr(var_state.reg++, 0, 0, 0, var_state.address_bits);
497         }
498
499 #if CONFIG_CACHE_ROM
500         /* Enable Caching and speculative Reads for the
501          * complete ROM now that we actually have RAM.
502          */
503         if (boot_cpu() && (acpi_slp_type != 3)) {
504                 set_var_mtrr(total_mtrrs-1, (4096-4)*1024, 4*1024,
505                         MTRR_TYPE_WRPROT, address_bits);
506         }
507 #endif
508
509         printk(BIOS_SPEW, "call enable_var_mtrr()\n");
510         enable_var_mtrr();
511         printk(BIOS_SPEW, "Leave %s\n", __func__);
512         post_code(0x6A);
513 }
514
515
516 void x86_setup_mtrrs(void)
517 {
518         int address_size;
519         x86_setup_fixed_mtrrs();
520         address_size = cpu_phys_address_size();
521         printk(BIOS_DEBUG, "CPU physical address size: %d bits\n", address_size);
522         x86_setup_var_mtrrs(address_size, 1);
523 }
524
525
526 int x86_mtrr_check(void)
527 {
528         /* Only Pentium Pro and later have MTRR */
529         msr_t msr;
530         printk(BIOS_DEBUG, "\nMTRR check\n");
531
532         msr = rdmsr(0x2ff);
533         msr.lo >>= 10;
534
535         printk(BIOS_DEBUG, "Fixed MTRRs   : ");
536         if (msr.lo & 0x01)
537                 printk(BIOS_DEBUG, "Enabled\n");
538         else
539                 printk(BIOS_DEBUG, "Disabled\n");
540
541         printk(BIOS_DEBUG, "Variable MTRRs: ");
542         if (msr.lo & 0x02)
543                 printk(BIOS_DEBUG, "Enabled\n");
544         else
545                 printk(BIOS_DEBUG, "Disabled\n");
546
547         printk(BIOS_DEBUG, "\n");
548
549         post_code(0x93);
550         return ((int) msr.lo);
551 }