# # @LCID # mapping_entries # # - *FrenchSort # it means the culture has French sorting # - S = D # it means source S is considered as equivalent to D # - S : cc pp ss tt ii # it means source S has a sortkey. For level 2 and 3, * can be # used to indicate that it copies the corresponding weight of # the first character of S. # # Level 4 tailorings is not supported (it is logically done). # # Non-primary destination value is not allowed in a sortkey mapping. # FIXME: it should be rejected in the table generator code. # # Shifted characters (level 5) cannot be specified (even by setting category # as 6). # @127 # invariant mappings \u00C6 = AE \u00DE = TH \u00DF = ss \u00E6 = ae \u00FE = th \u0132 = IJ \u0133 = ij \u0152 = OE \u0153 = oe \u01C4 = DZ\u030C # surprisingly Windows works fine here \u01C5 = Dz\u030C \u01C6 = dz\u030C \u01C7 = LJ \u01C8 = Lj \u01C9 = lj \u01CA = NJ \u01CB = Nj \u01CC = nj \u01E2 = A\u0304E\u0304 # LAMESPEC should be \u00C6\u0304 \u01E3 = a\u0304e\u0304 # LAMESPEC should be \u00E6\u0304 \u01F1 = DZ \u01F2 = Dz \u01F3 = dz \u01FC = A\u0301E\u0301 # LAMESPEC should be \u00C6\u0301 \u01FD = a\u0301e\u0301 # LAMESPEC should be \u00C6\u0301 \u05F0 = \u05D5\u05D5 \u05F1 = \u05D5\u05D9 \u05F2 = \u05D9\u05D9 \uFB00 = ff \uFB01 = fi \uFB02 = fl \uFB03 = ffi \uFB04 = ffl \uFB05 = \u017Ft # required at least for Estonian \uFB06 = st # pronounciation-based Chinese (4) # FIXME: enable them after zh-CHS tailoring is added. @2052 = 4 # zh-CN = zh-CHS @4100 = 4 # zh-SG = zh-CHS @5124 = 4 # zh-MO = zh-CHS # stroke-count-based Chinese : zh-CHT (31748) # FIXME: enable them after zh-CHT tailoring is added. @1028 = 31748 # zh-TW = zh-CHT @3076 = 31748 # zh-HK = zh-CHT # other aliases @20 = 6 # no = da @29 = 11 # sv = fi @31770 = 26 # sr = hr @2092 # az-AZ-Cyrl \u042B : 10 31 * * \u044B : 10 31 * * \u04BA : 10 6B * * \u04BB : 10 6B * * #@3 ca : contraction "ch" and "ll" are not handled @4 # zh-CHS : actually no mapping is required, but needed for aliases @5 # cs ch : 0E 2E 01 01 \u010C : 0E 0C 01 * \u010D : 0E 0C 01 * \u017D : 0E AD 01 * \u017E : 0E AD 01 * \u0158 : 0E 8D 01 * \u0159 : 0E 8D 01 * \u0160 : 0E 97 01 * \u0161 : 0E 97 01 * \u017D : 0E AD 01 * \u017E : 0E AD 01 * \u0308 : 01 03 * * # Actually it seems the same as the secondary change *Diacritical 13 -> 5 # GRAVE *Diacritical 10 -> 4 # DOT ABOVE *Diacritical 11 -> 4 # MIDDLE DOT @6 # da AA : 0E B1 01 1A Aa : 0E B1 01 12 aa : 0E B1 01 01 \u00C4 : 0E AC * * \u00E4 : 0E AC * * \u00C6 : 0E AC 01 12 \u00E6 : 0E AC 01 01 \u01E2 : 0E AC 03 * \u01E3 : 0E AC 03 * \u00C5 : 0E B1 * * \u00E5 : 0E B1 * * \u00D6 : 0E AE * * \u00D8 : 0E AE * * \u00F6 : 0E AE * * \u00F8 : 0E AE * * \u0150 : 0E AE 1B * \u0151 : 0E AE 1B * \u00DC : 0E A7 7B * \u00FC : 0E A7 7B * \u0170 : 0E A7 1B * \u0171 : 0E A7 1B * @10 # es \u00D1 : 0E 73 01 * \u00F1 : 0E 73 01 * @11 # fi \u0057 : 0E A2 03 * # W \u0077 : 0E A2 03 * # W \u00C4 : 0E AF 01 * \u00C5 : 0E AD 01 * \u00E4 : 0E AF 01 * \u00E5 : 0E AD 01 * \u00D6 : 0E B0 01 * \u00D8 : 0E B0 1E * \u00DC : 0E A7 7B * \u00F6 : 0E B0 01 * \u00F8 : 0E B0 1E * \u00FC : 0E A7 7B * \u0150 : 0E B0 1B * \u0151 : 0E B0 1B * \u0170 : 0E A7 1B * \u0171 : 0E A7 1B * \u0174 : 0E A2 * * \u0175 : 0E A2 * * \u01BF : 0E A2 7B * @12 # fr *FrenchSort @14 # hu CS : 0E 0E 01 1A Cs : 0E 0E 01 12 cs : 0E 0E 01 01 DZ : 0E 1C 01 1A Dz : 0E 1C 01 12 dz : 0E 1C 01 01 GY : 0E 27 01 1A Gy : 0E 27 01 12 gy : 0E 27 01 01 LY : 0E 4C 01 1A Ly : 0E 4C 01 12 ly : 0E 4C 01 01 NY : 0E 75 01 1A Ny : 0E 75 01 12 ny : 0E 75 01 01 SZ : 0E 98 01 1A Sz : 0E 98 01 12 sz : 0E 98 01 01 TY : 0E 9E 01 1A Ty : 0E 9E 01 12 ny : 0E 9E 01 01 ZS : 0E B1 01 1A Zs : 0E B1 01 12 zs : 0E B1 01 01 # maybe *Diacritical 1D -> 1B \u00D6 : 0E 7D 01 * \u00F6 : 0E 7D 01 * \u0150 : 0E 7D 1B * \u0151 : 0E 7D 1B * \u00DC : 0E A1 01 * \u00FC : 0E A1 01 * \u0170 : 0E A1 1B * \u0171 : 0E A1 1B * @15 # is \u00C1 : 0E 04 01 * \u00C6 : 0E AC 01 * \u00C9 : 0E 22 01 * \u00CD : 0E 33 01 * \u00D0 : 0E 1B 01 * \u00D3 : 0E 7D 01 * \u00D6 : 0E AD 01 * \u00D8 : 0E AD 1E * \u00DA : 0E A0 01 * \u00DD : 0E A8 01 * \u00DE : 0E AB 01 * \u00E1 : 0E 04 01 * \u00E6 : 0E AC 01 * \u00E9 : 0E 22 01 * \u00ED : 0E 33 01 * \u00F0 : 0E 7C 0E * \u00F3 : 0E 7C 13 * \u00F6 : 0E AD 01 * \u00F8 : 0E AD 1E * \u00FA : 0E A0 01 * \u00FD : 0E A8 01 * \u00FE : 0E AB 01 * \u01E2 : 0E AC 16 * \u01E3 : 0E AC 16 * \u01FC : 0E 04 22 * \u01FD : 0E 04 22 * @17 # ja \u005C : 0A 05 * * # \u2015 is treated as extender @18 # ko \u005C : 0A 23 * * # FIXME: For Korean FFA0-FFDC the table generator should fill this # area to be equivalent to the corresponding Jamo, and should use # different CodePointIndexer instance than usual CJK indexer. @21 # pl \u00D3 : 0E 7D 01 * \u00F3 : 0E 7D 01 * \u0104 : 0E 04 01 * \u0105 : 0E 04 01 * \u0106 : 0E 0B 01 * \u0107 : 0E 0B 01 * \u0118 : 0E 22 01 * \u0119 : 0E 22 01 * \u0141 : 0E 4C 01 * \u0142 : 0E 4C 01 * \u0143 : 0E 72 01 * \u0144 : 0E 72 01 * \u015A : 0E 97 01 * \u015B : 0E 97 01 * \u0179 : 0E AB 01 * \u017A : 0E AB 01 * \u017B : 0E AC 01 * \u017C : 0E AC 01 * @24 # ro \u00CE : 0E 34 01 * \u00EE : 0E 34 01 * \u0102 : 0E 08 01 * \u0103 : 0E 08 01 * \u015E : 0E 98 01 * \u015F : 0E 98 01 * \u0162 : 0E 9E 01 * \u0163 : 0E 9E 01 * @26 # hr D\u017D : 0E 1D 04 1A D\u017E : 0E 1D 04 12 d\u017E : 0E 1D 04 01 \u0106 : 0E 0C 01 * \u0107 : 0E 0C 01 * \u010C : 0E 0B 01 * \u010D : 0E 0B 01 * \u0110 : 0E 1E 01 * \u0111 : 0E 1E 01 * \u0160 : 0E 97 01 * \u0161 : 0E 97 01 * \u017D : 0E AD 01 * \u017E : 0E AD 01 * \u01C4 : 0E 1D 04 1A \u01C5 : 0E 1D 04 12 \u01C6 : 0E 1D 04 01 \u01C7 : 0E 4A 01 1A \u01C8 : 0E 4A 01 12 \u01C9 : 0E 4A 01 01 \u01CA : 0E 73 01 1A \u01CB : 0E 73 01 12 \u01CC : 0E 73 01 01 \u0306 : 01 03 * * # Actually it seems the same as the secondary change \u030C : 01 01 * * # Actually it seems the same as the secondary change *Diacritical 15 -> 05 *Diacritical 14 -> 04 @27 # sk \u00C4 : 0E 03 01 * \u00D4 : 0E 7D 01 * \u00E4 : 0E 03 01 * \u00F4 : 0E 7D 01 * \u010C : 0E 0C 01 * \u010D : 0E 0C 01 * \u0158 : 0E 8D 01 * \u0159 : 0E 8D 01 * \u0160 : 0E 97 01 * \u0161 : 0E 97 01 * \u017D : 0E AD 01 * \u017E : 0E AD 01 * \u0308 : 01 03 * * # Actually it seems the same as the secondary change *Diacritical 13 -> 05 *Diacritical 10 -> 04 *Diacritical 11 -> 04 @31 # tr I : 0E 31 * * \u00C7 : 0E 0C 01 * \u00D6 : 0E 7D 01 * \u00DC : 0E A1 01 * \u00E7 : 0E 0C 01 * \u00F6 : 0E 7D 01 * \u00FC : 0E A1 01 * \u011E : 0E 26 01 * \u011F : 0E 26 01 * \u0130 : 0E 32 01 * \u0131 : 0E 31 01 * # \u0132 = IJ \u015E : 0E 97 01 * \u015F : 0E 97 01 * \u3390 : 0E 30 01 * \u33CA : 0E 2E 01 * \u33CB : 0E 2F 01 * @34 # uk \u042C : 10 8A * * # [10 7E] \u044C : 10 8A * * # [10 7E] @36 # sl \u0106 : 0E 19 01 * \u0107 : 0E 19 01 * \u010C : 0E 18 01 * \u010D : 0E 18 01 * \u0110 : 0E 20 01 * \u0111 : 0E 20 01 * \u015A : 0E 98 01 * \u015B : 0E 98 01 * \u0160 : 0E 97 01 * \u0161 : 0E 97 01 * \u0179 : 0E AD 01 * \u017A : 0E AD 01 * \u017D : 0E AC 01 * \u017E : 0E AC 01 * @37 # et V : 0E A1 * * W : 0E A1 * * Z : 0E 97 * * v : 0E A1 * * w : 0E A1 * * z : 0E 97 * * \u00C4 : 0E A3 01 * \u00C5 : 0E A2 01 * \u00C6 : 0E A4 01 * \u00DC : 0E A5 01 * \u00E4 : 0E A3 01 * \u00E5 : 0E A2 01 * \u00E6 : 0E A4 01 * \u00FC : 0E A5 01 * \u0160 : 0E 96 01 * \u0161 : 0E 96 01 * \u0160 : 0E 96 01 * \u0179 : 0E 97 0E * \u017A : 0E 97 0E * \u017B : 0E 97 10 * \u017C : 0E 97 10 * \u017D : 0E 98 01 * \u017E : 0E 98 01 * \u017F : 0E 91 03 * @38 # lv \u010C : 0E 0B 01 * \u010D : 0E 0B 01 * \u0122 : 0E 26 01 * \u0123 : 0E 26 01 * \u0136 : 0E 47 01 * \u0137 : 0E 47 01 * \u013B : 0E 49 01 * \u013C : 0E 49 01 * \u0145 : 0E 7B 01 * \u0146 : 0E 7B 01 * \u0160 : 0E 97 01 * \u0160 : 0E 97 01 * \u017D : 0E AB 01 * \u017E : 0E AB 01 * @39 # lt Y : 0E 33 * * y : 0E 33 * * \u010C : 0E 0B 01 * \u010D : 0E 0B 01 * \u0160 : 0E 97 01 * \u0161 : 0E 97 01 * \u017D : 0E AB 01 * \u017E : 0E AB 01 * \uFE39 : 0E 33 * * \uFE59 : 0E 33 * * * Diacritical 1B -> 0F @42 # vi P : 0E 7F * * R : 0E 8B * * p : 0E 7F * * r : 0E 8B * * \u00C2 : 0E 04 01 * \u00CA : 0E 22 01 * \u00CE : 0E 34 01 * \u00D4 : 0E 7D 01 * \u00DB : 0E A1 01 * \u00E2 : 0E 04 01 * \u00EA : 0E 22 01 * \u00EE : 0E 34 01 * \u00F4 : 0E 7D 01 * \u00FB : 0E A1 01 * \u0110 : 0E 1B 01 * \u0111 : 0E 1B 01 * \u01A0 : 0E 1B 01 * \u01A1 : 0E 1B 01 * \u01AF : 0E A0 01 * \u01B0 : 0E A0 01 * \u0300 : 01 01 * * # Actually it seems the same as the secondary change \u0301 : 01 04 * * # Actually it seems the same as the secondary change \u0303 : 01 03 * * # Actually it seems the same as the secondary change \u0309 : 01 01 * * # Actually it seems the same as the secondary change \u0323 : 01 05 * * # Actually it seems the same as the secondary change \u0340 : 01 01 * * # Actually it seems the same as the secondary change \u0341 : 01 04 * * # Actually it seems the same as the secondary change \u1EA4 : 0E 04 06 * \u1EA5 : 0E 04 06 * \u1EA6 : 0E 04 03 * \u1EA7 : 0E 04 03 * \u1EA8 : 0E 04 04 * \u1EA9 : 0E 04 04 * \u1EAA : 0E 04 05 * \u1EAB : 0E 04 05 * \u1EAC : 0E 04 07 * \u1EAD : 0E 04 07 * \u1EAE : 0E 03 06 * \u1EAF : 0E 03 06 * \u1EB0 : 0E 03 03 * \u1EB1 : 0E 03 03 * \u1EB2 : 0E 03 04 * \u1EB3 : 0E 03 04 * \u1EB4 : 0E 03 05 * \u1EB5 : 0E 03 05 * \u1EB6 : 0E 03 07 * \u1EB7 : 0E 03 07 * \u1EB8 : 0E 21 07 * \u1EB9 : 0E 21 07 * \u1EBA : 0E 21 04 * \u1EBB : 0E 21 04 * \u1EBC : 0E 21 05 * \u1EBD : 0E 21 05 * \u1EBE : 0E 22 06 * \u1EBF : 0E 22 06 * \u1EC0 : 0E 22 03 * \u1EC1 : 0E 22 03 * \u1EC2 : 0E 22 04 * \u1EC3 : 0E 22 04 * \u1EC4 : 0E 22 05 * \u1EC5 : 0E 22 05 * \u1EC6 : 0E 22 07 * \u1EC7 : 0E 22 07 * \u1ED0 : 0E 7D 06 * \u1ED1 : 0E 7D 06 * \u1ED2 : 0E 7D 03 * \u1ED3 : 0E 7D 03 * \u1ED4 : 0E 7D 04 * \u1ED5 : 0E 7D 04 * \u1ED6 : 0E 7D 05 * \u1ED7 : 0E 7D 05 * \u1ED8 : 0E 7D 07 * \u1ED9 : 0E 7D 07 * \u1EDA : 0E 7E 06 * \u1EDB : 0E 7E 06 * \u1EDC : 0E 7E 03 * \u1EDD : 0E 7E 03 * \u1EDE : 0E 7E 04 * \u1EDF : 0E 7E 04 * \u1EE0 : 0E 7E 05 * \u1EE1 : 0E 7E 05 * \u1EE2 : 0E 7E 07 * \u1EE3 : 0E 7E 07 * \u1EE8 : 0E A0 06 * \u1EE9 : 0E A0 06 * \u1EEA : 0E A0 03 * \u1EEB : 0E A0 03 * \u1EEC : 0E A0 04 * \u1EED : 0E A0 04 * \u1EEE : 0E A0 05 * \u1EEF : 0E A0 05 * \u1EF0 : 0E A0 07 * \u1EF1 : 0E A0 07 * * Diacritical 0F -> 03 * Diacritical 0E -> 06 * Diacritical 19 -> 05 * Diacritical 58 -> 07 * Diacritical 59 -> 07 * Diacritical 43 -> 04 * Diacritical 44 -> 04 @47 # mk \u0403 : 10 13 * * \u0453 : 10 13 * * \u040C : 10 58 * * \u045C : 10 58 * * @31748 # zh-CHT : actually no mapping is required, but needed for aliases