mcs/gmcs/cs-tokenizer.cs

   1 //\r
   2 // cs-tokenizer.cs: The Tokenizer for the C# compiler\r
   3 //                  This also implements the preprocessor\r
   4 //\r
   5 // Author: Miguel de Icaza (miguel@gnu.org)\r
   6 //\r
   7 // Licensed under the terms of the GNU GPL\r
   8 //\r
   9 // (C) 2001, 2002 Ximian, Inc (http://www.ximian.com)\r
  10 //\r
  11 \r
  12 /*\r
  13  * TODO:\r
  14  *   Make sure we accept the proper Unicode ranges, per the spec.\r
  15  *   Report error 1032\r
  16 */\r
  17 \r
  18 using System;\r
  19 using System.Text;\r
  20 using System.Collections;\r
  21 using System.IO;\r
  22 using System.Globalization;\r
  23 using System.Reflection;\r
  24 \r
  25 namespace Mono.CSharp\r
  26 {\r
  27         /// <summary>\r
  28         ///    Tokenizer for C# source code. \r
  29         /// </summary>\r
  30 \r
  31         public class Tokenizer : yyParser.yyInput\r
  32         {\r
  33                 SeekableStreamReader reader;\r
  34                 public SourceFile ref_name;\r
  35                 public SourceFile file_name;\r
  36                 public int ref_line = 1;\r
  37                 public int line = 1;\r
  38                 public int col = 1;\r
  39                 public int current_token;\r
  40                 bool handle_get_set = false;\r
  41                 bool handle_remove_add = false;\r
  42                 bool handle_assembly = false;\r
  43 \r
  44                 //\r
  45                 // Whether tokens have been seen on this line\r
  46                 //\r
  47                 bool tokens_seen = false;\r
  48 \r
  49                 //\r
  50                 // Whether a token has been seen on the file\r
  51                 // This is needed because `define' is not allowed to be used\r
  52                 // after a token has been seen.\r
  53                 //\r
  54                 bool any_token_seen = false;\r
  55                 static Hashtable tokenValues;\r
  56                 \r
  57                 private static Hashtable TokenValueName\r
  58                 {\r
  59                         get {\r
  60                                 if (tokenValues == null)\r
  61                                         tokenValues = GetTokenValueNameHash ();\r
  62 \r
  63                                 return tokenValues;\r
  64                         }\r
  65                 }\r
  66 \r
  67                 private static Hashtable GetTokenValueNameHash ()\r
  68                 {\r
  69                         Type t = typeof (Token);\r
  70                         FieldInfo [] fields = t.GetFields ();\r
  71                         Hashtable hash = new Hashtable ();\r
  72                         foreach (FieldInfo field in fields) {\r
  73                                 if (field.IsLiteral && field.IsStatic && field.FieldType == typeof (int))\r
  74                                         hash.Add (field.GetValue (null), field.Name);\r
  75                         }\r
  76                         return hash;\r
  77                 }\r
  78                 \r
  79                 //\r
  80                 // Returns a verbose representation of the current location\r
  81                 //\r
  82                 public string location {\r
  83                         get {\r
  84                                 string det;\r
  85 \r
  86                                 if (current_token == Token.ERROR)\r
  87                                         det = "detail: " + error_details;\r
  88                                 else\r
  89                                         det = "";\r
  90                                 \r
  91                                 // return "Line:     "+line+" Col: "+col + "\n" +\r
  92                                 //       "VirtLine: "+ref_line +\r
  93                                 //       " Token: "+current_token + " " + det;\r
  94                                 string current_token_name = TokenValueName [current_token] as string;\r
  95                                 if (current_token_name == null)\r
  96                                         current_token_name = current_token.ToString ();\r
  97 \r
  98                                 return String.Format ("{0} ({1},{2}), Token: {3} {4}", ref_name.Name,\r
  99                                                                                        ref_line,\r
 100                                                                                        col,\r
 101                                                                                        current_token_name,\r
 102                                                                                        det);\r
 103                         }\r
 104                 }\r
 105 \r
 106                 public bool PropertyParsing {\r
 107                         get {\r
 108                                 return handle_get_set;\r
 109                         }\r
 110 \r
 111                         set {\r
 112                                 handle_get_set = value;\r
 113                         }\r
 114                 }\r
 115 \r
 116                 public bool AssemblyTargetParsing {\r
 117                         get {\r
 118                                 return handle_assembly;\r
 119                         }\r
 120 \r
 121                         set {\r
 122                                 handle_assembly = value;\r
 123                         }\r
 124                 }\r
 125 \r
 126                 public bool EventParsing {\r
 127                         get {\r
 128                                 return handle_remove_add;\r
 129                         }\r
 130 \r
 131                         set {\r
 132                                 handle_remove_add = value;\r
 133                         }\r
 134                 }\r
 135                 \r
 136                 //\r
 137                 // Class variables\r
 138                 // \r
 139                 static Hashtable keywords;\r
 140                 static NumberStyles styles;\r
 141                 static NumberFormatInfo csharp_format_info;\r
 142                 \r
 143                 //\r
 144                 // Values for the associated token returned\r
 145                 //\r
 146                 int putback_char;\r
 147                 Object val;\r
 148 \r
 149                 //\r
 150                 // Pre-processor\r
 151                 //\r
 152                 Hashtable defines;\r
 153 \r
 154                 const int TAKING        = 1;\r
 155                 const int TAKEN_BEFORE  = 2;\r
 156                 const int ELSE_SEEN     = 4;\r
 157                 const int PARENT_TAKING = 8;\r
 158                 const int REGION        = 16;           \r
 159 \r
 160                 //\r
 161                 // pre-processor if stack state:\r
 162                 //\r
 163                 Stack ifstack;\r
 164 \r
 165                 static System.Text.StringBuilder string_builder;\r
 166 \r
 167                 const int max_id_size = 512;\r
 168                 static char [] id_builder = new char [max_id_size];\r
 169 \r
 170                 const int max_number_size = 128;\r
 171                 static char [] number_builder = new char [max_number_size];\r
 172                 static int number_pos;\r
 173                 \r
 174                 //\r
 175                 // Details about the error encoutered by the tokenizer\r
 176                 //\r
 177                 string error_details;\r
 178                 \r
 179                 public string error {\r
 180                         get {\r
 181                                 return error_details;\r
 182                         }\r
 183                 }\r
 184                 \r
 185                 public int Line {\r
 186                         get {\r
 187                                 return ref_line;\r
 188                         }\r
 189                 }\r
 190 \r
 191                 public int Col {\r
 192                         get {\r
 193                                 return col;\r
 194                         }\r
 195                 }\r
 196 \r
 197                 static void InitTokens ()\r
 198                 {\r
 199                         keywords = new Hashtable ();\r
 200 \r
 201                         keywords.Add ("abstract", Token.ABSTRACT);\r
 202                         keywords.Add ("as", Token.AS);\r
 203                         keywords.Add ("add", Token.ADD);\r
 204                         keywords.Add ("assembly", Token.ASSEMBLY);\r
 205                         keywords.Add ("base", Token.BASE);\r
 206                         keywords.Add ("bool", Token.BOOL);\r
 207                         keywords.Add ("break", Token.BREAK);\r
 208                         keywords.Add ("byte", Token.BYTE);\r
 209                         keywords.Add ("case", Token.CASE);\r
 210                         keywords.Add ("catch", Token.CATCH);\r
 211                         keywords.Add ("char", Token.CHAR);\r
 212                         keywords.Add ("checked", Token.CHECKED);\r
 213                         keywords.Add ("class", Token.CLASS);\r
 214                         keywords.Add ("const", Token.CONST);\r
 215                         keywords.Add ("continue", Token.CONTINUE);\r
 216                         keywords.Add ("decimal", Token.DECIMAL);\r
 217                         keywords.Add ("default", Token.DEFAULT);\r
 218                         keywords.Add ("delegate", Token.DELEGATE);\r
 219                         keywords.Add ("do", Token.DO);\r
 220                         keywords.Add ("double", Token.DOUBLE);\r
 221                         keywords.Add ("else", Token.ELSE);\r
 222                         keywords.Add ("enum", Token.ENUM);\r
 223                         keywords.Add ("event", Token.EVENT);\r
 224                         keywords.Add ("explicit", Token.EXPLICIT);\r
 225                         keywords.Add ("extern", Token.EXTERN);\r
 226                         keywords.Add ("false", Token.FALSE);\r
 227                         keywords.Add ("finally", Token.FINALLY);\r
 228                         keywords.Add ("fixed", Token.FIXED);\r
 229                         keywords.Add ("float", Token.FLOAT);\r
 230                         keywords.Add ("for", Token.FOR);\r
 231                         keywords.Add ("foreach", Token.FOREACH);\r
 232                         keywords.Add ("goto", Token.GOTO);\r
 233                         keywords.Add ("get", Token.GET);\r
 234                         keywords.Add ("if", Token.IF);\r
 235                         keywords.Add ("implicit", Token.IMPLICIT);\r
 236                         keywords.Add ("in", Token.IN);\r
 237                         keywords.Add ("int", Token.INT);\r
 238                         keywords.Add ("interface", Token.INTERFACE);\r
 239                         keywords.Add ("internal", Token.INTERNAL);\r
 240                         keywords.Add ("is", Token.IS);\r
 241                         keywords.Add ("lock", Token.LOCK);\r
 242                         keywords.Add ("long", Token.LONG);\r
 243                         keywords.Add ("namespace", Token.NAMESPACE);\r
 244                         keywords.Add ("new", Token.NEW);\r
 245                         keywords.Add ("null", Token.NULL);\r
 246                         keywords.Add ("object", Token.OBJECT);\r
 247                         keywords.Add ("operator", Token.OPERATOR);\r
 248                         keywords.Add ("out", Token.OUT);\r
 249                         keywords.Add ("override", Token.OVERRIDE);\r
 250                         keywords.Add ("params", Token.PARAMS);\r
 251                         keywords.Add ("private", Token.PRIVATE);\r
 252                         keywords.Add ("protected", Token.PROTECTED);\r
 253                         keywords.Add ("public", Token.PUBLIC);\r
 254                         keywords.Add ("readonly", Token.READONLY);\r
 255                         keywords.Add ("ref", Token.REF);\r
 256                         keywords.Add ("remove", Token.REMOVE);\r
 257                         keywords.Add ("return", Token.RETURN);\r
 258                         keywords.Add ("sbyte", Token.SBYTE);\r
 259                         keywords.Add ("sealed", Token.SEALED);\r
 260                         keywords.Add ("set", Token.SET);\r
 261                         keywords.Add ("short", Token.SHORT);\r
 262                         keywords.Add ("sizeof", Token.SIZEOF);\r
 263                         keywords.Add ("stackalloc", Token.STACKALLOC);\r
 264                         keywords.Add ("static", Token.STATIC);\r
 265                         keywords.Add ("string", Token.STRING);\r
 266                         keywords.Add ("struct", Token.STRUCT);\r
 267                         keywords.Add ("switch", Token.SWITCH);\r
 268                         keywords.Add ("this", Token.THIS);\r
 269                         keywords.Add ("throw", Token.THROW);\r
 270                         keywords.Add ("true", Token.TRUE);\r
 271                         keywords.Add ("try", Token.TRY);\r
 272                         keywords.Add ("typeof", Token.TYPEOF);\r
 273                         keywords.Add ("uint", Token.UINT);\r
 274                         keywords.Add ("ulong", Token.ULONG);\r
 275                         keywords.Add ("unchecked", Token.UNCHECKED);\r
 276                         keywords.Add ("unsafe", Token.UNSAFE);\r
 277                         keywords.Add ("ushort", Token.USHORT);\r
 278                         keywords.Add ("using", Token.USING);\r
 279                         keywords.Add ("virtual", Token.VIRTUAL);\r
 280                         keywords.Add ("void", Token.VOID);\r
 281                         keywords.Add ("volatile", Token.VOLATILE);\r
 282                         keywords.Add ("where", Token.WHERE);\r
 283                         keywords.Add ("while", Token.WHILE);\r
 284 \r
 285                         if (RootContext.V2){\r
 286                                 keywords.Add ("__yield", Token.YIELD);\r
 287                                 keywords.Add ("yield", Token.YIELD);\r
 288                         }\r
 289                 }\r
 290 \r
 291                 //\r
 292                 // Class initializer\r
 293                 // \r
 294                 static Tokenizer ()\r
 295                 {\r
 296                         InitTokens ();\r
 297                         csharp_format_info = NumberFormatInfo.InvariantInfo;\r
 298                         styles = NumberStyles.Float;\r
 299                         \r
 300                         string_builder = new System.Text.StringBuilder ();\r
 301                 }\r
 302 \r
 303                 int GetKeyword (string name)\r
 304                 {\r
 305                         object o = keywords [name];\r
 306 \r
 307                         if (o == null)\r
 308                                 return -1;\r
 309                         \r
 310                         int res = (int) o;\r
 311 \r
 312                         if (handle_get_set == false && (res == Token.GET || res == Token.SET))\r
 313                                 return -1;\r
 314                         if (handle_remove_add == false && (res == Token.REMOVE || res == Token.ADD))\r
 315                                 return -1;\r
 316                         if (handle_assembly == false && res == Token.ASSEMBLY)\r
 317                                 return -1;\r
 318                         return res;\r
 319                         \r
 320                 }\r
 321 \r
 322                 public Location Location {\r
 323                         get {\r
 324                                 return new Location (ref_line);\r
 325                         }\r
 326                 }\r
 327 \r
 328                 void define (string def)\r
 329                 {\r
 330                         if (!RootContext.AllDefines.Contains (def)){\r
 331                                 RootContext.AllDefines [def] = true;\r
 332                         }\r
 333                         if (defines.Contains (def))\r
 334                                 return;\r
 335                         defines [def] = true;\r
 336                 }\r
 337                 \r
 338                 public Tokenizer (SeekableStreamReader input, SourceFile file, ArrayList defs)\r
 339                 {\r
 340                         this.ref_name = file;\r
 341                         this.file_name = file;\r
 342                         reader = input;\r
 343                         \r
 344                         putback_char = -1;\r
 345 \r
 346                         if (defs != null){\r
 347                                 defines = new Hashtable ();\r
 348                                 foreach (string def in defs)\r
 349                                         define (def);\r
 350                         }\r
 351 \r
 352                         //\r
 353                         // FIXME: This could be `Location.Push' but we have to\r
 354                         // find out why the MS compiler allows this\r
 355                         //\r
 356                         Mono.CSharp.Location.Push (file);\r
 357                 }\r
 358 \r
 359                 bool is_identifier_start_character (char c)\r
 360                 {\r
 361                         return (c >= 'A' && c <= 'Z') || (c >= 'a' && c <= 'z') || c == '_' || Char.IsLetter (c);\r
 362                 }\r
 363 \r
 364                 bool is_identifier_part_character (char c)\r
 365                 {\r
 366                         return (c >= 'a' && c <= 'z') || (c >= 'A' && c <= 'Z') || c == '_' || (c >= '0' && c <= '9') || Char.IsLetter (c);\r
 367                 }\r
 368 \r
 369                 bool parse_less_than ()\r
 370                 {\r
 371                 start:\r
 372                         int the_token = token ();\r
 373                         switch (the_token) {\r
 374                         case Token.IDENTIFIER:\r
 375                         case Token.OBJECT:\r
 376                         case Token.STRING:\r
 377                         case Token.BOOL:\r
 378                         case Token.DECIMAL:\r
 379                         case Token.FLOAT:\r
 380                         case Token.DOUBLE:\r
 381                         case Token.SBYTE:\r
 382                         case Token.BYTE:\r
 383                         case Token.SHORT:\r
 384                         case Token.USHORT:\r
 385                         case Token.INT:\r
 386                         case Token.UINT:\r
 387                         case Token.LONG:\r
 388                         case Token.ULONG:\r
 389                         case Token.CHAR:\r
 390                         case Token.VOID:\r
 391                                 break;\r
 392 \r
 393                         default:\r
 394                                 return false;\r
 395                         }\r
 396                 again:\r
 397                         the_token = token ();\r
 398 \r
 399                         if (the_token == Token.OP_GENERICS_GT)\r
 400                                 return true;\r
 401                         else if (the_token == Token.COMMA)\r
 402                                 goto start;\r
 403                         else if (the_token == Token.OP_GENERICS_LT) {\r
 404                                 if (!parse_less_than ())\r
 405                                         return false;\r
 406                                 goto again;\r
 407                         }\r
 408 \r
 409                         return false;\r
 410                 }\r
 411 \r
 412                 bool parsing_less_than = false;\r
 413                 int parsing_generic_less_than = 0;\r
 414 \r
 415                 int is_punct (char c, ref bool doread)\r
 416                 {\r
 417                         int d;\r
 418                         int t;\r
 419 \r
 420                         doread = false;\r
 421 \r
 422                         switch (c){\r
 423                         case '{':\r
 424                                 return Token.OPEN_BRACE;\r
 425                         case '}':\r
 426                                 return Token.CLOSE_BRACE;\r
 427                         case '[':\r
 428                                 return Token.OPEN_BRACKET;\r
 429                         case ']':\r
 430                                 return Token.CLOSE_BRACKET;\r
 431                         case '(':\r
 432                                 return Token.OPEN_PARENS;\r
 433                         case ')': {\r
 434                                 if (deambiguate_close_parens == 0)\r
 435                                         return Token.CLOSE_PARENS;\r
 436 \r
 437                                 --deambiguate_close_parens;\r
 438 \r
 439                                 // Save current position and parse next token.\r
 440                                 int old = reader.Position;\r
 441                                 int new_token = token ();\r
 442                                 reader.Position = old;\r
 443                                 putback_char = -1;\r
 444 \r
 445                                 if (new_token == Token.OPEN_PARENS)\r
 446                                         return Token.CLOSE_PARENS_OPEN_PARENS;\r
 447                                 else if (new_token == Token.MINUS)\r
 448                                         return Token.CLOSE_PARENS_MINUS;\r
 449                                 else if (IsCastToken (new_token))\r
 450                                         return Token.CLOSE_PARENS_CAST;\r
 451                                 else\r
 452                                         return Token.CLOSE_PARENS_NO_CAST;\r
 453                         }\r
 454 \r
 455                         case ',':\r
 456                                 return Token.COMMA;\r
 457                         case ':':\r
 458                                 return Token.COLON;\r
 459                         case ';':\r
 460                                 return Token.SEMICOLON;\r
 461                         case '~':\r
 462                                 return Token.TILDE;\r
 463                         case '?':\r
 464                                 return Token.INTERR;\r
 465                         }\r
 466 \r
 467                         if (c == '<') {\r
 468                                 if (parsing_generic_less_than++ > 0)\r
 469                                         return Token.OP_GENERICS_LT;\r
 470 \r
 471                                 // Save current position and parse next token.\r
 472                                 int old = reader.Position;\r
 473                                 bool is_generic_lt = parse_less_than ();\r
 474                                 reader.Position = old;\r
 475                                 putback_char = -1;\r
 476 \r
 477                                 if (is_generic_lt) {\r
 478                                         parsing_generic_less_than++;\r
 479                                         return Token.OP_GENERICS_LT;\r
 480                                 } else\r
 481                                         parsing_generic_less_than = 0;\r
 482 \r
 483                                 d = peekChar ();\r
 484                                 if (d == '<'){\r
 485                                         getChar ();\r
 486                                         d = peekChar ();\r
 487 \r
 488                                         if (d == '='){\r
 489                                                 doread = true;\r
 490                                                 return Token.OP_SHIFT_LEFT_ASSIGN;\r
 491                                         }\r
 492                                         return Token.OP_SHIFT_LEFT;\r
 493                                 } else if (d == '='){\r
 494                                         doread = true;\r
 495                                         return Token.OP_LE;\r
 496                                 }\r
 497                                 return Token.OP_LT;\r
 498                         } else if (c == '>') {\r
 499                                 if (parsing_generic_less_than > 0) {\r
 500                                         parsing_generic_less_than--;\r
 501                                         return Token.OP_GENERICS_GT;\r
 502                                 }\r
 503 \r
 504                                 d = peekChar ();\r
 505                                 if (d == '>'){\r
 506                                         getChar ();\r
 507                                         d = peekChar ();\r
 508 \r
 509                                         if (d == '='){\r
 510                                                 doread = true;\r
 511                                                 return Token.OP_SHIFT_RIGHT_ASSIGN;\r
 512                                         }\r
 513                                         return Token.OP_SHIFT_RIGHT;\r
 514                                 } else if (d == '='){\r
 515                                         doread = true;\r
 516                                         return Token.OP_GE;\r
 517                                 }\r
 518                                 return Token.OP_GT;\r
 519                         }\r
 520 \r
 521                         d = peekChar ();\r
 522                         if (c == '+'){\r
 523                                 \r
 524                                 if (d == '+')\r
 525                                         t = Token.OP_INC;\r
 526                                 else if (d == '=')\r
 527                                         t = Token.OP_ADD_ASSIGN;\r
 528                                 else\r
 529                                         return Token.PLUS;\r
 530                                 doread = true;\r
 531                                 return t;\r
 532                         }\r
 533                         if (c == '-'){\r
 534                                 if (d == '-')\r
 535                                         t = Token.OP_DEC;\r
 536                                 else if (d == '=')\r
 537                                         t = Token.OP_SUB_ASSIGN;\r
 538                                 else if (d == '>')\r
 539                                         t = Token.OP_PTR;\r
 540                                 else\r
 541                                         return Token.MINUS;\r
 542                                 doread = true;\r
 543                                 return t;\r
 544                         }\r
 545 \r
 546                         if (c == '!'){\r
 547                                 if (d == '='){\r
 548                                         doread = true;\r
 549                                         return Token.OP_NE;\r
 550                                 }\r
 551                                 return Token.BANG;\r
 552                         }\r
 553 \r
 554                         if (c == '='){\r
 555                                 if (d == '='){\r
 556                                         doread = true;\r
 557                                         return Token.OP_EQ;\r
 558                                 }\r
 559                                 return Token.ASSIGN;\r
 560                         }\r
 561 \r
 562                         if (c == '&'){\r
 563                                 if (d == '&'){\r
 564                                         doread = true;\r
 565                                         return Token.OP_AND;\r
 566                                 } else if (d == '='){\r
 567                                         doread = true;\r
 568                                         return Token.OP_AND_ASSIGN;\r
 569                                 }\r
 570                                 return Token.BITWISE_AND;\r
 571                         }\r
 572 \r
 573                         if (c == '|'){\r
 574                                 if (d == '|'){\r
 575                                         doread = true;\r
 576                                         return Token.OP_OR;\r
 577                                 } else if (d == '='){\r
 578                                         doread = true;\r
 579                                         return Token.OP_OR_ASSIGN;\r
 580                                 }\r
 581                                 return Token.BITWISE_OR;\r
 582                         }\r
 583 \r
 584                         if (c == '*'){\r
 585                                 if (d == '='){\r
 586                                         doread = true;\r
 587                                         return Token.OP_MULT_ASSIGN;\r
 588                                 }\r
 589                                 return Token.STAR;\r
 590                         }\r
 591 \r
 592                         if (c == '/'){\r
 593                                 if (d == '='){\r
 594                                         doread = true;\r
 595                                         return Token.OP_DIV_ASSIGN;\r
 596                                 }\r
 597                                 return Token.DIV;\r
 598                         }\r
 599 \r
 600                         if (c == '%'){\r
 601                                 if (d == '='){\r
 602                                         doread = true;\r
 603                                         return Token.OP_MOD_ASSIGN;\r
 604                                 }\r
 605                                 return Token.PERCENT;\r
 606                         }\r
 607 \r
 608                         if (c == '^'){\r
 609                                 if (d == '='){\r
 610                                         doread = true;\r
 611                                         return Token.OP_XOR_ASSIGN;\r
 612                                 }\r
 613                                 return Token.CARRET;\r
 614                         }\r
 615 \r
 616 #if FIXME\r
 617                         if (c == '>'){\r
 618                                 if (deambiguate_greater_than == 0)\r
 619                                         return Token.OP_GT;\r
 620 \r
 621                                 --deambiguate_greater_than;\r
 622 \r
 623                                 // Save current position and parse next token.\r
 624                                 int old = reader.Position;\r
 625                                 int new_token = token ();\r
 626                                 reader.Position = old;\r
 627                                 putback_char = -1;\r
 628 \r
 629                                 switch (new_token) {\r
 630                                 case Token.OPEN_PARENS:\r
 631                                 case Token.CLOSE_PARENS:\r
 632                                 case Token.CLOSE_BRACKET:\r
 633                                 case Token.OP_GT:\r
 634                                 case Token.COLON:\r
 635                                 case Token.SEMICOLON:\r
 636                                 case Token.COMMA:\r
 637                                 case Token.DOT:\r
 638                                 case Token.INTERR:\r
 639                                         return Token.OP_GENERICS_GT;\r
 640 \r
 641                                 default:\r
 642                                         return Token.OP_GT;\r
 643                                 }\r
 644                         }\r
 645 #endif\r
 646 \r
 647                         return Token.ERROR;\r
 648                 }\r
 649 \r
 650                 int deambiguate_close_parens = 0;\r
 651 \r
 652                 public void Deambiguate_CloseParens ()\r
 653                 {\r
 654                         putback (')');\r
 655                         deambiguate_close_parens++;\r
 656                 }\r
 657 \r
 658                 void Error_NumericConstantTooLong ()\r
 659                 {\r
 660                         Report.Error (1021, Location, "Numeric constant too long");                     \r
 661                 }\r
 662                 \r
 663                 bool decimal_digits (int c)\r
 664                 {\r
 665                         int d;\r
 666                         bool seen_digits = false;\r
 667                         \r
 668                         if (c != -1){\r
 669                                 if (number_pos == max_number_size)\r
 670                                         Error_NumericConstantTooLong ();\r
 671                                 number_builder [number_pos++] = (char) c;\r
 672                         }\r
 673                         \r
 674                         //\r
 675                         // We use peekChar2, because decimal_digits needs to do a \r
 676                         // 2-character look-ahead (5.ToString for example).\r
 677                         //\r
 678                         while ((d = peekChar2 ()) != -1){\r
 679                                 if (d >= '0' && d <= '9'){\r
 680                                         if (number_pos == max_number_size)\r
 681                                                 Error_NumericConstantTooLong ();\r
 682                                         number_builder [number_pos++] = (char) d;\r
 683                                         getChar ();\r
 684                                         seen_digits = true;\r
 685                                 } else\r
 686                                         break;\r
 687                         }\r
 688                         \r
 689                         return seen_digits;\r
 690                 }\r
 691 \r
 692                 bool is_hex (int e)\r
 693                 {\r
 694                         return (e >= '0' && e <= '9') || (e >= 'A' && e <= 'F') || (e >= 'a' && e <= 'f');\r
 695                 }\r
 696                 \r
 697                 void hex_digits (int c)\r
 698                 {\r
 699                         if (c != -1)\r
 700                                 number_builder [number_pos++] = (char) c;\r
 701                         \r
 702                 }\r
 703                 \r
 704                 int real_type_suffix (int c)\r
 705                 {\r
 706                         int t;\r
 707 \r
 708                         switch (c){\r
 709                         case 'F': case 'f':\r
 710                                 t =  Token.LITERAL_FLOAT;\r
 711                                 break;\r
 712                         case 'D': case 'd':\r
 713                                 t = Token.LITERAL_DOUBLE;\r
 714                                 break;\r
 715                         case 'M': case 'm':\r
 716                                  t= Token.LITERAL_DECIMAL;\r
 717                                 break;\r
 718                         default:\r
 719                                 return Token.NONE;\r
 720                         }\r
 721                         return t;\r
 722                 }\r
 723 \r
 724                 int integer_type_suffix (ulong ul, int c)\r
 725                 {\r
 726                         bool is_unsigned = false;\r
 727                         bool is_long = false;\r
 728 \r
 729                         if (c != -1){\r
 730                                 bool scanning = true;\r
 731                                 do {\r
 732                                         switch (c){\r
 733                                         case 'U': case 'u':\r
 734                                                 if (is_unsigned)\r
 735                                                         scanning = false;\r
 736                                                 is_unsigned = true;\r
 737                                                 getChar ();\r
 738                                                 break;\r
 739 \r
 740                                         case 'l':\r
 741                                                 if (!is_unsigned){\r
 742                                                         //\r
 743                                                         // if we have not seen anything in between\r
 744                                                         // report this error\r
 745                                                         //\r
 746                                                         Report.Warning (\r
 747                                                                 78, Location,\r
 748                                                         "the 'l' suffix is easily confused with digit `1'," +\r
 749                                                         " use 'L' for clarity");\r
 750                                                 }\r
 751                                                 goto case 'L';\r
 752                                                 \r
 753                                         case 'L': \r
 754                                                 if (is_long)\r
 755                                                         scanning = false;\r
 756                                                 is_long = true;\r
 757                                                 getChar ();\r
 758                                                 break;\r
 759                                                 \r
 760                                         default:\r
 761                                                 scanning = false;\r
 762                                                 break;\r
 763                                         }\r
 764                                         c = peekChar ();\r
 765                                 } while (scanning);\r
 766                         }\r
 767 \r
 768                         if (is_long && is_unsigned){\r
 769                                 val = ul;\r
 770                                 return Token.LITERAL_INTEGER;\r
 771                         } else if (is_unsigned){\r
 772                                 // uint if possible, or ulong else.\r
 773 \r
 774                                 if ((ul & 0xffffffff00000000) == 0)\r
 775                                         val = (uint) ul;\r
 776                                 else\r
 777                                         val = ul;\r
 778                         } else if (is_long){\r
 779                                 // long if possible, ulong otherwise\r
 780                                 if ((ul & 0x8000000000000000) != 0)\r
 781                                         val = ul;\r
 782                                 else\r
 783                                         val = (long) ul;\r
 784                         } else {\r
 785                                 // int, uint, long or ulong in that order\r
 786                                 if ((ul & 0xffffffff00000000) == 0){\r
 787                                         uint ui = (uint) ul;\r
 788                                         \r
 789                                         if ((ui & 0x80000000) != 0)\r
 790                                                 val = ui;\r
 791                                         else\r
 792                                                 val = (int) ui;\r
 793                                 } else {\r
 794                                         if ((ul & 0x8000000000000000) != 0)\r
 795                                                 val = ul;\r
 796                                         else\r
 797                                                 val = (long) ul;\r
 798                                 }\r
 799                         }\r
 800                         return Token.LITERAL_INTEGER;\r
 801                 }\r
 802                                 \r
 803                 //\r
 804                 // given `c' as the next char in the input decide whether\r
 805                 // we need to convert to a special type, and then choose\r
 806                 // the best representation for the integer\r
 807                 //\r
 808                 int adjust_int (int c)\r
 809                 {\r
 810                         try {\r
 811                                 if (number_pos > 9){\r
 812                                         ulong ul = (uint) (number_builder [0] - '0');\r
 813 \r
 814                                         for (int i = 1; i < number_pos; i++){\r
 815                                                 ul = checked ((ul * 10) + ((uint)(number_builder [i] - '0')));\r
 816                                         }\r
 817                                         return integer_type_suffix (ul, c);\r
 818                                 } else {\r
 819                                         uint ui = (uint) (number_builder [0] - '0');\r
 820 \r
 821                                         for (int i = 1; i < number_pos; i++){\r
 822                                                 ui = checked ((ui * 10) + ((uint)(number_builder [i] - '0')));\r
 823                                         }\r
 824                                         return integer_type_suffix (ui, c);\r
 825                                 }\r
 826                         } catch (OverflowException) {\r
 827                                 error_details = "Integral constant is too large";\r
 828                                 Report.Error (1021, Location, error_details);\r
 829                                 val = 0ul;\r
 830                                 return Token.LITERAL_INTEGER;\r
 831                         }\r
 832                 }\r
 833                 \r
 834                 int adjust_real (int t)\r
 835                 {\r
 836                         string s = new String (number_builder, 0, number_pos);\r
 837 \r
 838                         switch (t){\r
 839                         case Token.LITERAL_DECIMAL:\r
 840                                 try {\r
 841                                         val = System.Decimal.Parse (s, styles, csharp_format_info);\r
 842                                 } catch (OverflowException) {\r
 843                                         val = 0m;     \r
 844                                         error_details = "Floating-point constant is outside the range of the type 'decimal'";\r
 845                                         Report.Error (594, Location, error_details);\r
 846                                 }\r
 847                                 break;\r
 848                         case Token.LITERAL_FLOAT:\r
 849                                 try {\r
 850                                         val = (float) System.Double.Parse (s, styles, csharp_format_info);\r
 851                                 } catch (OverflowException) {\r
 852                                         val = 0.0f;     \r
 853                                         error_details = "Floating-point constant is outside the range of the type 'float'";\r
 854                                         Report.Error (594, Location, error_details);\r
 855                                 }\r
 856                                 break;\r
 857                                 \r
 858                         case Token.LITERAL_DOUBLE:\r
 859                         case Token.NONE:\r
 860                                 t = Token.LITERAL_DOUBLE;\r
 861                                 try {\r
 862                                         val = System.Double.Parse (s, styles, csharp_format_info);\r
 863                                 } catch (OverflowException) {\r
 864                                         val = 0.0;     \r
 865                                         error_details = "Floating-point constant is outside the range of the type 'double'";\r
 866                                         Report.Error (594, Location, error_details);\r
 867                                 }\r
 868                                 break;\r
 869                         }\r
 870                         return t;\r
 871                 }\r
 872 \r
 873                 int handle_hex ()\r
 874                 {\r
 875                         int d;\r
 876                         ulong ul;\r
 877                         \r
 878                         getChar ();\r
 879                         while ((d = peekChar ()) != -1){\r
 880                                 if (is_hex (d)){\r
 881                                         if (number_pos == 16){\r
 882                                                 Report.Error (1021, Location, "Integral constant too large");\r
 883                                                 return Token.ERROR;\r
 884                                         }\r
 885                                         number_builder [number_pos++] = (char) d;\r
 886                                         getChar ();\r
 887                                 } else\r
 888                                         break;\r
 889                         }\r
 890                         \r
 891                         string s = new String (number_builder, 0, number_pos);\r
 892                         if (number_pos <= 8)\r
 893                                 ul = System.UInt32.Parse (s, NumberStyles.HexNumber);\r
 894                         else\r
 895                                 ul = System.UInt64.Parse (s, NumberStyles.HexNumber);\r
 896                         return integer_type_suffix (ul, peekChar ());\r
 897                 }\r
 898 \r
 899                 //\r
 900                 // Invoked if we know we have .digits or digits\r
 901                 //\r
 902                 int is_number (int c)\r
 903                 {\r
 904                         bool is_real = false;\r
 905                         int type;\r
 906 \r
 907                         number_pos = 0;\r
 908 \r
 909                         if (c >= '0' && c <= '9'){\r
 910                                 if (c == '0'){\r
 911                                         int peek = peekChar ();\r
 912 \r
 913                                         if (peek == 'x' || peek == 'X')\r
 914                                                 return handle_hex ();\r
 915                                 }\r
 916                                 decimal_digits (c);\r
 917                                 c = getChar ();\r
 918                         }\r
 919 \r
 920                         //\r
 921                         // We need to handle the case of\r
 922                         // "1.1" vs "1.string" (LITERAL_FLOAT vs NUMBER DOT IDENTIFIER)\r
 923                         //\r
 924                         if (c == '.'){\r
 925                                 if (decimal_digits ('.')){\r
 926                                         is_real = true;\r
 927                                         c = getChar ();\r
 928                                 } else {\r
 929                                         putback ('.');\r
 930                                         number_pos--;\r
 931                                         return adjust_int (-1);\r
 932                                 }\r
 933                         }\r
 934                         \r
 935                         if (c == 'e' || c == 'E'){\r
 936                                 is_real = true;\r
 937                                 if (number_pos == max_number_size)\r
 938                                         Error_NumericConstantTooLong ();\r
 939                                 number_builder [number_pos++] = 'e';\r
 940                                 c = getChar ();\r
 941                                 \r
 942                                 if (c == '+'){\r
 943                                         if (number_pos == max_number_size)\r
 944                                                 Error_NumericConstantTooLong ();\r
 945                                         number_builder [number_pos++] = '+';\r
 946                                         c = -1;\r
 947                                 } else if (c == '-') {\r
 948                                         if (number_pos == max_number_size)\r
 949                                                 Error_NumericConstantTooLong ();\r
 950                                         number_builder [number_pos++] = '-';\r
 951                                         c = -1;\r
 952                                 } else {\r
 953                                         if (number_pos == max_number_size)\r
 954                                                 Error_NumericConstantTooLong ();\r
 955                                         number_builder [number_pos++] = '+';\r
 956                                 }\r
 957                                         \r
 958                                 decimal_digits (c);\r
 959                                 c = getChar ();\r
 960                         }\r
 961 \r
 962                         type = real_type_suffix (c);\r
 963                         if (type == Token.NONE && !is_real){\r
 964                                 putback (c);\r
 965                                 return adjust_int (c);\r
 966                         } else \r
 967                                 is_real = true;\r
 968 \r
 969                         if (type == Token.NONE){\r
 970                                 putback (c);\r
 971                         }\r
 972                         \r
 973                         if (is_real)\r
 974                                 return adjust_real (type);\r
 975 \r
 976                         Console.WriteLine ("This should not be reached");\r
 977                         throw new Exception ("Is Number should never reach this point");\r
 978                 }\r
 979 \r
 980                 //\r
 981                 // Accepts exactly count (4 or 8) hex, no more no less\r
 982                 //\r
 983                 int getHex (int count, out bool error)\r
 984                 {\r
 985                         int [] buffer = new int [8];\r
 986                         int i;\r
 987                         int total = 0;\r
 988                         int c;\r
 989                         int top = count != -1 ? count : 4;\r
 990                         \r
 991                         getChar ();\r
 992                         error = false;\r
 993                         for (i = 0; i < top; i++){\r
 994                                 c = getChar ();\r
 995                                 \r
 996                                 if (c >= '0' && c <= '9')\r
 997                                         c = (int) c - (int) '0';\r
 998                                 else if (c >= 'A' && c <= 'F')\r
 999                                         c = (int) c - (int) 'A' + 10;\r
1000                                 else if (c >= 'a' && c <= 'f')\r
1001                                         c = (int) c - (int) 'a' + 10;\r
1002                                 else {\r
1003                                         error = true;\r
1004                                         return 0;\r
1005                                 }\r
1006                                 \r
1007                                 total = (total * 16) + c;\r
1008                                 if (count == -1){\r
1009                                         int p = peekChar ();\r
1010                                         if (p == -1)\r
1011                                                 break;\r
1012                                         if (!is_hex ((char)p))\r
1013                                                 break;\r
1014                                 }\r
1015                         }\r
1016                         return total;\r
1017                 }\r
1018 \r
1019                 int escape (int c)\r
1020                 {\r
1021                         bool error;\r
1022                         int d;\r
1023                         int v;\r
1024 \r
1025                         d = peekChar ();\r
1026                         if (c != '\\')\r
1027                                 return c;\r
1028                         \r
1029                         switch (d){\r
1030                         case 'a':\r
1031                                 v = '\a'; break;\r
1032                         case 'b':\r
1033                                 v = '\b'; break;\r
1034                         case 'n':\r
1035                                 v = '\n'; break;\r
1036                         case 't':\r
1037                                 v = '\t'; break;\r
1038                         case 'v':\r
1039                                 v = '\v'; break;\r
1040                         case 'r':\r
1041                                 v = '\r'; break;\r
1042                         case '\\':\r
1043                                 v = '\\'; break;\r
1044                         case 'f':\r
1045                                 v = '\f'; break;\r
1046                         case '0':\r
1047                                 v = 0; break;\r
1048                         case '"':\r
1049                                 v = '"'; break;\r
1050                         case '\'':\r
1051                                 v = '\''; break;\r
1052                         case 'x':\r
1053                                 v = getHex (-1, out error);\r
1054                                 if (error)\r
1055                                         goto default;\r
1056                                 return v;\r
1057                         case 'u':\r
1058                                 v = getHex (4, out error);\r
1059                                 if (error)\r
1060                                         goto default;\r
1061                                 return v;\r
1062                         case 'U':\r
1063                                 v = getHex (8, out error);\r
1064                                 if (error)\r
1065                                         goto default;\r
1066                                 return v;\r
1067                         default:\r
1068                                 Report.Error (1009, Location, "Unrecognized escape sequence in " + (char)d);\r
1069                                 return d;\r
1070                         }\r
1071                         getChar ();\r
1072                         return v;\r
1073                 }\r
1074 \r
1075                 int getChar ()\r
1076                 {\r
1077                         if (putback_char != -1){\r
1078                                 int x = putback_char;\r
1079                                 putback_char = -1;\r
1080 \r
1081                                 return x;\r
1082                         }\r
1083                         return reader.Read ();\r
1084                 }\r
1085 \r
1086                 int peekChar ()\r
1087                 {\r
1088                         if (putback_char != -1)\r
1089                                 return putback_char;\r
1090                         putback_char = reader.Read ();\r
1091                         return putback_char;\r
1092                 }\r
1093 \r
1094                 int peekChar2 ()\r
1095                 {\r
1096                         if (putback_char != -1)\r
1097                                 return putback_char;\r
1098                         return reader.Peek ();\r
1099                 }\r
1100                 \r
1101                 void putback (int c)\r
1102                 {\r
1103                         if (putback_char != -1){\r
1104                                 Console.WriteLine ("Col: " + col);\r
1105                                 Console.WriteLine ("Row: " + line);\r
1106                                 Console.WriteLine ("Name: " + ref_name.Name);\r
1107                                 Console.WriteLine ("Current [{0}] putting back [{1}]  ", putback_char, c);\r
1108                                 throw new Exception ("This should not happen putback on putback");\r
1109                         }\r
1110                         putback_char = c;\r
1111                 }\r
1112 \r
1113                 public bool advance ()\r
1114                 {\r
1115                         return peekChar () != -1;\r
1116                 }\r
1117 \r
1118                 public Object Value {\r
1119                         get {\r
1120                                 return val;\r
1121                         }\r
1122                 }\r
1123 \r
1124                 public Object value ()\r
1125                 {\r
1126                         return val;\r
1127                 }\r
1128 \r
1129                 bool IsCastToken (int token)\r
1130                 {\r
1131                         switch (token) {\r
1132                         case Token.BANG:\r
1133                         case Token.TILDE:\r
1134                         case Token.IDENTIFIER:\r
1135                         case Token.LITERAL_INTEGER:\r
1136                         case Token.LITERAL_FLOAT:\r
1137                         case Token.LITERAL_DOUBLE:\r
1138                         case Token.LITERAL_DECIMAL:\r
1139                         case Token.LITERAL_CHARACTER:\r
1140                         case Token.LITERAL_STRING:\r
1141                         case Token.BASE:\r
1142                         case Token.CHECKED:\r
1143                         case Token.FALSE:\r
1144                         case Token.FIXED:\r
1145                         case Token.NEW:\r
1146                         case Token.NULL:\r
1147                         case Token.SIZEOF:\r
1148                         case Token.THIS:\r
1149                         case Token.THROW:\r
1150                         case Token.TRUE:\r
1151                         case Token.TYPEOF:\r
1152                         case Token.UNCHECKED:\r
1153                         case Token.UNSAFE:\r
1154                                 return true;\r
1155 \r
1156                         default:\r
1157                                 return false;\r
1158                         }\r
1159                 }\r
1160 \r
1161                 public int token ()\r
1162                 {\r
1163                         current_token = xtoken ();\r
1164                         return current_token;\r
1165                 }\r
1166 \r
1167                 static StringBuilder static_cmd_arg = new System.Text.StringBuilder ();\r
1168                 \r
1169                 void get_cmd_arg (out string cmd, out string arg)\r
1170                 {\r
1171                         int c;\r
1172                         \r
1173                         tokens_seen = false;\r
1174                         arg = "";\r
1175                         static_cmd_arg.Length = 0;\r
1176                                 \r
1177                         while ((c = getChar ()) != -1 && (c != '\n') && (c != ' ') && (c != '\t') && (c != '\r')){\r
1178                                 static_cmd_arg.Append ((char) c);\r
1179                         }\r
1180 \r
1181                         cmd = static_cmd_arg.ToString ();\r
1182 \r
1183                         if (c == '\n'){\r
1184                                 line++;\r
1185                                 ref_line++;\r
1186                                 return;\r
1187                         } else if (c == '\r')\r
1188                                 col = 0;\r
1189 \r
1190                         // skip over white space\r
1191                         while ((c = getChar ()) != -1 && (c != '\n') && ((c == '\r') || (c == ' ') || (c == '\t')))\r
1192                                 ;\r
1193 \r
1194                         if (c == '\n'){\r
1195                                 line++;\r
1196                                 ref_line++;\r
1197                                 return;\r
1198                         } else if (c == '\r'){\r
1199                                 col = 0;\r
1200                                 return;\r
1201                         }\r
1202                         \r
1203                         static_cmd_arg.Length = 0;\r
1204                         static_cmd_arg.Append ((char) c);\r
1205                         \r
1206                         while ((c = getChar ()) != -1 && (c != '\n') && (c != '\r')){\r
1207                                 static_cmd_arg.Append ((char) c);\r
1208                         }\r
1209 \r
1210                         if (c == '\n'){\r
1211                                 line++;\r
1212                                 ref_line++;\r
1213                         } else if (c == '\r')\r
1214                                 col = 0;\r
1215                         arg = static_cmd_arg.ToString ().Trim ();\r
1216                 }\r
1217 \r
1218                 //\r
1219                 // Handles the #line directive\r
1220                 //\r
1221                 bool PreProcessLine (string arg)\r
1222                 {\r
1223                         if (arg == "")\r
1224                                 return false;\r
1225 \r
1226                         if (arg == "default"){\r
1227                                 ref_line = line;\r
1228                                 ref_name = file_name;\r
1229                                 Location.Push (ref_name);\r
1230                                 return true;\r
1231                         }\r
1232                         \r
1233                         try {\r
1234                                 int pos;\r
1235 \r
1236                                 if ((pos = arg.IndexOf (' ')) != -1 && pos != 0){\r
1237                                         ref_line = System.Int32.Parse (arg.Substring (0, pos));\r
1238                                         pos++;\r
1239                                         \r
1240                                         char [] quotes = { '\"' };\r
1241                                         \r
1242                                         string name = arg.Substring (pos). Trim (quotes);\r
1243                                         ref_name = Location.LookupFile (name);\r
1244                                         Location.Push (ref_name);\r
1245                                 } else {\r
1246                                         ref_line = System.Int32.Parse (arg);\r
1247                                 }\r
1248                         } catch {\r
1249                                 return false;\r
1250                         }\r
1251                         \r
1252                         return true;\r
1253                 }\r
1254 \r
1255                 //\r
1256                 // Handles #define and #undef\r
1257                 //\r
1258                 void PreProcessDefinition (bool is_define, string arg)\r
1259                 {\r
1260                         if (arg == "" || arg == "true" || arg == "false"){\r
1261                                 Report.Error (1001, Location, "Missing identifer to pre-processor directive");\r
1262                                 return;\r
1263                         }\r
1264 \r
1265                         char[] whitespace = { ' ', '\t' };\r
1266                         if (arg.IndexOfAny (whitespace) != -1){\r
1267                                 Report.Error (1025, Location, "Single-line comment or end-of-line expected");\r
1268                                 return;\r
1269                         }\r
1270 \r
1271                         foreach (char c in arg){\r
1272                                 if (!Char.IsLetter (c) && (c != '_')){\r
1273                                         Report.Error (1001, Location, "Identifier expected");\r
1274                                         return;\r
1275                                 }\r
1276                         }\r
1277 \r
1278                         if (is_define){\r
1279                                 if (defines == null)\r
1280                                         defines = new Hashtable ();\r
1281                                 define (arg);\r
1282                         } else {\r
1283                                 if (defines == null)\r
1284                                         return;\r
1285                                 if (defines.Contains (arg))\r
1286                                         defines.Remove (arg);\r
1287                         }\r
1288                 }\r
1289 \r
1290                 bool eval_val (string s)\r
1291                 {\r
1292                         if (s == "true")\r
1293                                 return true;\r
1294                         if (s == "false")\r
1295                                 return false;\r
1296                         \r
1297                         if (defines == null)\r
1298                                 return false;\r
1299                         if (defines.Contains (s))\r
1300                                 return true;\r
1301 \r
1302                         return false;\r
1303                 }\r
1304 \r
1305                 bool pp_primary (ref string s)\r
1306                 {\r
1307                         s = s.Trim ();\r
1308                         int len = s.Length;\r
1309 \r
1310                         if (len > 0){\r
1311                                 char c = s [0];\r
1312                                 \r
1313                                 if (c == '('){\r
1314                                         s = s.Substring (1);\r
1315                                         bool val = pp_expr (ref s);\r
1316                                         if (s.Length > 0 && s [0] == ')'){\r
1317                                                 s = s.Substring (1);\r
1318                                                 return val;\r
1319                                         }\r
1320                                         Error_InvalidDirective ();\r
1321                                         return false;\r
1322                                 }\r
1323                                 \r
1324                                 if (is_identifier_start_character (c)){\r
1325                                         int j = 1;\r
1326 \r
1327                                         while (j < len){\r
1328                                                 c = s [j];\r
1329                                                 \r
1330                                                 if (is_identifier_part_character (c)){\r
1331                                                         j++;\r
1332                                                         continue;\r
1333                                                 }\r
1334                                                 bool v = eval_val (s.Substring (0, j));\r
1335                                                 s = s.Substring (j);\r
1336                                                 return v;\r
1337                                         }\r
1338                                         bool vv = eval_val (s);\r
1339                                         s = "";\r
1340                                         return vv;\r
1341                                 }\r
1342                         }\r
1343                         Error_InvalidDirective ();\r
1344                         return false;\r
1345                 }\r
1346                 \r
1347                 bool pp_unary (ref string s)\r
1348                 {\r
1349                         s = s.Trim ();\r
1350                         int len = s.Length;\r
1351 \r
1352                         if (len > 0){\r
1353                                 if (s [0] == '!'){\r
1354                                         if (len > 1 && s [1] == '='){\r
1355                                                 Error_InvalidDirective ();\r
1356                                                 return false;\r
1357                                         }\r
1358                                         s = s.Substring (1);\r
1359                                         return ! pp_primary (ref s);\r
1360                                 } else\r
1361                                         return pp_primary (ref s);\r
1362                         } else {\r
1363                                 Error_InvalidDirective ();\r
1364                                 return false;\r
1365                         }\r
1366                 }\r
1367                 \r
1368                 bool pp_eq (ref string s)\r
1369                 {\r
1370                         bool va = pp_unary (ref s);\r
1371 \r
1372                         s = s.Trim ();\r
1373                         int len = s.Length;\r
1374                         if (len > 0){\r
1375                                 if (s [0] == '='){\r
1376                                         if (len > 2 && s [1] == '='){\r
1377                                                 s = s.Substring (2);\r
1378                                                 return va == pp_unary (ref s);\r
1379                                         } else {\r
1380                                                 Error_InvalidDirective ();\r
1381                                                 return false;\r
1382                                         }\r
1383                                 } else if (s [0] == '!' && len > 1 && s [1] == '='){\r
1384                                         s = s.Substring (2);\r
1385 \r
1386                                         return va != pp_unary (ref s);\r
1387 \r
1388                                 } \r
1389                         }\r
1390 \r
1391                         return va;\r
1392                                 \r
1393                 }\r
1394                 \r
1395                 bool pp_and (ref string s)\r
1396                 {\r
1397                         bool va = pp_eq (ref s);\r
1398 \r
1399                         s = s.Trim ();\r
1400                         int len = s.Length;\r
1401                         if (len > 0){\r
1402                                 if (s [0] == '&'){\r
1403                                         if (len > 2 && s [1] == '&'){\r
1404                                                 s = s.Substring (2);\r
1405                                                 return (va & pp_eq (ref s));\r
1406                                         } else {\r
1407                                                 Error_InvalidDirective ();\r
1408                                                 return false;\r
1409                                         }\r
1410                                 } \r
1411                         }\r
1412                         return va;\r
1413                 }\r
1414                 \r
1415                 //\r
1416                 // Evaluates an expression for `#if' or `#elif'\r
1417                 //\r
1418                 bool pp_expr (ref string s)\r
1419                 {\r
1420                         bool va = pp_and (ref s);\r
1421                         s = s.Trim ();\r
1422                         int len = s.Length;\r
1423                         if (len > 0){\r
1424                                 char c = s [0];\r
1425                                 \r
1426                                 if (c == '|'){\r
1427                                         if (len > 2 && s [1] == '|'){\r
1428                                                 s = s.Substring (2);\r
1429                                                 return va | pp_expr (ref s);\r
1430                                         } else {\r
1431                                                 Error_InvalidDirective ();\r
1432                                                 return false;\r
1433                                         }\r
1434                                 } \r
1435                         }\r
1436                         \r
1437                         return va;\r
1438                 }\r
1439 \r
1440                 bool eval (string s)\r
1441                 {\r
1442                         bool v = pp_expr (ref s);\r
1443                         s = s.Trim ();\r
1444                         if (s.Length != 0){\r
1445                                 Error_InvalidDirective ();\r
1446                                 return false;\r
1447                         }\r
1448 \r
1449                         return v;\r
1450                 }\r
1451                 \r
1452                 void Error_InvalidDirective ()\r
1453                 {\r
1454                         Report.Error (1517, Location, "Invalid pre-processor directive");\r
1455                 }\r
1456 \r
1457                 void Error_UnexpectedDirective (string extra)\r
1458                 {\r
1459                         Report.Error (\r
1460                                 1028, Location,\r
1461                                 "Unexpected processor directive (" + extra + ")");\r
1462                 }\r
1463 \r
1464                 void Error_TokensSeen ()\r
1465                 {\r
1466                         Report.Error (\r
1467                                 1032, Location,\r
1468                                 "Cannot define or undefine pre-processor symbols after a token in the file");\r
1469                 }\r
1470                 \r
1471                 //\r
1472                 // if true, then the code continues processing the code\r
1473                 // if false, the code stays in a loop until another directive is\r
1474                 // reached.\r
1475                 //\r
1476                 bool handle_preprocessing_directive (bool caller_is_taking)\r
1477                 {\r
1478                         char [] blank = { ' ', '\t' };\r
1479                         string cmd, arg;\r
1480                         bool region_directive = false;\r
1481 \r
1482                         get_cmd_arg (out cmd, out arg);\r
1483 \r
1484                         // Eat any trailing whitespaces and single-line comments\r
1485                         if (arg.IndexOf ("//") != -1)\r
1486                                 arg = arg.Substring (0, arg.IndexOf ("//"));\r
1487                         arg = arg.TrimEnd (' ', '\t');\r
1488 \r
1489                         //\r
1490                         // The first group of pre-processing instructions is always processed\r
1491                         //\r
1492                         switch (cmd){\r
1493                         case "pragma":\r
1494                                 if (RootContext.V2)\r
1495                                         return true;\r
1496                                 break;\r
1497                                 \r
1498                         case "line":\r
1499                                 if (!PreProcessLine (arg))\r
1500                                         Report.Error (\r
1501                                                 1576, Location,\r
1502                                                 "Argument to #line directive is missing or invalid");\r
1503                                 return true;\r
1504 \r
1505                         case "region":\r
1506                                 region_directive = true;\r
1507                                 arg = "true";\r
1508                                 goto case "if";\r
1509 \r
1510                         case "endregion":\r
1511                                 region_directive = true;\r
1512                                 goto case "endif";\r
1513                                 \r
1514                         case "if":\r
1515                                 if (arg == ""){\r
1516                                         Error_InvalidDirective ();\r
1517                                         return true;\r
1518                                 }\r
1519                                 bool taking = false;\r
1520                                 if (ifstack == null)\r
1521                                         ifstack = new Stack ();\r
1522 \r
1523                                 if (ifstack.Count == 0){\r
1524                                         taking = true;\r
1525                                 } else {\r
1526                                         int state = (int) ifstack.Peek ();\r
1527                                         if ((state & TAKING) != 0)\r
1528                                                 taking = true;\r
1529                                 }\r
1530 \r
1531                                 if (eval (arg) && taking){\r
1532                                         int push = TAKING | TAKEN_BEFORE | PARENT_TAKING;\r
1533                                         if (region_directive)\r
1534                                                 push |= REGION;\r
1535                                         ifstack.Push (push);\r
1536                                         return true;\r
1537                                 } else {\r
1538                                         int push = (taking ? PARENT_TAKING : 0);\r
1539                                         if (region_directive)\r
1540                                                 push |= REGION;\r
1541                                         ifstack.Push (push);\r
1542                                         return false;\r
1543                                 }\r
1544                                 \r
1545                         case "endif":\r
1546                                 if (ifstack == null || ifstack.Count == 0){\r
1547                                         Error_UnexpectedDirective ("no #if for this #endif");\r
1548                                         return true;\r
1549                                 } else {\r
1550                                         int pop = (int) ifstack.Pop ();\r
1551                                         \r
1552                                         if (region_directive && ((pop & REGION) == 0))\r
1553                                                 Report.Error (1027, Location, "#endif directive expected");\r
1554                                         else if (!region_directive && ((pop & REGION) != 0))\r
1555                                                 Report.Error (1038, Location, "#endregion directive expected");\r
1556                                         \r
1557                                         if (ifstack.Count == 0)\r
1558                                                 return true;\r
1559                                         else {\r
1560                                                 int state = (int) ifstack.Peek ();\r
1561 \r
1562                                                 if ((state & TAKING) != 0)\r
1563                                                         return true;\r
1564                                                 else\r
1565                                                         return false;\r
1566                                         }\r
1567                                 }\r
1568 \r
1569                         case "elif":\r
1570                                 if (ifstack == null || ifstack.Count == 0){\r
1571                                         Error_UnexpectedDirective ("no #if for this #elif");\r
1572                                         return true;\r
1573                                 } else {\r
1574                                         int state = (int) ifstack.Peek ();\r
1575 \r
1576                                         if ((state & REGION) != 0) {\r
1577                                                 Report.Error (1038, Location, "#endregion directive expected");\r
1578                                                 return true;\r
1579                                         }\r
1580 \r
1581                                         if ((state & ELSE_SEEN) != 0){\r
1582                                                 Error_UnexpectedDirective ("#elif not valid after #else");\r
1583                                                 return true;\r
1584                                         }\r
1585 \r
1586                                         if ((state & (TAKEN_BEFORE | TAKING)) != 0)\r
1587                                                 return false;\r
1588 \r
1589                                         if (eval (arg) && ((state & PARENT_TAKING) != 0)){\r
1590                                                 state = (int) ifstack.Pop ();\r
1591                                                 ifstack.Push (state | TAKING | TAKEN_BEFORE);\r
1592                                                 return true;\r
1593                                         } else \r
1594                                                 return false;\r
1595                                 }\r
1596 \r
1597                         case "else":\r
1598                                 if (ifstack == null || ifstack.Count == 0){\r
1599                                         Report.Error (\r
1600                                                 1028, Location,\r
1601                                                 "Unexpected processor directive (no #if for this #else)");\r
1602                                         return true;\r
1603                                 } else {\r
1604                                         int state = (int) ifstack.Peek ();\r
1605 \r
1606                                         if ((state & REGION) != 0) {\r
1607                                                 Report.Error (1038, Location, "#endregion directive expected");\r
1608                                                 return true;\r
1609                                         }\r
1610 \r
1611                                         if ((state & ELSE_SEEN) != 0){\r
1612                                                 Error_UnexpectedDirective ("#else within #else");\r
1613                                                 return true;\r
1614                                         }\r
1615 \r
1616                                         ifstack.Pop ();\r
1617 \r
1618                                         bool ret;\r
1619                                         if ((state & TAKEN_BEFORE) == 0){\r
1620                                                 ret = ((state & PARENT_TAKING) != 0);\r
1621                                         } else\r
1622                                                 ret = false;\r
1623                                         \r
1624                                         if (ret)\r
1625                                                 state |= TAKING;\r
1626                                         else\r
1627                                                 state &= ~TAKING;\r
1628                                         \r
1629                                         ifstack.Push (state | ELSE_SEEN);\r
1630                                         \r
1631                                         return ret;\r
1632                                 }\r
1633                         }\r
1634 \r
1635                         //\r
1636                         // These are only processed if we are in a `taking' block\r
1637                         //\r
1638                         if (!caller_is_taking)\r
1639                                 return false;\r
1640                                         \r
1641                         switch (cmd){\r
1642                         case "define":\r
1643                                 if (any_token_seen){\r
1644                                         Error_TokensSeen ();\r
1645                                         return true;\r
1646                                 }\r
1647                                 PreProcessDefinition (true, arg);\r
1648                                 return true;\r
1649 \r
1650                         case "undef":\r
1651                                 if (any_token_seen){\r
1652                                         Error_TokensSeen ();\r
1653                                         return true;\r
1654                                 }\r
1655                                 PreProcessDefinition (false, arg);\r
1656                                 return true;\r
1657 \r
1658                         case "error":\r
1659                                 Report.Error (1029, Location, "#error: '" + arg + "'");\r
1660                                 return true;\r
1661 \r
1662                         case "warning":\r
1663                                 Report.Warning (1030, Location, "#warning: '" + arg + "'");\r
1664                                 return true;\r
1665                         }\r
1666 \r
1667                         Report.Error (1024, Location, "Preprocessor directive expected (got: " + cmd + ")");\r
1668                         return true;\r
1669 \r
1670                 }\r
1671 \r
1672                 private int consume_string (bool quoted) \r
1673                 {\r
1674                         int c;\r
1675                         string_builder.Length = 0;\r
1676                                                                 \r
1677                         while ((c = getChar ()) != -1){\r
1678                                 if (c == '"'){\r
1679                                         if (quoted && peekChar () == '"'){\r
1680                                                 string_builder.Append ((char) c);\r
1681                                                 getChar ();\r
1682                                                 continue;\r
1683                                         } else {\r
1684                                                 val = string_builder.ToString ();\r
1685                                                 return Token.LITERAL_STRING;\r
1686                                         }\r
1687                                 }\r
1688 \r
1689                                 if (c == '\n'){\r
1690                                         if (!quoted)\r
1691                                                 Report.Error (1010, Location, "Newline in constant");\r
1692                                         line++;\r
1693                                         ref_line++;\r
1694                                         col = 0;\r
1695                                 } else\r
1696                                         col++;\r
1697 \r
1698                                 if (!quoted){\r
1699                                         c = escape (c);\r
1700                                         if (c == -1)\r
1701                                                 return Token.ERROR;\r
1702                                 }\r
1703                                 string_builder.Append ((char) c);\r
1704                         }\r
1705 \r
1706                         Report.Error (1039, Location, "Unterminated string literal");\r
1707                         return Token.EOF;\r
1708                 }\r
1709 \r
1710                 private int consume_identifier (int s, bool quoted) \r
1711                 {\r
1712                         int pos = 1;\r
1713                         int c;\r
1714                         \r
1715                         id_builder [0] = (char) s;\r
1716                                         \r
1717                         while ((c = reader.Read ()) != -1) {\r
1718                                 if (is_identifier_part_character ((char) c)){\r
1719                                         if (pos == max_id_size){\r
1720                                                 Report.Error (645, Location, "Identifier too long (limit is 512 chars)");\r
1721                                                 return Token.ERROR;\r
1722                                         }\r
1723                                         \r
1724                                         id_builder [pos++] = (char) c;\r
1725                                         putback_char = -1;\r
1726                                         col++;\r
1727                                 } else {\r
1728                                         putback_char = c;\r
1729                                         break;\r
1730                                 }\r
1731                         }\r
1732 \r
1733                         string ids = new String (id_builder, 0, pos);\r
1734 \r
1735                         //\r
1736                         // Optimization: avoids doing the keyword lookup\r
1737                         // on uppercase letters and _\r
1738                         //\r
1739                         if (s >= 'a'){\r
1740                                 int keyword = GetKeyword (ids);\r
1741                                 if (keyword == -1 || quoted){\r
1742                                         val = ids;\r
1743                                         return Token.IDENTIFIER;\r
1744                                 }\r
1745                                 return keyword;\r
1746                         }\r
1747                         val = ids;\r
1748                         return Token.IDENTIFIER;\r
1749                 }\r
1750                 \r
1751                 public int xtoken ()\r
1752                 {\r
1753                         int t;\r
1754                         bool doread = false;\r
1755                         int c;\r
1756 \r
1757                         val = null;\r
1758                         // optimization: eliminate col and implement #directive semantic correctly.\r
1759                         for (;(c = getChar ()) != -1; col++) {\r
1760                                 if (c == ' ' || c == '\t' || c == '\f' || c == '\v' || c == '\r' || c == 0xa0){\r
1761                                         \r
1762                                         if (c == '\t')\r
1763                                                 col = (((col + 8) / 8) * 8) - 1;\r
1764                                         continue;\r
1765                                 }\r
1766 \r
1767                                 // Handle double-slash comments.\r
1768                                 if (c == '/'){\r
1769                                         int d = peekChar ();\r
1770                                 \r
1771                                         if (d == '/'){\r
1772                                                 getChar ();\r
1773                                                 while ((d = getChar ()) != -1 && (d != '\n') && d != '\r')\r
1774                                                         col++;\r
1775                                                 if (d == '\n'){\r
1776                                                         line++;\r
1777                                                         ref_line++;\r
1778                                                         col = 0;\r
1779                                                 }\r
1780                                                 any_token_seen |= tokens_seen;\r
1781                                                 tokens_seen = false;\r
1782                                                 continue;\r
1783                                         } else if (d == '*'){\r
1784                                                 getChar ();\r
1785 \r
1786                                                 while ((d = getChar ()) != -1){\r
1787                                                         if (d == '*' && peekChar () == '/'){\r
1788                                                                 getChar ();\r
1789                                                                 col++;\r
1790                                                                 break;\r
1791                                                         }\r
1792                                                         if (d == '\n'){\r
1793                                                                 line++;\r
1794                                                                 ref_line++;\r
1795                                                                 col = 0;\r
1796                                                                 any_token_seen |= tokens_seen;\r
1797                                                                 tokens_seen = false;\r
1798                                                         }\r
1799                                                 }\r
1800                                                 continue;\r
1801                                         }\r
1802                                         goto is_punct_label;\r
1803                                 }\r
1804 \r
1805                                 \r
1806                                 if (is_identifier_start_character ((char)c)){\r
1807                                         tokens_seen = true;\r
1808                                         return consume_identifier (c, false);\r
1809                                 }\r
1810 \r
1811                         is_punct_label:\r
1812                                 if ((t = is_punct ((char)c, ref doread)) != Token.ERROR){\r
1813                                         tokens_seen = true;\r
1814                                         if (doread){\r
1815                                                 getChar ();\r
1816                                                 col++;\r
1817                                         }\r
1818                                         return t;\r
1819                                 }\r
1820 \r
1821                                 // white space\r
1822                                 if (c == '\n'){\r
1823                                         line++;\r
1824                                         ref_line++;\r
1825                                         col = 0;\r
1826                                         any_token_seen |= tokens_seen;\r
1827                                         tokens_seen = false;\r
1828                                         continue;\r
1829                                 }\r
1830 \r
1831                                 if (c >= '0' && c <= '9'){\r
1832                                         tokens_seen = true;\r
1833                                         return is_number (c);\r
1834                                 }\r
1835 \r
1836                                 if (c == '.'){\r
1837                                         tokens_seen = true;\r
1838                                         int peek = peekChar ();\r
1839                                         if (peek >= '0' && peek <= '9')\r
1840                                                 return is_number (c);\r
1841                                         return Token.DOT;\r
1842                                 }\r
1843                                 \r
1844                                 /* For now, ignore pre-processor commands */\r
1845                                 // FIXME: In C# the '#' is not limited to appear\r
1846                                 // on the first column.\r
1847                                 if (c == '#' && !tokens_seen){\r
1848                                         bool cont = true;\r
1849                                         \r
1850                                 start_again:\r
1851                                         \r
1852                                         cont = handle_preprocessing_directive (cont);\r
1853 \r
1854                                         if (cont){\r
1855                                                 col = 0;\r
1856                                                 continue;\r
1857                                         }\r
1858                                         col = 1;\r
1859 \r
1860                                         bool skipping = false;\r
1861                                         for (;(c = getChar ()) != -1; col++){\r
1862                                                 if (c == '\n'){\r
1863                                                         col = 0;\r
1864                                                         line++;\r
1865                                                         ref_line++;\r
1866                                                         skipping = false;\r
1867                                                 } else if (c == ' ' || c == '\t' || c == '\v' || c == '\r' || c == 0xa0)\r
1868                                                         continue;\r
1869                                                 else if (c != '#')\r
1870                                                         skipping = true;\r
1871                                                 if (c == '#' && !skipping)\r
1872                                                         goto start_again;\r
1873                                         }\r
1874                                         any_token_seen |= tokens_seen;\r
1875                                         tokens_seen = false;\r
1876                                         if (c == -1)\r
1877                                                 Report.Error (1027, Location, "#endif/#endregion expected");\r
1878                                         continue;\r
1879                                 }\r
1880                                 \r
1881                                 if (c == '"') \r
1882                                         return consume_string (false);\r
1883 \r
1884                                 if (c == '\''){\r
1885                                         c = getChar ();\r
1886                                         tokens_seen = true;\r
1887                                         if (c == '\''){\r
1888                                                 error_details = "Empty character literal";\r
1889                                                 Report.Error (1011, Location, error_details);\r
1890                                                 return Token.ERROR;\r
1891                                         }\r
1892                                         c = escape (c);\r
1893                                         if (c == -1)\r
1894                                                 return Token.ERROR;\r
1895                                         val = new System.Char ();\r
1896                                         val = (char) c;\r
1897                                         c = getChar ();\r
1898 \r
1899                                         if (c != '\''){\r
1900                                                 error_details = "Too many characters in character literal";\r
1901                                                 Report.Error (1012, Location, error_details);\r
1902 \r
1903                                                 // Try to recover, read until newline or next "'"\r
1904                                                 while ((c = getChar ()) != -1){\r
1905                                                         if (c == '\n' || c == '\''){\r
1906                                                                 line++;\r
1907                                                                 ref_line++;\r
1908                                                                 col = 0;\r
1909                                                                 break;\r
1910                                                         } else\r
1911                                                                 col++;\r
1912                                                         \r
1913                                                 }\r
1914                                                 return Token.ERROR;\r
1915                                         }\r
1916                                         return Token.LITERAL_CHARACTER;\r
1917                                 }\r
1918                                 \r
1919                                 if (c == '@') {\r
1920                                         c = getChar ();\r
1921                                         if (c == '"') {\r
1922                                                 tokens_seen = true;\r
1923                                                 return consume_string (true);\r
1924                                         } else if (is_identifier_start_character ((char) c)){\r
1925                                                 return consume_identifier (c, true);\r
1926                                         } else {\r
1927                                                 Report.Error (1033, Location, "'@' must be followed by string constant or identifier");\r
1928                                         }\r
1929                                 }\r
1930 \r
1931                                 if (c == '#') {\r
1932                                         error_details = "Preprocessor directives must appear as the first non-whitespace " +\r
1933                                                 "character on a line.";\r
1934 \r
1935                                         Report.Error (1040, Location, error_details);\r
1936 \r
1937                                         return Token.ERROR;\r
1938                                 }\r
1939 \r
1940                                 error_details = ((char)c).ToString ();\r
1941                                 \r
1942                                 return Token.ERROR;\r
1943                         }\r
1944 \r
1945                         return Token.EOF;\r
1946                 }\r
1947 \r
1948                 public void cleanup ()\r
1949                 {\r
1950                         if (ifstack != null && ifstack.Count >= 1) {\r
1951                                 int state = (int) ifstack.Pop ();\r
1952                                 if ((state & REGION) != 0)\r
1953                                         Report.Error (1038, "#endregion directive expected");\r
1954                                 else \r
1955                                         Report.Error (1027, "#endif directive expected");\r
1956                         }\r
1957                                 \r
1958                 }\r
1959 \r
1960         }\r
1961 }\r
1962 \r