home *** CD-ROM | disk | FTP | other *** search
/ Usenet 1994 October / usenetsourcesnewsgroupsinfomagicoctober1994disk2.iso / misc / volume1 / 8707 / 50 < prev    next >
Internet Message Format  |  1990-07-13  |  16KB

  1. From: bobk@mntgfx.MENTOR.COM (Bob Kelley)
  2. Newsgroups: comp.sources.misc
  3. Subject: Filter to shorten names output by cfront (353-line C source)
  4. Message-ID: <2929@ncoast.UUCP>
  5. Date: 17 Jul 87 22:28:32 GMT
  6. Sender: allbery@ncoast.UUCP
  7. Organization: Mentor Graphics, Beaverton OR
  8. Lines: 409
  9. Approved: allbery@ncoast.UUCP
  10. X-Archive: comp.sources.misc/8707/50
  11.  
  12. Here's what we use at Mentor Graphics to facilitate the use of C++ on
  13. machines where the linker does not support very long names like those
  14. generated by C++.  I hope that this C program will be useful at other
  15. sites where C++ is used.  The output of cfront is sent through this
  16. program before it is fed to the C compiler.  It would be nice to use
  17. a pipe here, but the return code from cfront would be lost.
  18.  
  19. Watch out for the signature at the end.
  20.  
  21. /*
  22.  * police.c - Limit length of C source lines, strip comments and blank lines.
  23.  *            Replace excessively long names with crc32-derived equivalents.
  24.  *
  25.  *  COPYRIGHT (C) 1987 MENTOR GRAPHICS CORPORATION.  ALL RIGHTS RESERVED.
  26.  *  PERMISSION IS HEREBY GRANTED TO USE, DISTRIBUTE, OR MODIFY THIS PROGRAM,
  27.  *  PROVIDED THAT THIS NOTICE IS REPRODUCED AND INCLUDED ON ALL COPIES AND
  28.  *  MODIFICATIONS OF THE PROGRAM AND PROVIDED THIS PROGRAM IS NOT INCORPORATED
  29.  *  INTO ANY COMMERCIAL PRODUCT WITHOUT THE EXPRESS WRITTEN PERMISSION OF
  30.  *  MENTOR GRAPHICS CORPORATION.  MENTOR GRAPHICS CORPORATION SHALL NOT BE
  31.  *  RESPONSIBLE FOR ANY DAMAGES INCURRED THROUGH THE USE OF THIS PROGRAM.
  32.  *  THE PROGRAM IS SUPPLIED "AS IS" AND NO WARRANTIES EXPRESS OR IMPLIED
  33.  *  ARE MADE REGARDING THIS PROGRAM INCLUDING THE WARRANTY OF FITNESS FOR
  34.  *  A PARTICULAR PURPOSE OR THE WARRANTY OF MERCHANTABILITY.
  35.  */
  36. #include <stdio.h>
  37. #include <ctype.h>
  38.  
  39. #define HASHSIZE 509        /* size of hash table (primes work best)      */
  40. #define IDSIZE   1024       /* maximum length of any identifier           */
  41. #define LNSIZE   31         /* maximum length of linker identifiers       */
  42. #define MAXLINE  128        /* start thinking about breaking output lines */
  43.  
  44. int col = 0;                /* output column, might exceed MAXLINE        */
  45. char id[IDSIZE];            /* buffer for incoming identifiers            */
  46. char *idp;                  /* pointer into the above buffer              */
  47. char *progname;             /* the name of this program from *argv        */
  48.  
  49. struct bucket {             /* hash bucket structure                      */
  50.     struct bucket *next;    /* next bucket with the same hash index       */
  51.     struct bucket *alt;     /* alias bucket, if any                       */
  52.     char          flags;    /* according to BUCKET_... below              */
  53.     char          name[1];  /* actually, these are variable size structs  */
  54. } *table[HASHSIZE];         /* the hash table                             */
  55.  
  56. #define BUCKET_OLD 1        /* is a generated name                        */
  57.  
  58. /*
  59.  * radixtab is a table of 'digits' in radix RADIX
  60.  */
  61. char radixtab[] = "123456789ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz";
  62.  
  63. #define RADIX (sizeof(radixtab)-1)
  64.  
  65. /*
  66.  * The following code implements CRC32, used here to generate suffixes
  67.  */
  68.  
  69. /*
  70.  * Copyright (C) 1986 Gary S. Brown.  You may use this program, or
  71.  * code or tables extracted from it, as desired without restriction.
  72.  */
  73.  
  74. /* First, the polynomial itself and its table of feedback terms.  The  */
  75. /* polynomial is                                                       */
  76. /* X^32+X^26+X^23+X^22+X^16+X^12+X^11+X^10+X^8+X^7+X^5+X^4+X^2+X^1+X^0 */
  77. /* Note that we take it "backwards" and put the highest-order term in  */
  78. /* the lowest-order bit.  The X^32 term is "implied"; the LSB is the   */
  79. /* X^31 term, etc.  The X^0 term (usually shown as "+1") results in    */
  80. /* the MSB being 1.                                                    */
  81.  
  82. /* Note that the usual hardware shift register implementation, which   */
  83. /* is what we're using (we're merely optimizing it by doing eight-bit  */
  84. /* chunks at a time) shifts bits into the lowest-order term.  In our   */
  85. /* implementation, that means shifting towards the right.  Why do we   */
  86. /* do it this way?  Because the calculated CRC must be transmitted in  */
  87. /* order from highest-order term to lowest-order term.  UARTs transmit */
  88. /* characters in order from LSB to MSB.  By storing the CRC this way,  */
  89. /* we hand it to the UART in the order low-byte to high-byte; the UART */
  90. /* sends each low-bit to hight-bit; and the result is transmission bit */
  91. /* by bit from highest- to lowest-order term without requiring any bit */
  92. /* shuffling on our part.  Reception works similarly.                  */
  93.  
  94. /* The feedback terms table consists of 256, 32-bit entries.  Notes:   */
  95. /*                                                                     */
  96. /*     The table can be generated at runtime if desired; code to do so */
  97. /*     is shown later.  It might not be obvious, but the feedback      */
  98. /*     terms simply represent the results of eight shift/xor opera-    */
  99. /*     tions for all combinations of data and CRC register values.     */
  100. /*                                                                     */
  101. /*     The values must be right-shifted by eight bits by the "updcrc"  */
  102. /*     logic; the shift must be unsigned (bring in zeroes).  On some   */
  103. /*     hardware you could probably optimize the shift in assembler by  */
  104. /*     using byte-swap instructions.                                   */
  105.  
  106. static unsigned long crc_32_tab[] = { /* CRC polynomial 0xedb88320 */
  107. 0x00000000, 0x77073096, 0xee0e612c, 0x990951ba, 0x076dc419, 0x706af48f, 0xe963a535, 0x9e6495a3,
  108. 0x0edb8832, 0x79dcb8a4, 0xe0d5e91e, 0x97d2d988, 0x09b64c2b, 0x7eb17cbd, 0xe7b82d07, 0x90bf1d91,
  109. 0x1db71064, 0x6ab020f2, 0xf3b97148, 0x84be41de, 0x1adad47d, 0x6ddde4eb, 0xf4d4b551, 0x83d385c7,
  110. 0x136c9856, 0x646ba8c0, 0xfd62f97a, 0x8a65c9ec, 0x14015c4f, 0x63066cd9, 0xfa0f3d63, 0x8d080df5,
  111. 0x3b6e20c8, 0x4c69105e, 0xd56041e4, 0xa2677172, 0x3c03e4d1, 0x4b04d447, 0xd20d85fd, 0xa50ab56b,
  112. 0x35b5a8fa, 0x42b2986c, 0xdbbbc9d6, 0xacbcf940, 0x32d86ce3, 0x45df5c75, 0xdcd60dcf, 0xabd13d59,
  113. 0x26d930ac, 0x51de003a, 0xc8d75180, 0xbfd06116, 0x21b4f4b5, 0x56b3c423, 0xcfba9599, 0xb8bda50f,
  114. 0x2802b89e, 0x5f058808, 0xc60cd9b2, 0xb10be924, 0x2f6f7c87, 0x58684c11, 0xc1611dab, 0xb6662d3d,
  115. 0x76dc4190, 0x01db7106, 0x98d220bc, 0xefd5102a, 0x71b18589, 0x06b6b51f, 0x9fbfe4a5, 0xe8b8d433,
  116. 0x7807c9a2, 0x0f00f934, 0x9609a88e, 0xe10e9818, 0x7f6a0dbb, 0x086d3d2d, 0x91646c97, 0xe6635c01,
  117. 0x6b6b51f4, 0x1c6c6162, 0x856530d8, 0xf262004e, 0x6c0695ed, 0x1b01a57b, 0x8208f4c1, 0xf50fc457,
  118. 0x65b0d9c6, 0x12b7e950, 0x8bbeb8ea, 0xfcb9887c, 0x62dd1ddf, 0x15da2d49, 0x8cd37cf3, 0xfbd44c65,
  119. 0x4db26158, 0x3ab551ce, 0xa3bc0074, 0xd4bb30e2, 0x4adfa541, 0x3dd895d7, 0xa4d1c46d, 0xd3d6f4fb,
  120. 0x4369e96a, 0x346ed9fc, 0xad678846, 0xda60b8d0, 0x44042d73, 0x33031de5, 0xaa0a4c5f, 0xdd0d7cc9,
  121. 0x5005713c, 0x270241aa, 0xbe0b1010, 0xc90c2086, 0x5768b525, 0x206f85b3, 0xb966d409, 0xce61e49f,
  122. 0x5edef90e, 0x29d9c998, 0xb0d09822, 0xc7d7a8b4, 0x59b33d17, 0x2eb40d81, 0xb7bd5c3b, 0xc0ba6cad,
  123. 0xedb88320, 0x9abfb3b6, 0x03b6e20c, 0x74b1d29a, 0xead54739, 0x9dd277af, 0x04db2615, 0x73dc1683,
  124. 0xe3630b12, 0x94643b84, 0x0d6d6a3e, 0x7a6a5aa8, 0xe40ecf0b, 0x9309ff9d, 0x0a00ae27, 0x7d079eb1,
  125. 0xf00f9344, 0x8708a3d2, 0x1e01f268, 0x6906c2fe, 0xf762575d, 0x806567cb, 0x196c3671, 0x6e6b06e7,
  126. 0xfed41b76, 0x89d32be0, 0x10da7a5a, 0x67dd4acc, 0xf9b9df6f, 0x8ebeeff9, 0x17b7be43, 0x60b08ed5,
  127. 0xd6d6a3e8, 0xa1d1937e, 0x38d8c2c4, 0x4fdff252, 0xd1bb67f1, 0xa6bc5767, 0x3fb506dd, 0x48b2364b,
  128. 0xd80d2bda, 0xaf0a1b4c, 0x36034af6, 0x41047a60, 0xdf60efc3, 0xa867df55, 0x316e8eef, 0x4669be79,
  129. 0xcb61b38c, 0xbc66831a, 0x256fd2a0, 0x5268e236, 0xcc0c7795, 0xbb0b4703, 0x220216b9, 0x5505262f,
  130. 0xc5ba3bbe, 0xb2bd0b28, 0x2bb45a92, 0x5cb36a04, 0xc2d7ffa7, 0xb5d0cf31, 0x2cd99e8b, 0x5bdeae1d,
  131. 0x9b64c2b0, 0xec63f226, 0x756aa39c, 0x026d930a, 0x9c0906a9, 0xeb0e363f, 0x72076785, 0x05005713,
  132. 0x95bf4a82, 0xe2b87a14, 0x7bb12bae, 0x0cb61b38, 0x92d28e9b, 0xe5d5be0d, 0x7cdcefb7, 0x0bdbdf21,
  133. 0x86d3d2d4, 0xf1d4e242, 0x68ddb3f8, 0x1fda836e, 0x81be16cd, 0xf6b9265b, 0x6fb077e1, 0x18b74777,
  134. 0x88085ae6, 0xff0f6a70, 0x66063bca, 0x11010b5c, 0x8f659eff, 0xf862ae69, 0x616bffd3, 0x166ccf45,
  135. 0xa00ae278, 0xd70dd2ee, 0x4e048354, 0x3903b3c2, 0xa7672661, 0xd06016f7, 0x4969474d, 0x3e6e77db,
  136. 0xaed16a4a, 0xd9d65adc, 0x40df0b66, 0x37d83bf0, 0xa9bcae53, 0xdebb9ec5, 0x47b2cf7f, 0x30b5ffe9,
  137. 0xbdbdf21c, 0xcabac28a, 0x53b39330, 0x24b4a3a6, 0xbad03605, 0xcdd70693, 0x54de5729, 0x23d967bf,
  138. 0xb3667a2e, 0xc4614ab8, 0x5d681b02, 0x2a6f2b94, 0xb40bbe37, 0xc30c8ea1, 0x5a05df1b, 0x2d02ef8d
  139. };
  140.  
  141. #define UPDC32(octet, crc) (crc_32_tab[((crc) ^ (octet)) & 0xff] ^ ((crc) >> 8))
  142.  
  143. /*
  144.  * look up an identifier in the hash table, return bucket ptr if found.
  145.  * if not found then create a new bucket and return a pointer to it.
  146.  */
  147. struct bucket *
  148. lookup (id, len)
  149.     char    *id;
  150.     int     len;
  151. {
  152.     register unsigned long  h;
  153.     register char          *p, *q;
  154.     register struct bucket *b;
  155.  
  156.     for (p = id, h = 0; *p != '\0'; h <<= 1, h ^= *p++) {}
  157.     for (b = table[h %= HASHSIZE]; b; b = b->next) {
  158.         p = id;
  159.         q = b->name;
  160.         for (;;) {
  161.             if (*p == 0)
  162.                 if (*q == 0)
  163.                     return (b);
  164.                 else
  165.                     break;
  166.             else if (*q == 0)
  167.                 break;
  168.             else if (*q++ != *p++)
  169.                 break;
  170.         }
  171.     }
  172.     b = (struct bucket *) malloc (sizeof (struct bucket) + len + 1);
  173.     for (p = id, q = b->name; (*q++ = *p++) != '\0'; ) {}
  174.     b->next = table[h];
  175.     b->alt = NULL;
  176.     b->flags = 0;
  177.     table[h] = b;
  178.     return (b);
  179.  
  180. /*
  181.  * Generate an alias for a name longer than LNSIZE.
  182.  * Enter the alias in the hash table, returning the bucket pointer.
  183.  */
  184. struct bucket *
  185. alias (id, len)
  186.     char    *id;
  187.     int     len;
  188. {
  189.     char     name[LNSIZE+1];
  190.     register unsigned long  crc;
  191.     register unsigned long  t;
  192.     register char          *p, *q;
  193.     register int            s;
  194.     register struct bucket *bp;
  195.  
  196.     for (crc = 0; ; ) {
  197.         for (s = 0, p = id, q = name; s < LNSIZE; ++s)
  198.             *q++ = *p++;
  199.         *q = '\0';
  200.  
  201.         for (p = id; *p; ++p)
  202.             crc = UPDC32(*p, crc);
  203.  
  204.         for(t = crc; t; ) {
  205.             *--q = radixtab[t % RADIX];
  206.             t /= RADIX;
  207.         }
  208.  
  209.         bp = lookup (name, LNSIZE);
  210.         if (!(bp->flags & BUCKET_OLD))
  211.             break;
  212.  
  213.         fprintf (stderr, "%s: collision of name alias \"%s\"\n", progname, id);
  214.     }
  215.     bp->flags |= BUCKET_OLD;
  216.     return (bp);
  217. }
  218.  
  219. /*
  220.  * An identifier has just been parsed from the source file.
  221.  * Remember the identifier in the hash table if it's long enough
  222.  * to collide with a generated name.  If it has an alias, output 
  223.  * the alias instead.  If it needs an alias, generate one and 
  224.  * output it instead.  Otherwise, output the identifier itself.
  225.  */
  226. void
  227. handle (id, len)
  228.     char    *id;
  229.     int     len;
  230. {
  231.     register struct bucket *b;
  232.     register char          *p;
  233.  
  234.     if (len >= LNSIZE) {
  235.         b = lookup (id, len);
  236.         b->flags |= BUCKET_OLD;
  237.         if (b->alt != NULL)
  238.             b = b->alt;
  239.         else if (len > LNSIZE) {
  240.             putchar ('/');
  241.             ++col;
  242.             for (p = "* police! "; *p; putchar(*p), ++p, ++col) {}
  243.             for (p = id;           *p; putchar(*p), ++p, ++col) {}
  244.             for (p = " */ ";       *p; putchar(*p), ++p, ++col) {}
  245.             b->alt = alias (id, len);
  246.             b = b->alt;
  247.         }
  248.         id = b->name;
  249.     }
  250.     for (p = id; *p != '\0'; putchar (*p), ++p, ++col) {}
  251.  
  252. /*
  253.  * A slash-slash style comment has been introduced.
  254.  * Eat characters until a newline is found.
  255.  */
  256. int
  257. eatbcpl ( ) 
  258. {
  259.     register int c = 0;
  260.  
  261.     while (c != EOF && c != '\n')
  262.         c = getchar ( );
  263.     return (c);
  264. }
  265.  
  266. /*
  267.  * A slash-star style comment has been introduced.
  268.  * Eat characters until the star-slash is found.
  269.  * Echo newlines so the line count is preserved.
  270.  */
  271. int
  272. eatcomment ( )
  273. {
  274.     register int c;
  275.  
  276.     for(;;) {
  277.         c = getchar ( );
  278.         if (c == '*') {
  279.             c = getchar ( );
  280.             if (c == '/')
  281.                 return (0);
  282.             if (c == EOF) {
  283.                 return (c);
  284.             } else if (c == '\n') {
  285.                 putchar (c);
  286.                 col = 0;
  287.             }
  288.         } else if (c == '\n') {
  289.             putchar (c);
  290.             col = 0;
  291.         } else if (c == EOF)
  292.             return (c);
  293.     }
  294.  
  295. /*
  296.  * A character constant or string has been introduced with the delimiter c.
  297.  * Eat and echo characters until the delimiter is found, taking escape
  298.  * sequences into account.
  299.  */
  300. void
  301. eatcc (quote)
  302.     register int quote;
  303. {
  304.     register int peek;
  305.  
  306.     putchar(quote);
  307.     ++col;
  308.     for (peek = getchar ( ); peek != quote; peek = getchar ( )) {
  309.         if (peek == EOF)         break;
  310.         else if (peek == '\n')   break;
  311.         else if (peek == '\\') {
  312.             peek = getchar ( );
  313.             if (peek == EOF)     break;
  314.             else if (peek == '\n') {
  315.                 putchar ('\\');
  316.                 putchar ('\n');
  317.                 col = 0;
  318.  
  319.                 continue;
  320.  
  321.             } else {
  322.                 /* note: this handles \' and \" too. */
  323.                 putchar ('\\');
  324.                 ++col;
  325.             }
  326.         }
  327.         putchar (peek);
  328.         ++col;
  329.     }
  330. }
  331.  
  332. /*
  333.  * The main program.
  334.  * This is basically a partial lexical analyzer for the C language.
  335.  * An attempt is made to break long lines after commas or semicolons.
  336.  * Duplicate blanks and tabs are squashed out, as are comments.
  337.  * Character constants and strings are carefully preserved.
  338.  * Most importantly, identifiers longer than LNSIZE are aliased.
  339.  */
  340. main (argc, argv) 
  341.     int argc;
  342.     char *argv[];
  343. {
  344.     register int peekc;
  345.     register int c;
  346.  
  347.     progname = *argv;
  348.  
  349.     for (peekc = 0;;) {
  350.  
  351.         if (peekc) {
  352.             c = peekc;
  353.             peekc = 0;
  354.         } else
  355.             c = getchar ( );
  356.  
  357.         switch (c) {
  358.         case EOF:
  359.             exit (0);
  360.         case ',':
  361.         case ';':
  362.             if (col > MAXLINE) {
  363.                 putchar (c);
  364.                 c = '\n';
  365.                 col = 0;
  366.             }
  367.             break;
  368.         case '\n':
  369.             col = 0;
  370.             break;
  371.         case ' ':
  372.         case '\t':
  373.             peekc = getchar ( );
  374.             if (peekc == c)
  375.                 continue;
  376.             break;
  377.         case '/':
  378.             peekc = getchar ( );
  379.             if (peekc == '/')
  380.                 peekc = eatbcpl ( );
  381.             else if (peekc == '*')
  382.                 peekc = eatcomment ( );
  383.             else
  384.                 break;
  385.             continue;
  386.         case '"':
  387.         case '\'':
  388.             eatcc (c);
  389.         default:
  390.             if (isalpha (c) || '_' == c || c == '$') {
  391.                     idp = id;
  392.                     while (isalnum (c) || '_' == c || c == '$') {
  393.                         if (idp >= id + IDSIZE) {
  394.                             fprintf (stderr, "%s: Identifier too long.\n", progname);
  395.                             exit (1);
  396.                         }
  397.                         *idp++ = c;
  398.                         c = getchar ( );
  399.                     }
  400.                 peekc = c;
  401.                 *idp = 0;
  402.                 handle (id, idp - id);
  403.                 continue;
  404.             } else
  405.                 break;
  406.         }
  407.         putchar (c);
  408.         ++col;
  409.     }
  410. }
  411.  
  412. Robert J. Kelley @ Mentor Graphics Corporation
  413. ...!tektronix!sequent!mntgfx!bobk or bobk@mntgfx.MENTOR.COM
  414.  
  415. -- 
  416. Robert J. Kelley
  417. ...!tektronix!sequent!mntgfx!bobk or bobk@mntgfx.MENTOR.COM
  418.