home *** CD-ROM | disk | FTP | other *** search
/ POINT Software Programming / PPROG1.ISO / c / snippets / bmhsrch.c < prev    next >
C/C++ Source or Header  |  1994-04-03  |  2KB  |  69 lines

  1. /*
  2. **  Case-sensitive Boyer-Moore-Horspool pattern match
  3. **
  4. **  public domain by Raymond Gardner 7/92
  5. **
  6. **  limitation: pattern length + string length must be less than 32767
  7. **
  8. **  10/21/93 rdg  Fixed bug found by Jeff Dunlop
  9. */
  10. #include <limits.h>                                         /* rdg 10/93 */
  11. #include <stddef.h>
  12. #include <string.h>
  13.  
  14. typedef unsigned char uchar;
  15.  
  16. #define LARGE 32767
  17.  
  18. static int patlen;
  19. static int skip[UCHAR_MAX+1];                               /* rdg 10/93 */
  20. static int skip2;
  21. static uchar *pat;
  22.  
  23. void bmh_init(const char *pattern)
  24. {
  25.           int i, lastpatchar;
  26.  
  27.           pat = (uchar *)pattern;
  28.           patlen = strlen(pattern);
  29.           for (i = 0; i <= UCHAR_MAX; ++i)                  /* rdg 10/93 */
  30.                 skip[i] = patlen;
  31.           for (i = 0; i < patlen; ++i)
  32.                 skip[pat[i]] = patlen - i - 1;
  33.           lastpatchar = pat[patlen - 1];
  34.           skip[lastpatchar] = LARGE;
  35.           skip2 = patlen;                 /* Horspool's fixed second shift */
  36.           for (i = 0; i < patlen - 1; ++i)
  37.           {
  38.                 if (pat[i] == lastpatchar)
  39.                       skip2 = patlen - i - 1;
  40.           }
  41. }
  42.  
  43. char *bmh_search(const char *string, const int stringlen)
  44. {
  45.       int i, j;
  46.       char *s;
  47.  
  48.       i = patlen - 1 - stringlen;
  49.       if (i >= 0)
  50.             return NULL;
  51.       string += stringlen;
  52.       for ( ;; )
  53.       {
  54.             while ( (i += skip[((uchar *)string)[i]]) < 0 )
  55.                   ;                           /* mighty fast inner loop */
  56.             if (i < (LARGE - stringlen))
  57.                   return NULL;
  58.             i -= LARGE;
  59.             j = patlen - 1;
  60.             s = (char *)string + (i - j);
  61.             while (--j >= 0 && s[j] == pat[j])
  62.                   ;
  63.             if ( j < 0 )                                    /* rdg 10/93 */
  64.                   return s;                                 /* rdg 10/93 */
  65.             if ( (i += skip2) >= 0 )                        /* rdg 10/93 */
  66.                   return NULL;                              /* rdg 10/93 */
  67.       }
  68. }
  69.