home *** CD-ROM | disk | FTP | other *** search
/ Windows NT Super Tune-Up Kit / PIE-WindowsNTSuperTuneUpKit-1997.iso / COMPRESS / NTZIP201 / ZIPSPLIT.C < prev    next >
C/C++ Source or Header  |  1993-09-10  |  18KB  |  615 lines

  1. /*
  2.  
  3.  Copyright (C) 1990-1993 Mark Adler, Richard B. Wales, Jean-loup Gailly,
  4.  Kai Uwe Rommel and Igor Mandrichenko.
  5.  Permission is granted to any individual or institution to use, copy, or
  6.  redistribute this software so long as all of the original files are included,
  7.  that it is not sold for profit, and that this copyright notice is retained.
  8.  
  9. */
  10.  
  11. /*
  12.  *  zipsplit.c by Mark Adler.
  13.  */
  14.  
  15. #define UTIL
  16. #include "revision.h"
  17. #include "zip.h"
  18. #include <signal.h>
  19.  
  20. #define DEFSIZ 36000L   /* Default split size (change in help() too) */
  21. #if defined(MSDOS) || defined(__human68k__)
  22. #  define NL 2          /* Number of bytes written for a \n */
  23. #else /* !MSDOS */
  24. #  define NL 1          /* Number of bytes written for a \n */
  25. #endif /* ?MSDOS */
  26. #define INDEX "zipsplit.idx"    /* Name of index file */
  27.  
  28.  
  29. /* Local functions */
  30. #ifdef PROTO
  31.    local void handler(int);
  32.    local void license(void);
  33.    local void help(void);
  34.    local extent simple(ulg *, extent, ulg, ulg);
  35.    local int descmp(const voidp *, const voidp *);
  36.    local extent greedy(ulg *, extent, ulg, ulg);
  37.    int main(int, char **);
  38. #endif /* PROTO */
  39.  
  40.  
  41. /* Output zip files */
  42. local char template[16];        /* name template for output files */
  43. local int zipsmade = 0;         /* number of zip files made */
  44. local int indexmade = 0;        /* true if index file made */
  45. local char *path = NULL;        /* space for full name */
  46. local char *name;               /* where name goes in path[] */
  47.  
  48.  
  49. void err(c, h)
  50. int c;                  /* error code from the ZE_ class */
  51. char *h;                /* message about how it happened */
  52. /* Issue a message for the error, clean up files and memory, and exit. */
  53. {
  54.   if (PERR(c))
  55.     perror("zipsplit error");
  56.   fprintf(stderr, "zipsplit error: %s (%s)\n", errors[c-1], h);
  57.   if (indexmade)
  58.   {
  59.     strcpy(name, INDEX);
  60.     destroy(path);
  61.   }
  62.   for (; zipsmade; zipsmade--)
  63.   {
  64.     sprintf(name, template, zipsmade);
  65.     destroy(path);
  66.   }
  67.   if (path != NULL)
  68.     free((voidp *)path);
  69.   if (zipfile != NULL)
  70.     free((voidp *)zipfile);
  71. #ifdef VMS
  72.   exit(0);
  73. #else /* !VMS */
  74.   exit(c);
  75. #endif /* ?VMS */
  76. }
  77.  
  78.  
  79.  
  80. local void handler(s)
  81. int s;                  /* signal number (ignored) */
  82. /* Upon getting a user interrupt, abort cleanly using err(). */
  83. {
  84. #ifndef MSDOS
  85.   putc('\n', stderr);
  86. #endif /* !MSDOS */
  87.   err(ZE_ABORT, "aborting");
  88.   s++;                                  /* keep some compilers happy */
  89. }
  90.  
  91.  
  92. void warn(a, b)
  93. char *a, *b;            /* message strings juxtaposed in output */
  94. /* Print a warning message to stderr and return. */
  95. {
  96.   fprintf(stderr, "zipsplit warning: %s%s\n", a, b);
  97. }
  98.  
  99.  
  100. local void license()
  101. /* Print license information to stdout. */
  102. {
  103.   extent i;             /* counter for copyright array */
  104.  
  105.   for (i = 0; i < sizeof(copyright)/sizeof(char *); i++) {
  106.     printf(copyright[i], "zipsplit");
  107.     putchar('\n');
  108.   }
  109.   for (i = 0; i < sizeof(disclaimer)/sizeof(char *); i++)
  110.     puts(disclaimer[i]);
  111. }
  112.  
  113.  
  114. local void help()
  115. /* Print help (along with license info) to stdout. */
  116. {
  117.   extent i;             /* counter for help array */
  118.  
  119.   /* help array */
  120.   static char *text[] = {
  121. "",
  122. "ZipSplit %s (%s)",
  123. "Usage:  zipsplit [-ti] [-n size] [-b path] zipfile",
  124. "  -t   report how many files it will take, but don't make them",
  125. "  -i   make index (zipsplit.idx) and count its size against first zip file",
  126. "  -n   make zip files no larger than \"size\" (default = 36000)",
  127. "  -b   use \"path\" for the output zip files",
  128. "  -p   pause between output zip files",
  129. "  -s   do a sequential split even if it takes more zip files",
  130. "  -h   show this help               -L   show software license"
  131.   };
  132.  
  133.   for (i = 0; i < sizeof(copyright)/sizeof(char *); i++) {
  134.     printf(copyright[i], "zipsplit");
  135.     putchar('\n');
  136.   }
  137.   for (i = 0; i < sizeof(text)/sizeof(char *); i++)
  138.   {
  139.     printf(text[i], VERSION, REVDATE);
  140.     putchar('\n');
  141.   }
  142. }
  143.  
  144.  
  145. local extent simple(a, n, c, d)
  146. ulg *a;         /* items to put in bins, return value: destination bins */
  147. extent n;       /* number of items */
  148. ulg c;          /* capacity of each bin */
  149. ulg d;          /* amount to deduct from first bin */
  150. /* Return the number of bins of capacity c that are needed to contain the
  151.    integers in a[0..n-1] placed sequentially into the bins.  The value d
  152.    is deducted initially from the first bin (space for index).  The entries
  153.    in a[] are replaced by the destination bins. */
  154. {
  155.   extent k;     /* current bin number */
  156.   ulg t;        /* space used in current bin */
  157.  
  158.   t = k = 0;
  159.   while (n--)
  160.   {
  161.     if (*a + t > c - (k == 0 ? d : 0))
  162.     {
  163.       k++;
  164.       t = 0;
  165.     }
  166.     t += *a;
  167.     *(ulg huge *)a++ = k;
  168.   }
  169.   return k + 1;
  170. }
  171.  
  172.  
  173. local int descmp(a, b)
  174. const voidp *a, *b;           /* pointers to pointers to ulg's to compare */
  175. /* Used by qsort() in greedy() to do a descending sort. */
  176. {
  177.   return **(ulg **)a < **(ulg **)b ? 1 : (**(ulg **)a > **(ulg **)b ? -1 : 0);
  178. }
  179.  
  180.  
  181. local extent greedy(a, n, c, d)
  182. ulg *a;         /* items to put in bins, return value: destination bins */
  183. extent n;       /* number of items */
  184. ulg c;          /* capacity of each bin */
  185. ulg d;          /* amount to deduct from first bin */
  186. /* Return the number of bins of capacity c that are needed to contain the
  187.    items with sizes a[0..n-1] placed non-sequentially into the bins.  The
  188.    value d is deducted initially from the first bin (space for index).
  189.    The entries in a[] are replaced by the destination bins. */
  190. {
  191.   ulg *b;       /* space left in each bin (malloc'ed for each m) */
  192.   ulg *e;       /* copy of argument a[] (malloc'ed) */
  193.   extent i;     /* steps through items */
  194.   extent j;     /* steps through bins */
  195.   extent k;     /* best bin to put current item in */
  196.   extent m;     /* current number of bins */
  197.   ulg **s;      /* pointers to e[], sorted descending (malloc'ed) */
  198.   ulg t;        /* space left in best bin (index k) */
  199.  
  200.   /* Algorithm:
  201.      1. Copy a[] to e[] and sort pointers to e[0..n-1] (in s[]), in
  202.         descending order.
  203.      2. Compute total of s[] and set m to the smallest number of bins of
  204.         capacity c that can hold the total.
  205.      3. Allocate m bins.
  206.      4. For each item in s[], starting with the largest, put it in the
  207.         bin with the smallest current capacity greater than or equal to the
  208.         item's size.  If no bin has enough room, increment m and go to step 4.
  209.      5. Else, all items ended up in a bin--return m.
  210.   */
  211.  
  212.   /* Copy a[] to e[], put pointers to e[] in s[], and sort s[].  Also compute
  213.      the initial number of bins (minus 1). */
  214.   if ((e = (ulg *)malloc(n * sizeof(ulg))) == NULL ||
  215.       (s = (ulg **)malloc(n * sizeof(ulg *))) == NULL)
  216.   {
  217.     if (e != NULL)
  218.       free((voidp *)e);
  219.     err(ZE_MEM, "was trying a smart split");
  220.     return 0;                           /* only to make compiler happy */
  221.   }
  222.   memcpy((char *)e, (char *)a, n * sizeof(ulg));
  223.   for (t = i = 0; i < n; i++)
  224.     t += *(s[i] = e + i);
  225.   m = (extent)((t + c - 1) / c) - 1;    /* pre-decrement for loop */
  226.   qsort((char *)s, n, sizeof(ulg *), descmp);
  227.  
  228.   /* Stuff bins until successful */
  229.   do {
  230.     /* Increment the number of bins, allocate and initialize bins */
  231.     if ((b = (ulg *)malloc(++m * sizeof(ulg))) == NULL)
  232.     {
  233.       free((voidp *)s);
  234.       free((voidp *)e);
  235.       err(ZE_MEM, "was trying a smart split");
  236.     }
  237.     b[0] = c - d;                       /* leave space in first bin */
  238.     for (j = 1; j < m; j++)
  239.       b[j] = c;
  240.  
  241.     /* Fill the bins greedily */
  242.     for (i = 0; i < n; i++)
  243.     {
  244.       /* Find smallest bin that will hold item i (size s[i]) */
  245.       t = c + 1;
  246.       for (k = j = 0; j < m; j++)
  247.         if (*s[i] <= b[j] && b[j] < t)
  248.           t = b[k = j];
  249.  
  250.       /* If no bins big enough for *s[i], try next m */
  251.       if (t == c + 1)
  252.         break;
  253.  
  254.       /* Diminish that bin and save where it goes */
  255.       b[k] -= *s[i];
  256.       a[(int)((ulg huge *)(s[i]) - (ulg huge *)e)] = k;
  257.     }
  258.  
  259.     /* Clean up */
  260.     free((voidp *)b);
  261.  
  262.     /* Do until all items put in a bin */
  263.   } while (i < n);
  264.  
  265.   /* Done--clean up and return the number of bins needed */
  266.   free((voidp *)s);
  267.   free((voidp *)e);
  268.   return m;
  269. }
  270.  
  271.  
  272. int main(argc, argv)
  273. int argc;               /* number of tokens in command line */
  274. char **argv;            /* command line tokens */
  275. /* Split a zip file into several zip files less than a specified size.  See
  276.    the command help in help() above. */
  277. {
  278.   ulg *a;               /* malloc'ed list of sizes, dest bins */
  279.   extent *b;            /* heads of bin linked lists (malloc'ed) */
  280.   ulg c;                /* bin capacity, start of central directory */
  281.   int d;                /* if true, just report the number of disks */
  282.   FILE *e;              /* input zip file */
  283.   FILE *f;              /* output index and zip files */
  284.   extent g;             /* number of bins from greedy(), entry to write */
  285.   int h;                /* how to split--true means simple split, counter */
  286.   ulg i;                /* size of index file or zero if none */
  287.   extent j;             /* steps through zip entries, bins */
  288.   int k;                /* next argument type */
  289.   ulg *p;               /* malloc'ed list of sizes, dest bins for greedy() */
  290.   char *q;              /* steps through option characters */
  291.   int r;                /* temporary variable, counter */
  292.   extent s;             /* number of bins needed */
  293.   ulg t;                /* total of sizes, end of central directory */
  294.   int u;                /* flag to wait for user on output files */
  295.   struct zlist far **w; /* malloc'ed table for zfiles linked list */
  296.   int x;                /* if true, make an index file */
  297.   struct zlist far *z;  /* steps through zfiles linked list */
  298. #ifdef AMIGA
  299.   char tailchar;         /* temporary variable used in name generation below */
  300. #endif
  301.  
  302.   /* If no args, show help */
  303.   if (argc == 1)
  304.   {
  305.     help();
  306.     exit(0);
  307.   }
  308.  
  309.   init_upper();           /* build case map table */
  310.  
  311.   /* Go through args */
  312.   signal(SIGINT, handler);
  313. #ifdef SIGTERM                 /* Amiga has no SIGTERM */
  314.   signal(SIGTERM, handler);
  315. #endif
  316.   k = h = x = d = u = 0;
  317.   c = DEFSIZ;
  318.   for (r = 1; r < argc; r++)
  319.     if (*argv[r] == '-')
  320.       if (argv[r][1])
  321.         for (q = argv[r]+1; *q; q++)
  322.           switch(*q)
  323.           {
  324.             case 'b':   /* Specify path for output files */
  325.               if (k)
  326.                 err(ZE_PARMS, "options are separate and precede zip file");
  327.               else
  328.                 k = 1;          /* Next non-option is path */
  329.               break;
  330.             case 'h':   /* Show help */
  331.               help();  exit(0);
  332.             case 'i':   /* Make an index file */
  333.               x = 1;
  334.               break;
  335.             case 'l': case 'L':  /* Show copyright and disclaimer */
  336.               license();  exit(0);
  337.             case 'n':   /* Specify maximum size of resulting zip files */
  338.               if (k)
  339.                 err(ZE_PARMS, "options are separate and precede zip file");
  340.               else
  341.                 k = 2;          /* Next non-option is size */
  342.               break;
  343.             case 'p':
  344.               u = 1;
  345.             case 's':
  346.               h = 1;    /* Only try simple */
  347.               break;
  348.             case 't':   /* Just report number of disks */
  349.               d = 1;
  350.               break;
  351.             default:
  352.               err(ZE_PARMS, "Use option -h for help.");
  353.           }
  354.       else
  355.         err(ZE_PARMS, "zip file cannot be stdin");
  356.     else
  357.       if (k == 0)
  358.         if (zipfile == NULL)
  359.         {
  360.           if ((zipfile = ziptyp(argv[r])) == NULL)
  361.             err(ZE_MEM, "was processing arguments");
  362.         }
  363.         else
  364.           err(ZE_PARMS, "can only specify one zip file");
  365.       else if (k == 1)
  366.       {
  367.         tempath = argv[r];
  368.         k = 0;
  369.       }
  370.       else              /* k must be 2 */
  371.       {
  372.         if ((c = (ulg)atol(argv[r])) < 100)     /* 100 is smallest zip file */
  373.           err(ZE_PARMS, "invalid size given. Use option -h for help.");
  374.         k = 0;
  375.       }
  376.   if (zipfile == NULL)
  377.     err(ZE_PARMS, "need to specify zip file");
  378.  
  379.  
  380.   /* Read zip file */
  381.   if ((r = readzipfile()) != ZE_OK)
  382.     err(r, zipfile);
  383.   if (zfiles == NULL)
  384.     err(ZE_NAME, zipfile);
  385.  
  386.   /* Make a list of sizes and check against capacity.  Also compute the
  387.      size of the index file. */
  388.   c -= ENDHEAD + 4;                     /* subtract overhead/zipfile */
  389.   if ((a = (ulg *)malloc(zcount * sizeof(ulg))) == NULL ||
  390.       (w = (struct zlist far **)malloc(zcount * sizeof(struct zlist far *))) ==
  391.        NULL)
  392.   {
  393.     if (a != NULL)
  394.       free((voidp *)a);
  395.     err(ZE_MEM, "was computing split");
  396.     return 1;
  397.   }
  398.   i = t = 0;
  399.   for (j = 0, z = zfiles; j < zcount; j++, z = z->nxt)
  400.   {
  401.     w[j] = z;
  402.     if (x)
  403.       i += z->nam + 6 + NL;
  404.     t += a[j] = 8 + LOCHEAD + CENHEAD +
  405.            2 * (ulg)z->nam + 2 * (ulg)z->ext + z->com + z->siz;
  406.     if (a[j] > c)
  407.     {
  408.       free((voidp *)w);  free((voidp *)a);
  409.       err(ZE_BIG, z->zname);
  410.     }
  411.   }
  412.  
  413.   /* Decide on split to use, report number of files */
  414.   if (h)
  415.     s = simple(a, zcount, c, i);
  416.   else
  417.   {
  418.     if ((p = (ulg *)malloc(zcount * sizeof(ulg))) == NULL)
  419.     {
  420.       free((voidp *)w);  free((voidp *)a);
  421.       err(ZE_MEM, "was computing split");
  422.     }
  423.     memcpy((char *)p, (char *)a, zcount * sizeof(ulg));
  424.     s = simple(a, zcount, c, i);
  425.     g = greedy(p, zcount, c, i);
  426.     if (s <= g)
  427.       free((voidp *)p);
  428.     else
  429.     {
  430.       free((voidp *)a);
  431.       a = p;
  432.       s = g;
  433.     }
  434.   }
  435.   printf("%d zip files w%s be made (%d%% efficiency)\n",
  436.          s, d ? "ould" : "ill", ((200 * ((t + c - 1)/c)) / s + 1) >> 1);
  437.   if (d)
  438.   {
  439.     free((voidp *)w);  free((voidp *)a);
  440.     free((voidp *)zipfile);
  441.     zipfile = NULL;
  442.     exit(0);
  443.   }
  444.  
  445.   /* Set up path for output files */
  446.   if ((path = malloc(tempath == NULL ? 13 : strlen(tempath) + 14)) == NULL)
  447.     err(ZE_MEM, "was making output file names");
  448.   if (tempath == NULL)
  449.      name = path;
  450.   else
  451.   {
  452.     strcpy(path, tempath);
  453. #ifdef AMIGA
  454.     tailchar = path[strlen(path) - 1];  /* last character */
  455.     if (path[0] && (tailchar != '/') && (tailchar != ':'))
  456.       strcat(path, "/");
  457.     name = path + strlen(path);
  458. #else
  459.     if (path[0] && path[strlen(path) - 1] != '/')
  460.       strcat(path, "/");
  461.     name = path + strlen(path);
  462. #endif /* ?AMIGA */
  463.   }
  464.  
  465.   /* Write the index file */
  466.   if (u)
  467.   {
  468.     char m[10];
  469.     fputs("Insert first disk and hit return: ", stderr);
  470.     fgets(m, 10, stdin);
  471.   }
  472.   if (x)
  473.   {
  474.     strcpy(name, INDEX);
  475.     printf("creating: %s\n", path);
  476.     indexmade = 1;
  477.     if ((f = fopen(path, "w")) == NULL)
  478.     {
  479.       free((voidp *)w);  free((voidp *)a);
  480.       err(ZE_CREAT, path);
  481.     }
  482.     for (j = 0; j < zcount; j++)
  483.       fprintf(f, "%5ld %s\n", a[j] + 1, w[j]->zname);
  484.     if ((j = ferror(f)) != 0 || fclose(f))
  485.     {
  486.       if (j)
  487.         fclose(f);
  488.       free((voidp *)w);  free((voidp *)a);
  489.       err(ZE_WRITE, path);
  490.     }
  491.   }
  492.  
  493.   /* Make linked lists of results */
  494.   if ((b = (extent *)malloc(s * sizeof(extent))) == NULL)
  495.   {
  496.     free((voidp *)w);  free((voidp *)a);
  497.     err(ZE_MEM, "was computing split");
  498.   }
  499.   for (j = 0; j < s; j++)
  500.     b[j] = (extent)-1;
  501.   j = zcount;
  502.   while (j--)
  503.   {
  504.     g = (extent)a[j];
  505.     a[j] = b[g];
  506.     b[g] = j;
  507.   }
  508.  
  509.   /* Make a name template for the zip files that is eight or less characters
  510.      before the .zip, and that will not overwrite the original zip file. */
  511.   for (k = 1, j = s; j >= 10; j /= 10)
  512.     k++;
  513.   if (k > 7)
  514.   {
  515.     free((voidp *)b);  free((voidp *)w);  free((voidp *)a);
  516.     err(ZE_PARMS, "way too many zip files must be made");
  517.   }
  518. #ifdef VMS
  519.   if ((q = strrchr(zipfile, ']')) != NULL)
  520. #else /* !VMS */
  521. #  ifdef AMIGA
  522.   if (((q = strrchr(zipfile, '/')) != NULL)
  523.                        || ((q = strrchr(zipfile, ':'))) != NULL)
  524. #  else /* !AMIGA */
  525.   if ((q = strrchr(zipfile, '/')) != NULL)
  526. #  endif /* ?AMIGA */
  527. #endif /* ?VMS */
  528.     q++;
  529.   else
  530.     q = zipfile;
  531.   r = 0;
  532.   while ((g = *q++) != 0 && g != '.' && r < 8 - k)
  533.     template[r++] = (char)g;
  534.   if (r == 0)
  535.     template[r++] = '_';
  536.   else if (g >= '0' && g <= '9')
  537.     template[r - 1] = (char)(template[r - 1] == '_' ? '-' : '_');
  538.   sprintf(template + r, "%%0%dd.zip", k);
  539.  
  540.   /* Make the zip files from the linked lists of entry numbers */
  541.   if ((e = fopen(zipfile, FOPR)) == NULL)
  542.   {
  543.     free((voidp *)b);  free((voidp *)w);  free((voidp *)a);
  544.     err(ZE_NAME, zipfile);
  545.   }
  546.   free((voidp *)zipfile);
  547.   zipfile = NULL;
  548.   for (j = 0; j < s; j++)
  549.   {
  550.     if (u && j)
  551.     {
  552.       char m[10];
  553.       fputs("Insert next disk and hit return: ", stderr);
  554.       fgets(m, 10, stdin);
  555.     }
  556.     sprintf(name, template, j + 1);
  557.     printf("creating: %s\n", path);
  558.     zipsmade = j + 1;
  559.     if ((f = fopen(path, FOPW)) == NULL)
  560.     {
  561.       free((voidp *)b);  free((voidp *)w);  free((voidp *)a);
  562.       err(ZE_CREAT, path);
  563.     }
  564.     tempzn = 0;
  565.     for (g = b[j]; g != (extent)-1; g = (extent)a[g])
  566.     {
  567.       if (fseek(e, w[g]->off, SEEK_SET))
  568.       {
  569.         free((voidp *)b);  free((voidp *)w);  free((voidp *)a);
  570.         err(ferror(e) ? ZE_READ : ZE_EOF, zipfile);
  571.       }
  572.       if ((r = zipcopy(w[g], e, f)) != ZE_OK)
  573.       {
  574.         free((voidp *)b);  free((voidp *)w);  free((voidp *)a);
  575.         if (r == ZE_TEMP)
  576.           err(ZE_WRITE, path);
  577.         else
  578.           err(r, zipfile);
  579.       }
  580.     }
  581.     if ((c = ftell(f)) == -1L)
  582.     {
  583.       free((voidp *)b);  free((voidp *)w);  free((voidp *)a);
  584.       err(ZE_WRITE, path);
  585.     }
  586.     for (g = b[j], k = 0; g != (extent)-1; g = (extent)a[g], k++)
  587.       if ((r = putcentral(w[g], f)) != ZE_OK)
  588.       {
  589.         free((voidp *)b);  free((voidp *)w);  free((voidp *)a);
  590.         err(ZE_WRITE, path);
  591.       }
  592.     if ((t = ftell(f)) == -1L)
  593.     {
  594.       free((voidp *)b);  free((voidp *)w);  free((voidp *)a);
  595.       err(ZE_WRITE, path);
  596.     }
  597.     if ((r = putend(k, t - c, c, (extent)0, (char *)NULL, f)) != ZE_OK)
  598.     {
  599.       free((voidp *)b);  free((voidp *)w);  free((voidp *)a);
  600.       err(ZE_WRITE, path);
  601.     }
  602.     if (ferror(f) || fclose(f))
  603.     {
  604.       free((voidp *)b);  free((voidp *)w);  free((voidp *)a);
  605.       err(ZE_WRITE, path);
  606.     }
  607.   }
  608.   free((voidp *)b);  free((voidp *)w);  free((voidp *)a);
  609.   fclose(e);
  610.  
  611.   /* Done! */
  612.   exit(0);
  613.   return 0; /* avoid warning */
  614. }
  615.