home *** CD-ROM | disk | FTP | other *** search
/ Chip 2001 January / Chip_2001-01_cd1.bin / tema / mysql / mysql-3.23.28g-win-source.exe / pack_isam / pack_isam.c next >
C/C++ Source or Header  |  2000-10-15  |  57KB  |  2,052 lines

  1. /* Copyright (C) 1979-1999 TcX AB & Monty Program KB & Detron HB
  2.  
  3.    This software is distributed with NO WARRANTY OF ANY KIND.  No author or
  4.    distributor accepts any responsibility for the consequences of using it, or
  5.    for whether it serves any particular purpose or works at all, unless he or
  6.    she says so in writing.  Refer to the Free Public License (the "License")
  7.    for full details.
  8.    Every copy of this file must include a copy of the License, normally in a
  9.    plain ASCII text file named PUBLIC.    The License grants you the right to
  10.    copy, modify and redistribute this file, but only under certain conditions
  11.    described in the License.  Among other things, the License requires that
  12.    the copyright notice and this notice be preserved on all copies. */
  13.  
  14. /* Pack isam file*/
  15.  
  16. #ifndef USE_MY_FUNC
  17. #define USE_MY_FUNC            /* We nead at least my_malloc */
  18. #endif
  19.  
  20. #include "isamdef.h"
  21. #include <queues.h>
  22. #include <my_tree.h>
  23. #include "mysys_err.h"
  24. #ifdef MSDOS
  25. #include <io.h>
  26. #endif
  27. #ifndef __GNU_LIBRARY__
  28. #define __GNU_LIBRARY__            /* Skipp warnings in getopt.h */
  29. #endif
  30. #include <getopt.h>
  31.  
  32. #if INT_MAX > 32767
  33. #define BITS_SAVED 32
  34. #else
  35. #define BITS_SAVED 16
  36. #endif
  37.  
  38. #define IS_OFFSET ((uint) 32768)    /* Bit if offset or char in tree */
  39. #define HEAD_LENGTH    32
  40. #define ALLOWED_JOIN_DIFF    256    /* Diff allowed to join trees */
  41.  
  42. #define DATA_TMP_EXT        ".TMD"
  43. #define OLD_EXT            ".OLD"
  44. #define WRITE_COUNT        MY_HOW_OFTEN_TO_WRITE
  45.  
  46. #ifdef __WIN__
  47. static double ulonglong2double(ulonglong value)
  48. {
  49.   longlong nr=(longlong) value;
  50.   if (nr >= 0)
  51.     return (double) nr;
  52.   return (18446744073709551616.0 + (double) nr);
  53. }
  54.  
  55. #if SIZEOF_OFF_T > 4
  56. #define my_off_t2double(A) ulonglong2double(A)
  57. #else
  58. #define my_off_t2double(A) ((double) (A))
  59. #endif /* SIZEOF_OFF_T > 4 */
  60. #endif
  61.  
  62. struct st_file_buffer {
  63.   File file;
  64.   char *buffer,*pos,*end;
  65.   my_off_t pos_in_file;
  66.   int bits;
  67.   uint byte;
  68. };
  69.  
  70. struct st_huff_tree;
  71. struct st_huff_element;
  72.  
  73. typedef struct st_huff_counts {
  74.   uint    field_length,max_zero_fill;
  75.   uint    pack_type;
  76.   uint    max_end_space,max_pre_space,length_bits,min_space;
  77.   enum en_fieldtype field_type;
  78.   struct st_huff_tree *tree;        /* Tree for field */
  79.   my_off_t counts[256];
  80.   my_off_t end_space[8];
  81.   my_off_t pre_space[8];
  82.   my_off_t tot_end_space,tot_pre_space,zero_fields,empty_fields,bytes_packed;
  83.   TREE    int_tree;
  84.   byte *tree_buff;
  85.   byte *tree_pos;
  86. } HUFF_COUNTS;
  87.  
  88. typedef struct st_huff_element HUFF_ELEMENT;
  89.  
  90. struct st_huff_element {
  91.   my_off_t count;
  92.   union un_element {
  93.     struct st_nod {
  94.       HUFF_ELEMENT *left,*right;
  95.     } nod;
  96.     struct st_leaf {
  97.       HUFF_ELEMENT *null;
  98.       uint    element_nr;        /* Number of element */
  99.     } leaf;
  100.   } a;
  101. };
  102.  
  103.  
  104. typedef struct st_huff_tree {
  105.   HUFF_ELEMENT *root,*element_buffer;
  106.   HUFF_COUNTS *counts;
  107.   uint tree_number;
  108.   uint elements;
  109.   my_off_t bytes_packed;
  110.   uint tree_pack_length;
  111.   uint min_chr,max_chr,char_bits,offset_bits,max_offset,height;
  112.   ulong *code;
  113.   uchar *code_len;
  114. } HUFF_TREE;
  115.  
  116.  
  117. typedef struct st_isam_mrg {
  118.   N_INFO **file,**current,**end;
  119.   uint count;
  120.   uint    min_pack_length;        /* Theese is used by packed data */
  121.   uint    max_pack_length;
  122.   uint    ref_length;
  123.   my_off_t records;
  124. } MRG_INFO;
  125.  
  126.  
  127. extern int main(int argc,char * *argv);
  128. static void get_options(int *argc,char ***argv);
  129. static N_INFO *open_isam_file(char *name,int mode);
  130. static bool open_isam_files(MRG_INFO *mrg,char **names,uint count);
  131. static int compress(MRG_INFO *file,char *join_name);
  132. static HUFF_COUNTS *init_huff_count(N_INFO *info,my_off_t records);
  133. static void free_counts_and_tree_and_queue(HUFF_TREE *huff_trees,
  134.                        uint trees,
  135.                        HUFF_COUNTS *huff_counts,
  136.                        uint fields);
  137. static int compare_tree(const uchar *s,const uchar *t);
  138. static int get_statistic(MRG_INFO *mrg,HUFF_COUNTS *huff_counts);
  139. static void check_counts(HUFF_COUNTS *huff_counts,uint trees,
  140.              my_off_t records);
  141. static int test_space_compress(HUFF_COUNTS *huff_counts,my_off_t records,
  142.                    uint max_space_length,my_off_t *space_counts,
  143.                    my_off_t tot_space_count,
  144.                    enum en_fieldtype field_type);
  145. static HUFF_TREE* make_huff_trees(HUFF_COUNTS *huff_counts,uint trees);
  146. static int make_huff_tree(HUFF_TREE *tree,HUFF_COUNTS *huff_counts);
  147. static int compare_huff_elements(void *not_used, byte *a,byte *b);
  148. static int save_counts_in_queue(byte *key,element_count count,
  149.                     HUFF_TREE *tree);
  150. static my_off_t calc_packed_length(HUFF_COUNTS *huff_counts,uint flag);
  151. static uint join_same_trees(HUFF_COUNTS *huff_counts,uint trees);
  152. static int make_huff_decode_table(HUFF_TREE *huff_tree,uint trees);
  153. static void make_traverse_code_tree(HUFF_TREE *huff_tree,
  154.                     HUFF_ELEMENT *element,uint size,
  155.                     ulong code);
  156. static int write_header(MRG_INFO *isam_file, uint header_length,uint trees,
  157.             my_off_t tot_elements,my_off_t filelength);
  158. static void write_field_info(HUFF_COUNTS *counts, uint fields,uint trees);
  159. static my_off_t write_huff_tree(HUFF_TREE *huff_tree,uint trees);
  160. static uint *make_offset_code_tree(HUFF_TREE *huff_tree,
  161.                        HUFF_ELEMENT *element,
  162.                        uint *offset);
  163. static uint max_bit(uint value);
  164. static int compress_isam_file(MRG_INFO *file,HUFF_COUNTS *huff_counts);
  165. static char *make_new_name(char *new_name,char *old_name);
  166. static char *make_old_name(char *new_name,char *old_name);
  167. static void init_file_buffer(File file,pbool read_buffer);
  168. static int flush_buffer(uint neaded_length);
  169. static void end_file_buffer(void);
  170. static void write_bits(ulong value,uint bits);
  171. static void flush_bits(void);
  172. static void save_integer(byte *pos,uint pack_length,my_off_t value);
  173. static void save_state(N_INFO *isam_file,MRG_INFO *mrg,my_off_t new_length,
  174.                ulong crc);
  175. static int save_state_mrg(File file,MRG_INFO *isam_file,my_off_t new_length,
  176.               ulong crc);
  177. static int mrg_close(MRG_INFO *mrg);
  178. static int mrg_rrnd(MRG_INFO *info,byte *buf);
  179. static void mrg_reset(MRG_INFO *mrg);
  180.  
  181.  
  182. static int backup=0,error_on_write=0,test_only=0,verbose=0,silent=0,
  183.        write_loop=0,force_pack=0,opt_wait=0,isamchk_neaded=0;
  184. static int tmpfile_createflag=O_RDWR | O_TRUNC | O_EXCL;
  185. static uint tree_buff_length=8196-MALLOC_OVERHEAD,force_pack_ref_length;
  186. static char tmp_dir[FN_REFLEN]={0},*join_table;
  187. static my_off_t intervall_length;
  188. static ulong  crc;
  189. static struct st_file_buffer file_buffer;
  190. static QUEUE queue;
  191. static HUFF_COUNTS *global_count;
  192. static char zero_string[]={0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0};
  193. static const char *load_default_groups[]= { "pack_isam",0 };
  194.  
  195.     /* The main program */
  196.  
  197. int main(int argc, char **argv)
  198. {
  199.   int error,ok;
  200.   MRG_INFO merge;
  201.   MY_INIT(argv[0]);
  202.  
  203.   load_defaults("my",load_default_groups,&argc,&argv);
  204.   get_options(&argc,&argv);
  205.  
  206.   error=ok=isamchk_neaded=0;
  207.   if (join_table)
  208.   {                        /* Join files into one */
  209.     if (open_isam_files(&merge,argv,(uint) argc) ||
  210.     compress(&merge,join_table))
  211.       error=1;
  212.   }
  213.   else while (argc--)
  214.   {
  215.     N_INFO *isam_file;
  216.     if (!(isam_file=open_isam_file(*argv++,O_RDWR)))
  217.       error=1;
  218.     else
  219.     {
  220.       merge.file= &isam_file;
  221.       merge.current=0;
  222.       merge.count=1;
  223.       if (compress(&merge,0))
  224.     error=1;
  225.       else
  226.     ok=1;
  227.     }
  228.   }
  229.   if (ok && isamchk_neaded && !silent)
  230.     puts("Remember to run isamchk -rq on compressed databases");
  231.   VOID(fflush(stdout)); VOID(fflush(stderr));
  232.   my_end(verbose ? MY_CHECK_ERROR | MY_GIVE_INFO : MY_CHECK_ERROR);
  233.   exit(error ? 2 : 0);
  234. #ifndef _lint
  235.   return 0;                    /* No compiler warning */
  236. #endif
  237. }
  238.  
  239.  
  240. static struct option long_options[] =
  241. {
  242.   {"backup",    no_argument,       0, 'b'},
  243.   {"debug",    optional_argument, 0, '#'},
  244.   {"force",    no_argument,       0, 'f'},
  245.   {"join",    required_argument, 0, 'j'},
  246.   {"help",    no_argument,       0, '?'},
  247.   {"packlength",required_argument, 0, 'p'},
  248.   {"silent",    no_argument,       0, 's'},
  249.   {"tmpdir",    required_argument, 0, 'T'},
  250.   {"test",    no_argument,       0, 't'},
  251.   {"verbose",    no_argument,       0, 'v'},
  252.   {"version",    no_argument,       0, 'V'},
  253.   {"wait",    no_argument,       0, 'w'},
  254.   {0, 0, 0, 0}
  255. };
  256.  
  257. static void print_version(void)
  258. {
  259.   printf("%s  Ver 5.8 for %s on %s\n",my_progname,SYSTEM_TYPE,MACHINE_TYPE);
  260. }
  261.  
  262. static void usage(void)
  263. {
  264.   print_version();
  265.   puts("Copyright (C) 1994-2000 TcX AB & Monty Program KB & Detron HB.");
  266.   puts("This is not free software. You must have a licence to use this program");
  267.   puts("This software comes with ABSOLUTELY NO WARRANTY\n");
  268.   puts("Pack a ISAM-table to take much smaller space");
  269.   puts("Keys are not updated, so you must run isamchk -rq on any table");
  270.   puts("that has keys after you have compressed it");
  271.   puts("You should give the .ISM file as the filename argument");
  272.  
  273.   printf("\nUsage: %s [OPTIONS] filename...\n", my_progname);
  274.   puts("\n\
  275.   -b, --backup        Make a backup of the table as table_name.OLD\n\
  276.   -f, --force        Force packing of table even if it's gets bigger or\n\
  277.             tempfile exists.\n\
  278.   -j, --join='new_table_name'\n\
  279.             Join all given tables into 'new_table_name'.\n\
  280.             All tables MUST have the identical layout.\n\
  281.   -p, --packlength=#    Force storage size of recordlength (1,2 or 3)\n\
  282.   -s, --silent        Be more silent.\n\
  283.   -t, --test        Don't pack table, only test packing it\n\
  284.   -v, --verbose        Write info about progress and packing result\n\
  285.   -w, --wait        Wait and retry if table is in use\n\
  286.   -T, --tmpdir=#    Use temporary directory to store temporary table\n\
  287.   -#, --debug=...       output debug log. Often this is 'd:t:o,filename`\n\
  288.   -?, --help        display this help and exit\n\
  289.   -V, --version        output version information and exit\n");
  290.   print_defaults("my",load_default_groups);
  291. };
  292.  
  293.     /* reads options */
  294.     /* Initiates DEBUG - but no debugging here ! */
  295.  
  296. static void get_options(int *argc,char ***argv)
  297. {
  298.   int c,option_index=0;
  299.   uint length;
  300.  
  301.   my_progname= argv[0][0];
  302.   if (isatty(fileno(stdout)))
  303.     write_loop=1;
  304.  
  305.   while ((c=getopt_long(*argc,*argv,"bfj:p:stvwT:#::?V",long_options,
  306.             &option_index)) != EOF)
  307.   {
  308.     switch(c) {
  309.     case 'b':
  310.       backup=1;
  311.       break;
  312.     case 'f':
  313.       force_pack=1;
  314.       tmpfile_createflag=O_RDWR | O_TRUNC;
  315.       break;
  316.     case 'j':
  317.       join_table=optarg;
  318.       break;
  319.     case 'p':
  320.       force_pack_ref_length=(uint) atoi(optarg);
  321.       if (force_pack_ref_length > 3)
  322.     force_pack_ref_length=0;
  323.       break;
  324.     case 's':
  325.       write_loop=verbose=0; silent=1;
  326.       break;
  327.     case 't':
  328.       test_only=verbose=1;
  329.       break;
  330.     case 'T':
  331.       length=(uint) (strmov(tmp_dir,optarg)-tmp_dir);
  332.       if (length != dirname_length(tmp_dir))
  333.       {
  334.     tmp_dir[length]=FN_LIBCHAR;
  335.     tmp_dir[length+1]=0;
  336.       }
  337.       break;
  338.     case 'v':
  339.       verbose=1; silent=0;
  340.       break;
  341.     case 'w':
  342.       opt_wait=1;
  343.       break;
  344.     case '#':
  345.       DBUG_PUSH(optarg ? optarg : "d:t:o");
  346.       break;
  347.     case 'V': print_version(); exit(0);
  348.     case 'I':
  349.     case '?':
  350.       usage();
  351.       exit(0);
  352.     default:
  353.       fprintf(stderr,"%s: Illegal option: -%c\n",my_progname,opterr);
  354.       usage();
  355.       exit(1);
  356.     }
  357.   }
  358.   (*argc)-=optind;
  359.   (*argv)+=optind;
  360.   if (!*argc)
  361.   {
  362.     usage();
  363.     exit(1);
  364.   }
  365.   if (join_table)
  366.   {
  367.     backup=0;                    /* Not needed */
  368.     tmp_dir[0]=0;
  369.   }
  370.   return;
  371. }
  372.  
  373.  
  374. static N_INFO *open_isam_file(char *name,int mode)
  375. {
  376.   N_INFO *isam_file;
  377.   ISAM_SHARE *share;
  378.   DBUG_ENTER("open_isam_file");
  379.  
  380.   if (!(isam_file=nisam_open(name,mode,(opt_wait ? HA_OPEN_WAIT_IF_LOCKED :
  381.                      HA_OPEN_ABORT_IF_LOCKED))))
  382.   {
  383.     VOID(fprintf(stderr,"%s gave error %d on open\n",name,my_errno));
  384.     DBUG_RETURN(0);
  385.   }
  386.   share=isam_file->s;
  387.   if (share->base.blobs)
  388.   {
  389.     VOID(fprintf(stderr,"%s has blobs, can't pack it\n",name));
  390.     VOID(nisam_close(isam_file));
  391.     DBUG_RETURN(0);
  392.   }
  393.   if (share->base.options & HA_OPTION_COMPRESS_RECORD && !join_table)
  394.   {
  395.     if (!force_pack)
  396.     {
  397.       VOID(fprintf(stderr,"%s is already compressed\n",name));
  398.       VOID(nisam_close(isam_file));
  399.       DBUG_RETURN(0);
  400.     }
  401.     if (verbose)
  402.       puts("Recompressing already compressed table");
  403.     share->base.options&= ~HA_OPTION_READ_ONLY_DATA; /* We are modifing it */
  404.   }
  405.   if (! force_pack && share->state.records != 0 &&
  406.       (share->state.records <= 1 ||
  407.        share->state.data_file_length < 1024) && ! join_table)
  408.   {
  409.     VOID(fprintf(stderr,"%s is too small to compress\n",name));
  410.     VOID(nisam_close(isam_file));
  411.     DBUG_RETURN(0);
  412.   }
  413.   VOID(nisam_lock_database(isam_file,F_WRLCK));
  414.   DBUG_RETURN(isam_file);
  415. }
  416.  
  417.  
  418. static bool open_isam_files(MRG_INFO *mrg,char **names,uint count)
  419. {
  420.   uint i,j;
  421.   mrg->count=0;
  422.   mrg->current=0;
  423.   mrg->file=(N_INFO**) my_malloc(sizeof(N_INFO*)*count,MYF(MY_FAE));
  424.   for (i=0; i < count ; i++)
  425.   {
  426.     if (!(mrg->file[i]=open_isam_file(names[i],O_RDONLY)))
  427.       goto error;
  428.   }
  429.   /* Check that files are identical */
  430.   for (j=0 ; j < count-1 ; j++)
  431.   {
  432.     N_RECINFO *m1,*m2,*end;
  433.     if (mrg->file[j]->s->base.reclength != mrg->file[j+1]->s->base.reclength ||
  434.     mrg->file[j]->s->base.fields != mrg->file[j+1]->s->base.fields)
  435.       goto diff_file;
  436.     m1=mrg->file[j]->s->rec;
  437.     end=m1+mrg->file[j]->s->base.fields;
  438.     m2=mrg->file[j+1]->s->rec;
  439.     for ( ; m1 != end ; m1++,m2++)
  440.     {
  441.       if ((m1->base.type != m2->base.type && ! force_pack) ||
  442.       m1->base.length != m2->base.length)
  443.     goto diff_file;
  444.     }
  445.   }
  446.   mrg->count=count;
  447.   return 0;
  448.  
  449.  diff_file:
  450.   fprintf(stderr,"%s: Tables '%s' and '%s' are not identical\n",
  451.       my_progname,names[j],names[j+1]);
  452.  error:
  453.   while (i--)
  454.     nisam_close(mrg->file[i]);
  455.   return 1;
  456. }
  457.  
  458.  
  459. static int compress(MRG_INFO *mrg,char *result_table)
  460. {
  461.   int error;
  462.   File new_file,join_isam_file;
  463.   N_INFO *isam_file;
  464.   ISAM_SHARE *share;
  465.   char org_name[FN_REFLEN],new_name[FN_REFLEN],temp_name[FN_REFLEN];
  466.   uint i,header_length,fields,trees,used_trees;
  467.   my_off_t old_length,new_length,tot_elements;
  468.   HUFF_COUNTS *huff_counts;
  469.   HUFF_TREE *huff_trees;
  470.   DBUG_ENTER("compress");
  471.  
  472.   isam_file=mrg->file[0];            /* Take this as an example */
  473.   share=isam_file->s;
  474.   new_file=join_isam_file= -1;
  475.   trees=fields=0;
  476.   huff_trees=0;
  477.   huff_counts=0;
  478.  
  479.   /* Create temporary or join file */
  480.  
  481.   if (backup)
  482.     VOID(fn_format(org_name,isam_file->filename,"",N_NAME_DEXT,2));
  483.   else
  484.     VOID(fn_format(org_name,isam_file->filename,"",N_NAME_DEXT,2+4+16));
  485.   if (!test_only && result_table)
  486.   {
  487.     /* Make a new indexfile based on first file in list */
  488.     uint length;
  489.     char *buff;
  490.     strmov(org_name,result_table);        /* Fix error messages */
  491.     VOID(fn_format(new_name,result_table,"",N_NAME_IEXT,2));
  492.     if ((join_isam_file=my_create(new_name,0,tmpfile_createflag,MYF(MY_WME)))
  493.     < 0)
  494.       goto err;
  495.     length=share->base.keystart;
  496.     if (!(buff=my_malloc(length,MYF(MY_WME))))
  497.       goto err;
  498.     if (my_pread(share->kfile,buff,length,0L,MYF(MY_WME | MY_NABP)) ||
  499.     my_write(join_isam_file,buff,length,
  500.          MYF(MY_WME | MY_NABP | MY_WAIT_IF_FULL)))
  501.     {
  502.       my_free(buff,MYF(0));
  503.       goto err;
  504.     }
  505.     my_free(buff,MYF(0));
  506.     VOID(fn_format(new_name,result_table,"",N_NAME_DEXT,2));
  507.   }
  508.   else if (!tmp_dir[0])
  509.     VOID(make_new_name(new_name,org_name));
  510.   else
  511.     VOID(fn_format(new_name,org_name,tmp_dir,DATA_TMP_EXT,1+2+4));
  512.   if (!test_only &&
  513.       (new_file=my_create(new_name,0,tmpfile_createflag,MYF(MY_WME))) < 0)
  514.     goto err;
  515.  
  516.   /* Start calculating statistics */
  517.  
  518.   mrg->records=0;
  519.   for (i=0 ; i < mrg->count ; i++)
  520.     mrg->records+=mrg->file[i]->s->state.records;
  521.   if (write_loop || verbose)
  522.   {
  523.     printf("Compressing %s: (%lu records)\n",
  524.        result_table ? new_name : org_name,(ulong) mrg->records);
  525.   }
  526.   trees=fields=share->base.fields;
  527.   huff_counts=init_huff_count(isam_file,mrg->records);
  528.   QUICK_SAFEMALLOC;
  529.   if (write_loop || verbose)
  530.     printf("- Calculating statistics\n");
  531.   if (get_statistic(mrg,huff_counts))
  532.     goto err;
  533.   NORMAL_SAFEMALLOC;
  534.   old_length=0;
  535.   for (i=0; i < mrg->count ; i++)
  536.     old_length+= (mrg->file[i]->s->state.data_file_length -
  537.           mrg->file[i]->s->state.empty);
  538.  
  539.   if (init_queue(&queue,256,0,0,compare_huff_elements,0))
  540.     goto err;
  541.   check_counts(huff_counts,fields,mrg->records);
  542.   huff_trees=make_huff_trees(huff_counts,trees);
  543.   if ((int) (used_trees=join_same_trees(huff_counts,trees)) < 0)
  544.     goto err;
  545.   if (make_huff_decode_table(huff_trees,fields))
  546.     goto err;
  547.  
  548.   init_file_buffer(new_file,0);
  549.   file_buffer.pos_in_file=HEAD_LENGTH;
  550.   if (! test_only)
  551.     VOID(my_seek(new_file,file_buffer.pos_in_file,MY_SEEK_SET,MYF(0)));
  552.  
  553.   write_field_info(huff_counts,fields,used_trees);
  554.   if (!(tot_elements=write_huff_tree(huff_trees,trees)))
  555.     goto err;
  556.   header_length=(uint) file_buffer.pos_in_file+
  557.     (uint) (file_buffer.pos-file_buffer.buffer);
  558.  
  559.   /* Compress file */
  560.   if (write_loop || verbose)
  561.     printf("- Compressing file\n");
  562.   error=compress_isam_file(mrg,huff_counts);
  563.   new_length=file_buffer.pos_in_file;
  564.   if (!error && !test_only)
  565.   {
  566.     char buff[MEMMAP_EXTRA_MARGIN];        /* End marginal for memmap */
  567.     bzero(buff,sizeof(buff));
  568.     error=my_write(file_buffer.file,buff,sizeof(buff),
  569.            MYF(MY_WME | MY_NABP | MY_WAIT_IF_FULL)) != 0;
  570.   }
  571.   if (!error)
  572.     error=write_header(mrg,header_length,used_trees,tot_elements,
  573.                new_length);
  574.   end_file_buffer();
  575.  
  576.   if (verbose && mrg->records)
  577.     printf("Min record length: %6d   Max length: %6d   Mean total length: %6lu\n",
  578.        mrg->min_pack_length,mrg->max_pack_length,
  579.        (ulong) new_length/mrg->records);
  580.  
  581.   if (!test_only)
  582.   {
  583.     error|=my_close(new_file,MYF(MY_WME));
  584.     if (!result_table)
  585.     {
  586.       error|=my_close(isam_file->dfile,MYF(MY_WME));
  587.       isam_file->dfile= -1;        /* Tell nisam_close file is closed */
  588.     }
  589.   }
  590.  
  591.   free_counts_and_tree_and_queue(huff_trees,trees,huff_counts,fields);
  592.   if (! test_only && ! error)
  593.   {
  594.     if (result_table)
  595.     {
  596.       error=save_state_mrg(join_isam_file,mrg,new_length,crc);
  597.     }
  598.     else
  599.     {
  600.       if (backup)
  601.       {
  602.     if (my_rename(org_name,make_old_name(temp_name,isam_file->filename),
  603.               MYF(MY_WME)))
  604.       error=1;
  605.     else
  606.     {
  607.       if (tmp_dir[0])
  608.       {
  609.         if (!(error=my_copy(new_name,org_name,MYF(MY_WME))))
  610.           VOID(my_delete(new_name,MYF(MY_WME)));
  611.       }
  612.       else
  613.         error=my_rename(new_name,org_name,MYF(MY_WME));
  614.       if (!error)
  615.         VOID(my_copystat(temp_name,org_name,MYF(MY_COPYTIME)));
  616.     }
  617.       }
  618.       else
  619.       {
  620.     if (tmp_dir[0])
  621.     {
  622.  
  623.       if (!(error=my_copy(new_name,org_name,
  624.                   MYF(MY_WME | MY_HOLD_ORIGINAL_MODES
  625.                   | MY_COPYTIME))))
  626.         VOID(my_delete(new_name,MYF(MY_WME)));
  627.     }
  628.     else
  629.       error=my_redel(org_name,new_name,MYF(MY_WME | MY_COPYTIME));
  630.       }
  631.       if (! error)
  632.     save_state(isam_file,mrg,new_length,crc);
  633.     }
  634.   }
  635.   error|=mrg_close(mrg);
  636.   if (join_isam_file >= 0)
  637.     error|=my_close(join_isam_file,MYF(MY_WME));
  638.   if (error)
  639.   {
  640.     VOID(fprintf(stderr,"Aborting: %s is not compressed\n",org_name));
  641.     DBUG_RETURN(-1);
  642.   }
  643.   if (write_loop || verbose)
  644.   {
  645.     if (old_length)
  646.       printf("%.4g%%     \n",
  647.          my_off_t2double(old_length-new_length)*100.0/
  648.          my_off_t2double(old_length));
  649.     else
  650.       puts("Empty file saved in compressed format");
  651.   }
  652.   DBUG_RETURN(0);
  653.  
  654.  err:
  655.   free_counts_and_tree_and_queue(huff_trees,trees,huff_counts,fields);
  656.   if (new_file >= 0)
  657.     VOID(my_close(new_file,MYF(0)));
  658.   if (join_isam_file >= 0)
  659.     VOID(my_close(join_isam_file,MYF(0)));
  660.   mrg_close(mrg);
  661.   VOID(fprintf(stderr,"Aborted: %s is not compressed\n",org_name));
  662.   DBUG_RETURN(-1);
  663. }
  664.  
  665.     /* Init a huff_count-struct for each field and init it */
  666.  
  667. static HUFF_COUNTS *init_huff_count(N_INFO *info,my_off_t records)
  668. {
  669.   reg2 uint i;
  670.   reg1 HUFF_COUNTS *count;
  671.   if ((count = (HUFF_COUNTS*) my_malloc(info->s->base.fields*sizeof(HUFF_COUNTS),
  672.                     MYF(MY_ZEROFILL | MY_WME))))
  673.   {
  674.     for (i=0 ; i < info->s->base.fields ; i++)
  675.     {
  676.       enum en_fieldtype type;
  677.       count[i].field_length=info->s->rec[i].base.length;
  678.       type= count[i].field_type= (enum en_fieldtype) info->s->rec[i].base.type;
  679.       if (type == FIELD_INTERVALL ||
  680.       type == FIELD_CONSTANT ||
  681.       type == FIELD_ZERO)
  682.     type = FIELD_NORMAL;
  683.       if (count[i].field_length <= 8 &&
  684.       (type == FIELD_NORMAL ||
  685.        type == FIELD_SKIPP_ZERO))
  686.     count[i].max_zero_fill= count[i].field_length;
  687.       init_tree(&count[i].int_tree,0,-1,(qsort_cmp) compare_tree,0,NULL);
  688.       if (records)
  689.     count[i].tree_pos=count[i].tree_buff =
  690.       my_malloc(count[i].field_length > 1 ? tree_buff_length : 2,
  691.             MYF(MY_WME));
  692.     }
  693.   }
  694.   return count;
  695. }
  696.  
  697.  
  698.     /* Free memory used by counts and trees */
  699.  
  700. static void free_counts_and_tree_and_queue(HUFF_TREE *huff_trees, uint trees, HUFF_COUNTS *huff_counts, uint fields)
  701. {
  702.   register uint i;
  703.  
  704.   if (huff_trees)
  705.   {
  706.     for (i=0 ; i < trees ; i++)
  707.     {
  708.       if (huff_trees[i].element_buffer)
  709.     my_free((gptr) huff_trees[i].element_buffer,MYF(0));
  710.       if (huff_trees[i].code)
  711.     my_free((gptr) huff_trees[i].code,MYF(0));
  712.     }
  713.     my_free((gptr) huff_trees,MYF(0));
  714.   }
  715.   if (huff_counts)
  716.   {
  717.     for (i=0 ; i < fields ; i++)
  718.     {
  719.       if (huff_counts[i].tree_buff)
  720.       {
  721.     my_free((gptr) huff_counts[i].tree_buff,MYF(0));
  722.     delete_tree(&huff_counts[i].int_tree);
  723.       }
  724.     }
  725.     my_free((gptr) huff_counts,MYF(0));
  726.   }
  727.   delete_queue(&queue);        /* This is safe to free */
  728.   return;
  729. }
  730.  
  731.     /* Read through old file and gather some statistics */
  732.  
  733. static int get_statistic(MRG_INFO *mrg,HUFF_COUNTS *huff_counts)
  734. {
  735.   int error;
  736.   uint length,reclength;
  737.   byte *record,*pos,*next_pos,*end_pos,*start_pos;
  738.   my_off_t record_count;
  739.   HUFF_COUNTS *count,*end_count;
  740.   TREE_ELEMENT *element;
  741.   DBUG_ENTER("get_statistic");
  742.  
  743.   reclength=mrg->file[0]->s->base.reclength;
  744.   record=(byte*) my_alloca(reclength);
  745.   end_count=huff_counts+mrg->file[0]->s->base.fields;
  746.   record_count=crc=0;
  747.  
  748.   mrg_reset(mrg);
  749.   while ((error=mrg_rrnd(mrg,record)) >= 0)
  750.   {
  751.     if (! error)
  752.     {
  753.       crc^=checksum(record,reclength);
  754.       for (pos=record,count=huff_counts ;
  755.        count < end_count ;
  756.        count++,
  757.        pos=next_pos)
  758.       {
  759.     next_pos=end_pos=(start_pos=pos)+count->field_length;
  760.  
  761.     /* Put value in tree if there is room for it */
  762.     if (count->tree_buff)
  763.     {
  764.       global_count=count;
  765.       if (!(element=tree_insert(&count->int_tree,pos,0)) ||
  766.           (element->count == 1 &&
  767.            count->tree_buff + tree_buff_length <
  768.            count->tree_pos + count->field_length ||
  769.            count->field_length == 1 &&
  770.            count->int_tree.elements_in_tree > 1))
  771.       {
  772.         delete_tree(&count->int_tree);
  773.         my_free(count->tree_buff,MYF(0));
  774.         count->tree_buff=0;
  775.       }
  776.       else
  777.       {
  778.         if (element->count == 1)
  779.         {                /* New element */
  780.           memcpy(count->tree_pos,pos,(size_t) count->field_length);
  781.           tree_set_pointer(element,count->tree_pos);
  782.           count->tree_pos+=count->field_length;
  783.         }
  784.       }
  785.     }
  786.  
  787.     /* Save character counters and space-counts and zero-field-counts */
  788.     if (count->field_type == FIELD_NORMAL ||
  789.         count->field_type == FIELD_SKIPP_ENDSPACE)
  790.     {
  791.       for ( ; end_pos > pos ; end_pos--)
  792.         if (end_pos[-1] != ' ')
  793.           break;
  794.       if (end_pos == pos)
  795.       {
  796.         count->empty_fields++;
  797.         count->max_zero_fill=0;
  798.         continue;
  799.       }
  800.       length= (uint) (next_pos-end_pos);
  801.       count->tot_end_space+=length;
  802.       if (length < 8)
  803.         count->end_space[length]++;
  804.       if (count->max_end_space < length)
  805.         count->max_end_space = length;
  806.     }
  807.     if (count->field_type == FIELD_NORMAL ||
  808.         count->field_type == FIELD_SKIPP_PRESPACE)
  809.     {
  810.       for (pos=start_pos; pos < end_pos ; pos++)
  811.         if (pos[0] != ' ')
  812.           break;
  813.       if (end_pos == pos)
  814.       {
  815.         count->empty_fields++;
  816.         count->max_zero_fill=0;
  817.         continue;
  818.       }
  819.       length= (uint) (pos-start_pos);
  820.       count->tot_pre_space+=length;
  821.       if (length < 8)
  822.         count->pre_space[length]++;
  823.       if (count->max_pre_space < length)
  824.         count->max_pre_space = length;
  825.     }
  826.     if (count->field_length <= 8 &&
  827.         (count->field_type == FIELD_NORMAL ||
  828.          count->field_type == FIELD_SKIPP_ZERO))
  829.     {
  830.       uint i;
  831.       if (!memcmp((byte*) start_pos,zero_string,count->field_length))
  832.       {
  833.         count->zero_fields++;
  834.         continue;
  835.       }
  836. #ifdef BYTE_ORDER_HIGH_FIRST
  837.       for (i =0 ; i < count->max_zero_fill && ! start_pos[i] ; i++) ;
  838.       if (i < count->max_zero_fill)
  839.         count->max_zero_fill=i;
  840. #else
  841.       for (i =0 ; i < count->max_zero_fill && ! end_pos[-1 - (int) i] ; i++) ;
  842.       if (i < count->max_zero_fill)
  843.         count->max_zero_fill=i;
  844. #endif
  845.     }
  846.     for (pos=start_pos ; pos < end_pos ; pos++)
  847.       count->counts[(uchar) *pos]++;
  848.       }
  849.       record_count++;
  850.       if (write_loop && record_count % WRITE_COUNT == 0)
  851.       {
  852.     printf("%lu\r",(ulong) record_count); VOID(fflush(stdout));
  853.       }
  854.     }
  855.   }
  856.   if (write_loop)
  857.   {
  858.     printf("            \r"); VOID(fflush(stdout));
  859.   }
  860.   mrg->records=record_count;
  861.   my_afree((gptr) record);
  862.   DBUG_RETURN(0);
  863. }
  864.  
  865. static int compare_huff_elements(void *not_used, byte *a, byte *b)
  866. {
  867.   return *((my_off_t*) a) < *((my_off_t*) b) ? -1 :
  868.     (*((my_off_t*) a) == *((my_off_t*) b)  ? 0 : 1);
  869. }
  870.  
  871.     /* Check each tree if we should use pre-space-compress, end-space-
  872.        compress, empty-field-compress or zero-field-compress */
  873.  
  874. static void check_counts(HUFF_COUNTS *huff_counts, uint trees, my_off_t records)
  875. {
  876.   uint space_fields,fill_zero_fields,field_count[(int) FIELD_ZERO+1];
  877.   my_off_t old_length,new_length,length;
  878.   DBUG_ENTER("check_counts");
  879.  
  880.   bzero((gptr) field_count,sizeof(field_count));
  881.   space_fields=fill_zero_fields=0;
  882.  
  883.   for (; trees-- ; huff_counts++)
  884.   {
  885.     huff_counts->field_type=FIELD_NORMAL;
  886.     huff_counts->pack_type=0;
  887.  
  888.     if (huff_counts->zero_fields || ! records)
  889.     {
  890.       my_off_t old_space_count;
  891.       if (huff_counts->zero_fields == records)
  892.       {
  893.     huff_counts->field_type= FIELD_ZERO;
  894.     huff_counts->bytes_packed=0;
  895.     huff_counts->counts[0]=0;
  896.     goto found_pack;
  897.       }
  898.       old_space_count=huff_counts->counts[' '];
  899.       huff_counts->counts[' ']+=huff_counts->tot_end_space+
  900.     huff_counts->tot_pre_space +
  901.       huff_counts->empty_fields * huff_counts->field_length;
  902.       old_length=calc_packed_length(huff_counts,0)+records/8;
  903.       length=huff_counts->zero_fields*huff_counts->field_length;
  904.       huff_counts->counts[0]+=length;
  905.       new_length=calc_packed_length(huff_counts,0);
  906.       if (old_length < new_length && huff_counts->field_length > 1)
  907.       {
  908.     huff_counts->field_type=FIELD_SKIPP_ZERO;
  909.     huff_counts->counts[0]-=length;
  910.     huff_counts->bytes_packed=old_length- records/8;
  911.     goto found_pack;
  912.       }
  913.       huff_counts->counts[' ']=old_space_count;
  914.     }
  915.     huff_counts->bytes_packed=calc_packed_length(huff_counts,0);
  916.     if (huff_counts->empty_fields)
  917.     {
  918.       if (huff_counts->field_length > 2 &&
  919.       huff_counts->empty_fields + (records - huff_counts->empty_fields)*
  920.       (1+max_bit(max(huff_counts->max_pre_space,
  921.              huff_counts->max_end_space))) <
  922.       records * max_bit(huff_counts->field_length))
  923.       {
  924.     huff_counts->pack_type |= PACK_TYPE_SPACE_FIELDS;
  925.       }
  926.       else
  927.       {
  928.     length=huff_counts->empty_fields*huff_counts->field_length;
  929.     if (huff_counts->tot_end_space || ! huff_counts->tot_pre_space)
  930.     {
  931.       huff_counts->tot_end_space+=length;
  932.       huff_counts->max_end_space=huff_counts->field_length;
  933.       if (huff_counts->field_length < 8)
  934.         huff_counts->end_space[huff_counts->field_length]+=
  935.           huff_counts->empty_fields;
  936.     }
  937.     else
  938.     {
  939.       huff_counts->tot_pre_space+=length;
  940.       huff_counts->max_pre_space=huff_counts->field_length;
  941.       if (huff_counts->field_length < 8)
  942.         huff_counts->pre_space[huff_counts->field_length]+=
  943.           huff_counts->empty_fields;
  944.     }
  945.       }
  946.     }
  947.     if (huff_counts->tot_end_space)
  948.     {
  949.       huff_counts->counts[' ']+=huff_counts->tot_pre_space;
  950.       if (test_space_compress(huff_counts,records,huff_counts->max_end_space,
  951.                   huff_counts->end_space,
  952.                   huff_counts->tot_end_space,FIELD_SKIPP_ENDSPACE))
  953.     goto found_pack;
  954.       huff_counts->counts[' ']-=huff_counts->tot_pre_space;
  955.     }
  956.     if (huff_counts->tot_pre_space)
  957.     {
  958.       if (test_space_compress(huff_counts,records,huff_counts->max_pre_space,
  959.                   huff_counts->pre_space,
  960.                   huff_counts->tot_pre_space,FIELD_SKIPP_PRESPACE))
  961.     goto found_pack;
  962.     }
  963.  
  964.   found_pack:            /* Found field-packing */
  965.  
  966.     /* Test if we can use zero-fill */
  967.  
  968.     if (huff_counts->max_zero_fill &&
  969.     (huff_counts->field_type == FIELD_NORMAL ||
  970.      huff_counts->field_type == FIELD_SKIPP_ZERO))
  971.     {
  972.       huff_counts->counts[0]-=huff_counts->max_zero_fill*
  973.     (huff_counts->field_type == FIELD_SKIPP_ZERO ?
  974.      records - huff_counts->zero_fields : records);
  975.       huff_counts->pack_type|=PACK_TYPE_ZERO_FILL;
  976.       huff_counts->bytes_packed=calc_packed_length(huff_counts,0);
  977.     }
  978.  
  979.     /* Test if intervall-field is better */
  980.  
  981.     if (huff_counts->tree_buff)
  982.     {
  983.       HUFF_TREE tree;
  984.  
  985.       tree.element_buffer=0;
  986.       if (!make_huff_tree(&tree,huff_counts) &&
  987.       tree.bytes_packed+tree.tree_pack_length < huff_counts->bytes_packed)
  988.       {
  989.     if (tree.elements == 1)
  990.       huff_counts->field_type=FIELD_CONSTANT;
  991.     else
  992.       huff_counts->field_type=FIELD_INTERVALL;
  993.     huff_counts->pack_type=0;
  994.       }
  995.       else
  996.       {
  997.     my_free((gptr) huff_counts->tree_buff,MYF(0));
  998.     delete_tree(&huff_counts->int_tree);
  999.     huff_counts->tree_buff=0;
  1000.       }
  1001.       if (tree.element_buffer)
  1002.     my_free((gptr) tree.element_buffer,MYF(0));
  1003.     }
  1004.     if (huff_counts->pack_type & PACK_TYPE_SPACE_FIELDS)
  1005.       space_fields++;
  1006.     if (huff_counts->pack_type & PACK_TYPE_ZERO_FILL)
  1007.       fill_zero_fields++;
  1008.     field_count[huff_counts->field_type]++;
  1009.   }
  1010.   if (verbose)
  1011.     printf("\nnormal:    %3d  empty-space:     %3d  empty-zero:       %3d  empty-fill: %3d\npre-space: %3d  end-space:       %3d  table-lookup:     %3d  zero:       %3d\n",
  1012.        field_count[FIELD_NORMAL],space_fields,
  1013.        field_count[FIELD_SKIPP_ZERO],fill_zero_fields,
  1014.        field_count[FIELD_SKIPP_PRESPACE],
  1015.        field_count[FIELD_SKIPP_ENDSPACE],
  1016.        field_count[FIELD_INTERVALL],
  1017.        field_count[FIELD_ZERO]);
  1018.   DBUG_VOID_RETURN;
  1019. }
  1020.  
  1021.     /* Test if we can use space-compression and empty-field-compression */
  1022.  
  1023. static int
  1024. test_space_compress(HUFF_COUNTS *huff_counts, my_off_t records,
  1025.             uint max_space_length, my_off_t *space_counts,
  1026.             my_off_t tot_space_count, enum en_fieldtype field_type)
  1027. {
  1028.   int min_pos;
  1029.   uint length_bits,i;
  1030.   my_off_t space_count,min_space_count,min_pack,new_length,skipp;
  1031.  
  1032.   length_bits=max_bit(max_space_length);
  1033.  
  1034.         /* Default no end_space-packing */
  1035.   space_count=huff_counts->counts[(uint) ' '];
  1036.   min_space_count= (huff_counts->counts[(uint) ' ']+= tot_space_count);
  1037.   min_pack=calc_packed_length(huff_counts,0);
  1038.   min_pos= -2;
  1039.   huff_counts->counts[(uint) ' ']=space_count;
  1040.  
  1041.     /* Test with allways space-count */
  1042.   new_length=huff_counts->bytes_packed+length_bits*records/8;
  1043.   if (new_length+1 < min_pack)
  1044.   {
  1045.     min_pos= -1;
  1046.     min_pack=new_length;
  1047.     min_space_count=space_count;
  1048.   }
  1049.     /* Test with length-flag */
  1050.   for (skipp=0L, i=0 ; i < 8 ; i++)
  1051.   {
  1052.     if (space_counts[i])
  1053.     {
  1054.       if (i)
  1055.     huff_counts->counts[(uint) ' ']+=space_counts[i];
  1056.       skipp+=huff_counts->pre_space[i];
  1057.       new_length=calc_packed_length(huff_counts,0)+
  1058.     (records+(records-skipp)*(1+length_bits))/8;
  1059.       if (new_length < min_pack)
  1060.       {
  1061.     min_pos=(int) i;
  1062.     min_pack=new_length;
  1063.     min_space_count=huff_counts->counts[(uint) ' '];
  1064.       }
  1065.     }
  1066.   }
  1067.  
  1068.   huff_counts->counts[(uint) ' ']=min_space_count;
  1069.   huff_counts->bytes_packed=min_pack;
  1070.   switch (min_pos) {
  1071.   case -2:
  1072.     return(0);                /* No space-compress */
  1073.   case -1:                /* Always space-count */
  1074.     huff_counts->field_type=field_type;
  1075.     huff_counts->min_space=0;
  1076.     huff_counts->length_bits=max_bit(max_space_length);
  1077.     break;
  1078.   default:
  1079.     huff_counts->field_type=field_type;
  1080.     huff_counts->min_space=(uint) min_pos;
  1081.     huff_counts->pack_type|=PACK_TYPE_SELECTED;
  1082.     huff_counts->length_bits=max_bit(max_space_length);
  1083.     break;
  1084.   }
  1085.   return(1);                /* Using space-compress */
  1086. }
  1087.  
  1088.  
  1089.     /* Make a huff_tree of each huff_count */
  1090.  
  1091. static HUFF_TREE* make_huff_trees(HUFF_COUNTS *huff_counts, uint trees)
  1092. {
  1093.   uint tree;
  1094.   HUFF_TREE *huff_tree;
  1095.   DBUG_ENTER("make_huff_trees");
  1096.  
  1097.   if (!(huff_tree=(HUFF_TREE*) my_malloc(trees*sizeof(HUFF_TREE),
  1098.                      MYF(MY_WME | MY_ZEROFILL))))
  1099.     DBUG_RETURN(0);
  1100.  
  1101.   for (tree=0 ; tree < trees ; tree++)
  1102.   {
  1103.     if (make_huff_tree(huff_tree+tree,huff_counts+tree))
  1104.     {
  1105.       while (tree--)
  1106.     my_free((gptr) huff_tree[tree].element_buffer,MYF(0));
  1107.       my_free((gptr) huff_tree,MYF(0));
  1108.       DBUG_RETURN(0);
  1109.     }
  1110.   }
  1111.   DBUG_RETURN(huff_tree);
  1112. }
  1113.  
  1114.     /* Update huff_tree according to huff_counts->counts or
  1115.        huff_counts->tree_buff */
  1116.  
  1117. static int make_huff_tree(HUFF_TREE *huff_tree, HUFF_COUNTS *huff_counts)
  1118. {
  1119.   uint i,found,bits_packed,first,last;
  1120.   my_off_t bytes_packed;
  1121.   HUFF_ELEMENT *a,*b,*new;
  1122.  
  1123.   first=last=0;
  1124.   if (huff_counts->tree_buff)
  1125.   {
  1126.     found= (uint) (huff_counts->tree_pos - huff_counts->tree_buff) /
  1127.       huff_counts->field_length;
  1128.     first=0; last=found-1;
  1129.   }
  1130.   else
  1131.   {
  1132.     for (i=found=0 ; i < 256 ; i++)
  1133.     {
  1134.       if (huff_counts->counts[i])
  1135.       {
  1136.     if (! found++)
  1137.       first=i;
  1138.     last=i;
  1139.       }
  1140.     }
  1141.     if (found < 2)
  1142.       found=2;
  1143.   }
  1144.  
  1145.   if (queue.max_elements < found)
  1146.   {
  1147.     delete_queue(&queue);
  1148.     if (init_queue(&queue,found,0,0,compare_huff_elements,0))
  1149.       return -1;
  1150.   }
  1151.  
  1152.   if (!huff_tree->element_buffer)
  1153.   {
  1154.     if (!(huff_tree->element_buffer=
  1155.      (HUFF_ELEMENT*) my_malloc(found*2*sizeof(HUFF_ELEMENT),MYF(MY_WME))))
  1156.       return 1;
  1157.   }
  1158.   else
  1159.   {
  1160.     HUFF_ELEMENT *temp;
  1161.     if (!(temp=
  1162.       (HUFF_ELEMENT*) my_realloc((gptr) huff_tree->element_buffer,
  1163.                      found*2*sizeof(HUFF_ELEMENT),
  1164.                      MYF(MY_WME))))
  1165.       return 1;
  1166.     huff_tree->element_buffer=temp;
  1167.   }
  1168.  
  1169.   huff_counts->tree=huff_tree;
  1170.   huff_tree->counts=huff_counts;
  1171.   huff_tree->min_chr=first;
  1172.   huff_tree->max_chr=last;
  1173.   huff_tree->char_bits=max_bit(last-first);
  1174.   huff_tree->offset_bits=max_bit(found-1)+1;
  1175.  
  1176.   if (huff_counts->tree_buff)
  1177.   {
  1178.     huff_tree->elements=0;
  1179.     tree_walk(&huff_counts->int_tree,
  1180.           (int (*)(void*, element_count,void*)) save_counts_in_queue,
  1181.           (gptr) huff_tree, left_root_right);
  1182.     huff_tree->tree_pack_length=(1+15+16+5+5+
  1183.                  (huff_tree->char_bits+1)*found+
  1184.                  (huff_tree->offset_bits+1)*
  1185.                  (found-2)+7)/8 +
  1186.                    (uint) (huff_tree->counts->tree_pos-
  1187.                        huff_tree->counts->tree_buff);
  1188.   }
  1189.   else
  1190.   {
  1191.     huff_tree->elements=found;
  1192.     huff_tree->tree_pack_length=(9+9+5+5+
  1193.                  (huff_tree->char_bits+1)*found+
  1194.                  (huff_tree->offset_bits+1)*
  1195.                  (found-2)+7)/8;
  1196.  
  1197.     for (i=first, found=0 ; i <= last ; i++)
  1198.     {
  1199.       if (huff_counts->counts[i])
  1200.       {
  1201.     new=huff_tree->element_buffer+(found++);
  1202.     new->count=huff_counts->counts[i];
  1203.     new->a.leaf.null=0;
  1204.     new->a.leaf.element_nr=i;
  1205.     queue.root[found]=(byte*) new;
  1206.       }
  1207.     }
  1208.     while (found < 2)
  1209.     {            /* Our huff_trees request at least 2 elements */
  1210.       new=huff_tree->element_buffer+(found++);
  1211.       new->count=0;
  1212.       new->a.leaf.null=0;
  1213.       if (last)
  1214.     new->a.leaf.element_nr=huff_tree->min_chr=last-1;
  1215.       else
  1216.     new->a.leaf.element_nr=huff_tree->max_chr=last+1;
  1217.       queue.root[found]=(byte*) new;
  1218.     }
  1219.   }
  1220.   queue.elements=found;
  1221.  
  1222.   for (i=found/2 ; i > 0 ; i--)
  1223.     _downheap(&queue,i);
  1224.   bytes_packed=0; bits_packed=0;
  1225.   for (i=1 ; i < found ; i++)
  1226.   {
  1227.     a=(HUFF_ELEMENT*) queue_remove(&queue,0);
  1228.     b=(HUFF_ELEMENT*) queue.root[1];
  1229.     new=huff_tree->element_buffer+found+i;
  1230.     new->count=a->count+b->count;
  1231.     bits_packed+=(uint) (new->count & 7);
  1232.     bytes_packed+=new->count/8;
  1233.     new->a.nod.left=a;            /* lesser in left  */
  1234.     new->a.nod.right=b;
  1235.     queue.root[1]=(byte*) new;
  1236.     queue_replaced(&queue);
  1237.   }
  1238.   huff_tree->root=(HUFF_ELEMENT*) queue.root[1];
  1239.   huff_tree->bytes_packed=bytes_packed+(bits_packed+7)/8;
  1240.   return 0;
  1241. }
  1242.  
  1243. static int compare_tree(register const uchar *s, register const uchar *t)
  1244. {
  1245.   uint length;
  1246.   for (length=global_count->field_length; length-- ;)
  1247.     if (*s++ != *t++)
  1248.       return (int) s[-1] - (int) t[-1];
  1249.   return 0;
  1250. }
  1251.  
  1252.     /* Used by make_huff_tree to save intervall-counts in queue */
  1253.  
  1254. static int save_counts_in_queue(byte *key, element_count count, HUFF_TREE *tree)
  1255. {
  1256.   HUFF_ELEMENT *new;
  1257.  
  1258.   new=tree->element_buffer+(tree->elements++);
  1259.   new->count=count;
  1260.   new->a.leaf.null=0;
  1261.   new->a.leaf.element_nr= (uint) (key- tree->counts->tree_buff) /
  1262.     tree->counts->field_length;
  1263.   queue.root[tree->elements]=(byte*) new;
  1264.   return 0;
  1265. }
  1266.  
  1267.  
  1268.     /* Calculate length of file if given counts should be used */
  1269.     /* Its actually a faster version of make_huff_tree */
  1270.  
  1271. static my_off_t calc_packed_length(HUFF_COUNTS *huff_counts, uint add_tree_lenght)
  1272. {
  1273.   uint i,found,bits_packed,first,last;
  1274.   my_off_t bytes_packed;
  1275.   HUFF_ELEMENT element_buffer[256];
  1276.   DBUG_ENTER("calc_packed_length");
  1277.  
  1278.   first=last=0;
  1279.   for (i=found=0 ; i < 256 ; i++)
  1280.   {
  1281.     if (huff_counts->counts[i])
  1282.     {
  1283.       if (! found++)
  1284.     first=i;
  1285.       last=i;
  1286.       queue.root[found]=(byte*) &huff_counts->counts[i];
  1287.     }
  1288.   }
  1289.   if (!found)
  1290.     DBUG_RETURN(0);            /* Empty tree */
  1291.   if (found < 2)
  1292.     queue.root[++found]=(byte*) &huff_counts->counts[last ? 0 : 1];
  1293.  
  1294.   queue.elements=found;
  1295.  
  1296.   bytes_packed=0; bits_packed=0;
  1297.   if (add_tree_lenght)
  1298.     bytes_packed=(8+9+5+5+(max_bit(last-first)+1)*found+
  1299.           (max_bit(found-1)+1+1)*(found-2) +7)/8;
  1300.   for (i=(found+1)/2 ; i > 0 ; i--)
  1301.     _downheap(&queue,i);
  1302.   for (i=0 ; i < found-1 ; i++)
  1303.   {
  1304.     HUFF_ELEMENT *a,*b,*new;
  1305.     a=(HUFF_ELEMENT*) queue_remove(&queue,0);
  1306.     b=(HUFF_ELEMENT*) queue.root[1];
  1307.     new=element_buffer+i;
  1308.     new->count=a->count+b->count;
  1309.     bits_packed+=(uint) (new->count & 7);
  1310.     bytes_packed+=new->count/8;
  1311.     queue.root[1]=(byte*) new;
  1312.     queue_replaced(&queue);
  1313.   }
  1314.   DBUG_RETURN(bytes_packed+(bits_packed+7)/8);
  1315. }
  1316.  
  1317.  
  1318.     /* Remove trees that don't give any compression */
  1319.  
  1320. static uint join_same_trees(HUFF_COUNTS *huff_counts, uint trees)
  1321. {
  1322.   uint k,tree_number;
  1323.   HUFF_COUNTS count,*i,*j,*last_count;
  1324.  
  1325.   last_count=huff_counts+trees;
  1326.   for (tree_number=0, i=huff_counts ; i < last_count ; i++)
  1327.   {
  1328.     if (!i->tree->tree_number)
  1329.     {
  1330.       i->tree->tree_number= ++tree_number;
  1331.       if (i->tree_buff)
  1332.     continue;            /* Don't join intervall */
  1333.       for (j=i+1 ; j < last_count ; j++)
  1334.       {
  1335.     if (! j->tree->tree_number && ! j->tree_buff)
  1336.     {
  1337.       for (k=0 ; k < 256 ; k++)
  1338.         count.counts[k]=i->counts[k]+j->counts[k];
  1339.       if (calc_packed_length(&count,1) <=
  1340.           i->tree->bytes_packed + j->tree->bytes_packed+
  1341.           i->tree->tree_pack_length+j->tree->tree_pack_length+
  1342.           ALLOWED_JOIN_DIFF)
  1343.       {
  1344.         memcpy((byte*) i->counts,(byte*) count.counts,
  1345.            sizeof(count.counts[0])*256);
  1346.         my_free((gptr) j->tree->element_buffer,MYF(0));
  1347.         j->tree->element_buffer=0;
  1348.         j->tree=i->tree;
  1349.         bmove((byte*) i->counts,(byte*) count.counts,
  1350.           sizeof(count.counts[0])*256);
  1351.         if (make_huff_tree(i->tree,i))
  1352.           return (uint) -1;
  1353.       }
  1354.     }
  1355.       }
  1356.     }
  1357.   }
  1358.   if (verbose)
  1359.     printf("Original trees:  %d  After join: %d\n",trees,tree_number);
  1360.   return tree_number;            /* Return trees left */
  1361. }
  1362.  
  1363.  
  1364.     /* Fill in huff_tree decode tables */
  1365.  
  1366. static int make_huff_decode_table(HUFF_TREE *huff_tree, uint trees)
  1367. {
  1368.   uint elements;
  1369.   for ( ; trees-- ; huff_tree++)
  1370.   {
  1371.     if (huff_tree->tree_number > 0)
  1372.     {
  1373.       elements=huff_tree->counts->tree_buff ? huff_tree->elements : 256;
  1374.       if (!(huff_tree->code =
  1375.         (ulong*) my_malloc(elements*
  1376.                    (sizeof(ulong)+sizeof(uchar)),
  1377.                    MYF(MY_WME | MY_ZEROFILL))))
  1378.     return 1;
  1379.       huff_tree->code_len=(uchar*) (huff_tree->code+elements);
  1380.       make_traverse_code_tree(huff_tree,huff_tree->root,32,0);
  1381.     }
  1382.   }
  1383.   return 0;
  1384. }
  1385.  
  1386.  
  1387. static void make_traverse_code_tree(HUFF_TREE *huff_tree, HUFF_ELEMENT *element,
  1388.                     uint size, ulong code)
  1389. {
  1390.   uint chr;
  1391.   if (!element->a.leaf.null)
  1392.   {
  1393.     chr=element->a.leaf.element_nr;
  1394.     huff_tree->code_len[chr]=(uchar) (32-size);
  1395.     huff_tree->code[chr]=    (code >> size);
  1396.     if (huff_tree->height < 32-size)
  1397.       huff_tree->height= 32-size;
  1398.   }
  1399.   else
  1400.   {
  1401.     size--;
  1402.     make_traverse_code_tree(huff_tree,element->a.nod.left,size,code);
  1403.     make_traverse_code_tree(huff_tree,element->a.nod.right,size,
  1404.                 code+((ulong) 1L << size));
  1405.   }
  1406.   return;
  1407. }
  1408.  
  1409.  
  1410.     /* Write header to new packed data file */
  1411.  
  1412. static int write_header(MRG_INFO *mrg,uint head_length,uint trees,
  1413.             my_off_t tot_elements,my_off_t filelength)
  1414. {
  1415.   byte *buff=file_buffer.pos;
  1416.  
  1417.   bzero(buff,HEAD_LENGTH);
  1418.   memcpy(buff,nisam_pack_file_magic,4);
  1419.   int4store(buff+4,head_length);
  1420.   int4store(buff+8, mrg->min_pack_length);
  1421.   int4store(buff+12,mrg->max_pack_length);
  1422.   int4store(buff+16,tot_elements);
  1423.   int4store(buff+20,intervall_length);
  1424.   int2store(buff+24,trees);
  1425.   buff[26]=(char) mrg->ref_length;
  1426.     /* Save record pointer length */
  1427.   buff[27]= (uchar) (filelength >= (1L << 24) ? 4 :
  1428.              filelength >= (1L << 16) ? 3 : 2);
  1429.   if (test_only)
  1430.     return 0;
  1431.   VOID(my_seek(file_buffer.file,0L,MY_SEEK_SET,MYF(0)));
  1432.   return my_write(file_buffer.file,file_buffer.pos,HEAD_LENGTH,
  1433.           MYF(MY_WME | MY_NABP | MY_WAIT_IF_FULL)) != 0;
  1434. }
  1435.  
  1436.     /* Write fieldinfo to new packed file */
  1437.  
  1438. static void write_field_info(HUFF_COUNTS *counts, uint fields, uint trees)
  1439. {
  1440.   reg1 uint i;
  1441.   uint huff_tree_bits;
  1442.   huff_tree_bits=max_bit(trees ? trees-1 : 0);
  1443.  
  1444.   for (i=0 ; i++ < fields ; counts++)
  1445.   {
  1446.     write_bits((ulong) (int) counts->field_type,4);
  1447.     write_bits(counts->pack_type,4);
  1448.     if (counts->pack_type & PACK_TYPE_ZERO_FILL)
  1449.       write_bits(counts->max_zero_fill,4);
  1450.     else
  1451.       write_bits(counts->length_bits,4);
  1452.     write_bits((ulong) counts->tree->tree_number-1,huff_tree_bits);
  1453.   }
  1454.   flush_bits();
  1455.   return;
  1456. }
  1457.  
  1458.     /* Write all huff_trees to new datafile. Return tot count of
  1459.        elements in all trees
  1460.        Returns 0 on error */
  1461.  
  1462. static my_off_t write_huff_tree(HUFF_TREE *huff_tree, uint trees)
  1463. {
  1464.   uint i,int_length;
  1465.   uint *packed_tree,*offset,length;
  1466.   my_off_t elements;
  1467.  
  1468.   for (i=length=0 ; i < trees ; i++)
  1469.     if (huff_tree[i].tree_number > 0 && huff_tree[i].elements > length)
  1470.       length=huff_tree[i].elements;
  1471.   if (!(packed_tree=(uint*) my_alloca(sizeof(uint)*length*2)))
  1472.   {
  1473.     my_error(EE_OUTOFMEMORY,MYF(ME_BELL),sizeof(uint)*length*2);
  1474.     return 0;
  1475.   }
  1476.  
  1477.   intervall_length=0;
  1478.   for (elements=0; trees-- ; huff_tree++)
  1479.   {
  1480.     if (huff_tree->tree_number == 0)
  1481.       continue;                /* Deleted tree */
  1482.     elements+=huff_tree->elements;
  1483.     huff_tree->max_offset=2;
  1484.     if (huff_tree->elements <= 1)
  1485.       offset=packed_tree;
  1486.     else
  1487.       offset=make_offset_code_tree(huff_tree,huff_tree->root,packed_tree);
  1488.     huff_tree->offset_bits=max_bit(huff_tree->max_offset);
  1489.     if (huff_tree->max_offset >= IS_OFFSET)
  1490.     {                /* This should be impossible */
  1491.       VOID(fprintf(stderr,"Tree offset got too big: %d, aborted\n",
  1492.           huff_tree->max_offset));
  1493.       my_afree((gptr) packed_tree);
  1494.       return 0;
  1495.     }
  1496.  
  1497. #ifdef EXTRA_DBUG
  1498.     printf("pos: %d  elements: %d  tree-elements: %d  char_bits: %d\n",
  1499.        (uint) (file_buffer.pos-file_buffer.buffer),
  1500.        huff_tree->elements,  (offset-packed_tree),huff_tree->char_bits);
  1501. #endif
  1502.     if (!huff_tree->counts->tree_buff)
  1503.     {
  1504.       write_bits(0,1);
  1505.       write_bits(huff_tree->min_chr,8);
  1506.       write_bits(huff_tree->elements,9);
  1507.       write_bits(huff_tree->char_bits,5);
  1508.       write_bits(huff_tree->offset_bits,5);
  1509.       int_length=0;
  1510.     }
  1511.     else
  1512.     {
  1513.       int_length=(uint) (huff_tree->counts->tree_pos -
  1514.              huff_tree->counts->tree_buff);
  1515.       write_bits(1,1);
  1516.       write_bits(huff_tree->elements,15);
  1517.       write_bits(int_length,16);
  1518.       write_bits(huff_tree->char_bits,5);
  1519.       write_bits(huff_tree->offset_bits,5);
  1520.       intervall_length+=int_length;
  1521.     }
  1522.     length=(uint) (offset-packed_tree);
  1523.     if (length != huff_tree->elements*2-2)
  1524.       printf("error: Huff-tree-length: %d != calc_length: %d\n",
  1525.          length,huff_tree->elements*2-2);
  1526.  
  1527.     for (i=0 ; i < length ; i++)
  1528.     {
  1529.       if (packed_tree[i] & IS_OFFSET)
  1530.     write_bits(packed_tree[i] - IS_OFFSET+ ((ulong) 1L << huff_tree->offset_bits),
  1531.            huff_tree->offset_bits+1);
  1532.       else
  1533.     write_bits(packed_tree[i]-huff_tree->min_chr,huff_tree->char_bits+1);
  1534.     }
  1535.     flush_bits();
  1536.     if (huff_tree->counts->tree_buff)
  1537.     {
  1538.       for (i=0 ; i < int_length ; i++)
  1539.     write_bits((uint) (uchar) huff_tree->counts->tree_buff[i],8);
  1540.     }
  1541.     flush_bits();
  1542.   }
  1543.   my_afree((gptr) packed_tree);
  1544.   return elements;
  1545. }
  1546.  
  1547.  
  1548. static uint *make_offset_code_tree(HUFF_TREE *huff_tree, HUFF_ELEMENT *element,
  1549.                    uint *offset)
  1550. {
  1551.   uint *prev_offset;
  1552.  
  1553.   prev_offset= offset;
  1554.   if (!element->a.nod.left->a.leaf.null)
  1555.   {
  1556.     offset[0] =(uint) element->a.nod.left->a.leaf.element_nr;
  1557.     offset+=2;
  1558.   }
  1559.   else
  1560.   {
  1561.     prev_offset[0]= IS_OFFSET+2;
  1562.     offset=make_offset_code_tree(huff_tree,element->a.nod.left,offset+2);
  1563.   }
  1564.   if (!element->a.nod.right->a.leaf.null)
  1565.   {
  1566.     prev_offset[1]=element->a.nod.right->a.leaf.element_nr;
  1567.     return offset;
  1568.   }
  1569.   else
  1570.   {
  1571.     uint temp=(uint) (offset-prev_offset-1);
  1572.     prev_offset[1]= IS_OFFSET+ temp;
  1573.     if (huff_tree->max_offset < temp)
  1574.       huff_tree->max_offset = temp;
  1575.     return make_offset_code_tree(huff_tree,element->a.nod.right,offset);
  1576.   }
  1577. }
  1578.  
  1579.     /* Get number of bits neaded to represent value */
  1580.  
  1581. static uint max_bit(register uint value)
  1582. {
  1583.   reg2 uint power=1;
  1584.  
  1585.   while ((value>>=1))
  1586.     power++;
  1587.   return (power);
  1588. }
  1589.  
  1590.  
  1591. static int compress_isam_file(MRG_INFO *mrg, HUFF_COUNTS *huff_counts)
  1592. {
  1593.   int error;
  1594.   uint i,max_calc_length,pack_ref_length,min_record_length,max_record_length,
  1595.   intervall,field_length;
  1596.   my_off_t record_count,max_allowed_length;
  1597.   ulong length;
  1598.   byte *record,*pos,*end_pos,*record_pos,*start_pos;
  1599.   HUFF_COUNTS *count,*end_count;
  1600.   HUFF_TREE *tree;
  1601.   N_INFO *isam_file=mrg->file[0];
  1602.   DBUG_ENTER("compress_isam_file");
  1603.  
  1604.   if (!(record=(byte*) my_alloca(isam_file->s->base.reclength)))
  1605.     return -1;
  1606.   end_count=huff_counts+isam_file->s->base.fields;
  1607.   min_record_length= (uint) ~0;
  1608.   max_record_length=0;
  1609.  
  1610.   for (i=max_calc_length=0 ; i < isam_file->s->base.fields ; i++)
  1611.   {
  1612.     if (!(huff_counts[i].pack_type & PACK_TYPE_ZERO_FILL))
  1613.       huff_counts[i].max_zero_fill=0;
  1614.     if (huff_counts[i].field_type == FIELD_CONSTANT ||
  1615.     huff_counts[i].field_type == FIELD_ZERO)
  1616.       continue;
  1617.     if (huff_counts[i].field_type == FIELD_INTERVALL)
  1618.       max_calc_length+=huff_counts[i].tree->height;
  1619.     else
  1620.       max_calc_length+=
  1621.     (huff_counts[i].field_length - huff_counts[i].max_zero_fill)*
  1622.       huff_counts[i].tree->height+huff_counts[i].length_bits;
  1623.   }
  1624.   max_calc_length/=8;
  1625.   if (max_calc_length <= 255)
  1626.     pack_ref_length=1;
  1627.   else if (max_calc_length <= 65535)
  1628.     pack_ref_length=2;
  1629.   else
  1630.     pack_ref_length=3;
  1631.   if (force_pack_ref_length)
  1632.     pack_ref_length=force_pack_ref_length;
  1633.   max_allowed_length= 1L << (pack_ref_length*8);
  1634.   record_count=0;
  1635.  
  1636.   mrg_reset(mrg);
  1637.   while ((error=mrg_rrnd(mrg,record)) >= 0)
  1638.   {
  1639.     if (! error)
  1640.     {
  1641.       if (flush_buffer(max_calc_length+pack_ref_length))
  1642.     break;
  1643.       record_pos=file_buffer.pos;
  1644.       file_buffer.pos+=pack_ref_length;
  1645.       for (start_pos=record, count= huff_counts; count < end_count ; count++)
  1646.       {
  1647.     end_pos=start_pos+(field_length=count->field_length);
  1648.     tree=count->tree;
  1649.  
  1650.     if (count->pack_type & PACK_TYPE_SPACE_FIELDS)
  1651.     {
  1652.       for (pos=start_pos ; *pos == ' ' && pos < end_pos; pos++) ;
  1653.       if (pos == end_pos)
  1654.       {
  1655.         write_bits(1,1);
  1656.         start_pos=end_pos;
  1657.         continue;
  1658.       }
  1659.       write_bits(0,1);
  1660.     }
  1661.  
  1662. #ifdef BYTE_ORDER_HIGH_FIRST
  1663.     start_pos+=count->max_zero_fill;
  1664. #else
  1665.     end_pos-=count->max_zero_fill;
  1666. #endif
  1667.     field_length-=count->max_zero_fill;
  1668.  
  1669.     switch(count->field_type) {
  1670.     case FIELD_SKIPP_ZERO:
  1671.       if (!memcmp((byte*) start_pos,zero_string,field_length))
  1672.       {
  1673.         write_bits(1,1);
  1674.         start_pos=end_pos;
  1675.         break;
  1676.       }
  1677.       write_bits(0,1);
  1678.       /* Fall through */
  1679.     case FIELD_NORMAL:
  1680.       for ( ; start_pos < end_pos ; start_pos++)
  1681.         write_bits(tree->code[(uchar) *start_pos],
  1682.                (uint) tree->code_len[(uchar) *start_pos]);
  1683.       break;
  1684.     case FIELD_SKIPP_ENDSPACE:
  1685.       for (pos=end_pos ; pos > start_pos && pos[-1] == ' ' ; pos--) ;
  1686.       length=(uint) (end_pos-pos);
  1687.       if (count->pack_type & PACK_TYPE_SELECTED)
  1688.       {
  1689.         if (length > count->min_space)
  1690.         {
  1691.           write_bits(1,1);
  1692.           write_bits(length,count->length_bits);
  1693.         }
  1694.         else
  1695.         {
  1696.           write_bits(0,1);
  1697.           pos=end_pos;
  1698.         }
  1699.       }
  1700.       else
  1701.         write_bits(length,count->length_bits);
  1702.       for ( ; start_pos < pos ; start_pos++)
  1703.         write_bits(tree->code[(uchar) *start_pos],
  1704.                (uint) tree->code_len[(uchar) *start_pos]);
  1705.       start_pos=end_pos;
  1706.       break;
  1707.     case FIELD_SKIPP_PRESPACE:
  1708.       for (pos=start_pos ; pos < end_pos && pos[0] == ' ' ; pos++) ;
  1709.       length=(uint) (pos-start_pos);
  1710.       if (count->pack_type & PACK_TYPE_SELECTED)
  1711.       {
  1712.         if (length > count->min_space)
  1713.         {
  1714.           write_bits(1,1);
  1715.           write_bits(length,count->length_bits);
  1716.         }
  1717.         else
  1718.         {
  1719.           pos=start_pos;
  1720.           write_bits(0,1);
  1721.         }
  1722.       }
  1723.       else
  1724.         write_bits(length,count->length_bits);
  1725.       for (start_pos=pos ; start_pos < end_pos ; start_pos++)
  1726.         write_bits(tree->code[(uchar) *start_pos],
  1727.                (uint) tree->code_len[(uchar) *start_pos]);
  1728.       break;
  1729.     case FIELD_CONSTANT:
  1730.     case FIELD_ZERO:
  1731.       start_pos=end_pos;
  1732.       break;
  1733.     case FIELD_INTERVALL:
  1734.       global_count=count;
  1735.       pos=(byte*) tree_search(&count->int_tree,start_pos);
  1736.       intervall=(uint) (pos - count->tree_buff)/field_length;
  1737.       write_bits(tree->code[intervall],(uint) tree->code_len[intervall]);
  1738.       start_pos=end_pos;
  1739.       break;
  1740.     case FIELD_BLOB:
  1741.       VOID(fprintf(stderr,"Can't pack files with blobs. Aborting\n"));
  1742.       DBUG_RETURN(1);
  1743.     case FIELD_LAST:
  1744.     case FIELD_VARCHAR:
  1745.     case FIELD_CHECK:
  1746.       abort();                /* Impossible */
  1747.     }
  1748. #ifndef BYTE_ORDER_HIGH_FIRST
  1749.     start_pos+=count->max_zero_fill;
  1750. #endif
  1751.       }
  1752.       flush_bits();
  1753.       length=(ulong) (file_buffer.pos-record_pos)-pack_ref_length;
  1754.       save_integer(record_pos,pack_ref_length,length);
  1755.       if (length < (ulong) min_record_length)
  1756.     min_record_length=(uint) length;
  1757.       if (length > (ulong) max_record_length)
  1758.       {
  1759.     max_record_length=(uint) length;
  1760.     if (max_record_length >= max_allowed_length)
  1761.     {
  1762.       fprintf(stderr,
  1763.           "Error: Found record with packed-length: %d, max is: %lu\n",
  1764.           max_record_length, (ulong) max_allowed_length);
  1765.       error=1;
  1766.       break;
  1767.     }
  1768.       }
  1769.       if (write_loop && ++record_count % WRITE_COUNT == 0)
  1770.       {
  1771.     printf("%lu\r",(ulong) record_count); VOID(fflush(stdout));
  1772.       }
  1773.     }
  1774.     else if (my_errno != HA_ERR_RECORD_DELETED)
  1775.       break;
  1776.   }
  1777.   if (error < 0)
  1778.   {
  1779.     error=0;
  1780.     if (my_errno != HA_ERR_END_OF_FILE)
  1781.     {
  1782.       fprintf(stderr,"%s: Got error %d reading records\n",my_progname,my_errno);
  1783.       error= 1;
  1784.     }
  1785.   }
  1786.  
  1787.   my_afree((gptr) record);
  1788.   mrg->ref_length=pack_ref_length;
  1789.   mrg->min_pack_length=max_record_length ? min_record_length : 0;
  1790.   mrg->max_pack_length=max_record_length;
  1791.   if (verbose && max_record_length &&
  1792.       max_record_length < max_allowed_length/256)
  1793.     printf("Record-length is %d bytes, could have been %d bytes\nYou can change this by using -p=%d next time you pack this file\n",
  1794.        pack_ref_length,
  1795.        max_record_length/256+1,
  1796.        max_record_length/256+1);
  1797.   DBUG_RETURN(error || error_on_write || flush_buffer((uint) ~0));
  1798. }
  1799.  
  1800.  
  1801. static char *make_new_name(char *new_name, char *old_name)
  1802. {
  1803.   return fn_format(new_name,old_name,"",DATA_TMP_EXT,2+4);
  1804. }
  1805.  
  1806. static char *make_old_name(char *new_name, char *old_name)
  1807. {
  1808.   return fn_format(new_name,old_name,"",OLD_EXT,2+4);
  1809. }
  1810.  
  1811.     /* rutines for bit writing buffer */
  1812.  
  1813. static void init_file_buffer(File file, pbool read_buffer)
  1814. {
  1815.   file_buffer.file=file;
  1816.   file_buffer.buffer=my_malloc(ALIGN_SIZE(RECORD_CACHE_SIZE),MYF(MY_WME));
  1817.   file_buffer.end=file_buffer.buffer+ALIGN_SIZE(RECORD_CACHE_SIZE)-4;
  1818.   file_buffer.pos_in_file=0;
  1819.   error_on_write=0;
  1820.   if (read_buffer)
  1821.   {
  1822.  
  1823.     file_buffer.pos=file_buffer.end;
  1824.     file_buffer.bits=0;
  1825.   }
  1826.   else
  1827.   {
  1828.     file_buffer.pos=file_buffer.buffer;
  1829.     file_buffer.bits=BITS_SAVED;
  1830.   }
  1831.   file_buffer.byte=0;
  1832. }
  1833.  
  1834.  
  1835. static int flush_buffer(uint neaded_length)
  1836. {
  1837.   uint length;
  1838.   if ((uint) (file_buffer.end - file_buffer.pos) > neaded_length)
  1839.     return 0;
  1840.   length=(uint) (file_buffer.pos-file_buffer.buffer);
  1841.   file_buffer.pos=file_buffer.buffer;
  1842.   file_buffer.pos_in_file+=length;
  1843.   if (test_only)
  1844.     return 0;
  1845.   return (error_on_write|=test(my_write(file_buffer.file,file_buffer.buffer,
  1846.                     length,
  1847.                     MYF(MY_WME | MY_NABP |
  1848.                         MY_WAIT_IF_FULL))));
  1849. }
  1850.  
  1851. static void end_file_buffer(void)
  1852. {
  1853.   my_free((gptr) file_buffer.buffer,MYF(0));
  1854. }
  1855.  
  1856.     /* output `bits` low bits of `value' */
  1857.  
  1858. static void write_bits (register ulong value, register uint bits)
  1859. {
  1860.   if ((file_buffer.bits-=(int) bits) >= 0)
  1861.   {
  1862.     file_buffer.byte|=value << file_buffer.bits;
  1863.   }
  1864.   else
  1865.   {
  1866.     reg3 uint byte_buff;
  1867.     bits= (uint) -file_buffer.bits;
  1868.     byte_buff=file_buffer.byte | (uint) (value >> bits);
  1869. #if BITS_SAVED == 32
  1870.     *file_buffer.pos++= (byte) (byte_buff >> 24) ;
  1871.     *file_buffer.pos++= (byte) (byte_buff >> 16) ;
  1872. #endif
  1873.     *file_buffer.pos++= (byte) (byte_buff >> 8) ;
  1874.     *file_buffer.pos++= (byte) byte_buff;
  1875.  
  1876.     value&=((ulong) 1L << bits)-1;
  1877. #if BITS_SAVED == 16
  1878.     if (bits >= sizeof(uint))
  1879.     {
  1880.       bits-=8;
  1881.       *file_buffer.pos++= (uchar) (value >> bits);
  1882.       value&= ((ulong) 1L << bits)-1;
  1883.       if (bits >= sizeof(uint))
  1884.       {
  1885.     bits-=8;
  1886.     *file_buffer.pos++= (uchar) (value >> bits);
  1887.     value&= ((ulong) 1L << bits)-1;
  1888.       }
  1889.     }
  1890. #endif
  1891.     if (file_buffer.pos >= file_buffer.end)
  1892.       VOID(flush_buffer((uint) ~0));
  1893.     file_buffer.bits=(int) (BITS_SAVED - bits);
  1894.     file_buffer.byte=(uint) (value << (BITS_SAVED - bits));
  1895.   }
  1896.   return;
  1897. }
  1898.  
  1899.     /* Flush bits in bit_buffer to buffer */
  1900.  
  1901. static void flush_bits (void)
  1902. {
  1903.   uint bits,byte_buff;
  1904.  
  1905.   bits=(file_buffer.bits) & ~7;
  1906.   byte_buff = file_buffer.byte >> bits;
  1907.   bits=BITS_SAVED - bits;
  1908.   while (bits > 0)
  1909.   {
  1910.     bits-=8;
  1911.     *file_buffer.pos++= (byte) (uchar) (byte_buff >> bits) ;
  1912.   }
  1913.   file_buffer.bits=BITS_SAVED;
  1914.   file_buffer.byte=0;
  1915.   return;
  1916. }
  1917.  
  1918.     /* Store long in 1,2,3,4 or 5 bytes */
  1919.  
  1920. static void save_integer(byte *pos, uint pack_length, my_off_t value)
  1921. {
  1922.   switch (pack_length) {
  1923.   case 5: int5store(pos,(ulonglong) value); break;
  1924.   default: int4store(pos,(ulong) value); break;
  1925.   case 3: int3store(pos,(ulong) value);  break;
  1926.   case 2: int2store(pos,(uint) value); break;
  1927.   case 1: pos[0]= (byte) (uchar) value; break;
  1928.   }
  1929.   return;
  1930. }
  1931.  
  1932.  
  1933. /****************************************************************************
  1934. ** functions to handle the joined files
  1935. ****************************************************************************/
  1936.  
  1937. static void save_state(N_INFO *isam_file,MRG_INFO *mrg,my_off_t new_length,
  1938.                ulong crc)
  1939. {
  1940.   ISAM_SHARE *share=isam_file->s;
  1941.   uint options=uint2korr(share->state.header.options);
  1942.   DBUG_ENTER("save_state");
  1943.  
  1944.   options|= HA_OPTION_COMPRESS_RECORD | HA_OPTION_READ_ONLY_DATA;
  1945.   int2store(share->state.header.options,options);
  1946.  
  1947.   share->state.data_file_length=(ulong) new_length;
  1948.   share->state.del=share->state.empty=0;
  1949.   share->state.dellink= (ulong) NI_POS_ERROR;
  1950.   share->state.splitt=(ulong) mrg->records;
  1951.   share->state.version=(ulong) time((time_t*) 0);
  1952.   share->state.keys=0;
  1953.   share->state.key_file_length=share->base.keystart;
  1954.  
  1955.   isam_file->update|=(HA_STATE_CHANGED | HA_STATE_ROW_CHANGED);
  1956.   isam_file->this_uniq=crc;        /* Save crc here */
  1957.   share->changed=1;            /* Force write of header */
  1958.   VOID(my_chsize(share->kfile,share->state.key_file_length,
  1959.          MYF(0)));
  1960.   if (share->state.keys != share->base.keys)
  1961.     isamchk_neaded=1;
  1962.   DBUG_VOID_RETURN;
  1963. }
  1964.  
  1965.  
  1966. static int save_state_mrg(File file,MRG_INFO *mrg,my_off_t new_length,
  1967.               ulong crc)
  1968. {
  1969.   N_STATE_INFO state;
  1970.   N_INFO *isam_file=mrg->file[0];
  1971.   uint options;
  1972.   DBUG_ENTER("save_state_mrg");
  1973.  
  1974.   memcpy(&state,&isam_file->s->state,sizeof(state));
  1975.   options= (uint2korr(state.header.options) | HA_OPTION_COMPRESS_RECORD |
  1976.         HA_OPTION_READ_ONLY_DATA);
  1977.   int2store(state.header.options,options);
  1978.   state.data_file_length=(ulong) new_length;
  1979.   state.del=state.empty=0;
  1980.   state.dellink= (ulong) NI_POS_ERROR;
  1981.   state.records=state.splitt=(ulong) mrg->records;
  1982.   state.version=(ulong) time((time_t*) 0);
  1983.   state.keys=0;
  1984.   state.key_file_length=isam_file->s->base.keystart;
  1985.   state.uniq=crc;
  1986.   if (state.keys != isam_file->s->base.keys)
  1987.     isamchk_neaded=1;
  1988.   DBUG_RETURN (my_pwrite(file,(char*) &state.header,
  1989.              isam_file->s->state_length,0L,
  1990.              MYF(MY_NABP | MY_WME)) != 0);
  1991. }
  1992.  
  1993.  
  1994. /* reset for mrg_rrnd */
  1995.  
  1996. static void mrg_reset(MRG_INFO *mrg)
  1997. {
  1998.   if (mrg->current)
  1999.   {
  2000.     nisam_extra(*mrg->current,HA_EXTRA_NO_CACHE);
  2001.     mrg->current=0;
  2002.   }
  2003. }
  2004.  
  2005. static int mrg_rrnd(MRG_INFO *info,byte *buf)
  2006. {
  2007.   int error;
  2008.   N_INFO *isam_info;
  2009.   my_off_t filepos;
  2010.  
  2011.   if (!info->current)
  2012.   {
  2013.     isam_info= *(info->current=info->file);
  2014.     info->end=info->current+info->count;
  2015.     nisam_extra(isam_info,HA_EXTRA_RESET);
  2016.     nisam_extra(isam_info,HA_EXTRA_CACHE);
  2017.     filepos=isam_info->s->pack.header_length;
  2018.   }
  2019.   else
  2020.   {
  2021.     isam_info= *info->current;
  2022.     filepos= isam_info->nextpos;
  2023.   }
  2024.  
  2025.   for (;;)
  2026.   {
  2027.     isam_info->update&= (HA_STATE_CHANGED | HA_STATE_ROW_CHANGED);
  2028.     if ((error=(*isam_info->s->read_rnd)(isam_info,(byte*) buf,
  2029.                      (ulong) filepos, 1)) >= 0 ||
  2030.     my_errno != HA_ERR_END_OF_FILE)
  2031.       return (error);
  2032.     nisam_extra(isam_info,HA_EXTRA_NO_CACHE);
  2033.     if (info->current+1 == info->end)
  2034.       return(-1);
  2035.     info->current++;
  2036.     isam_info= *info->current;
  2037.     filepos=isam_info->s->pack.header_length;
  2038.     nisam_extra(isam_info,HA_EXTRA_RESET);
  2039.     nisam_extra(isam_info,HA_EXTRA_CACHE);
  2040.   }
  2041. }
  2042.  
  2043.  
  2044. static int mrg_close(MRG_INFO *mrg)
  2045. {
  2046.   uint i;
  2047.   int error=0;
  2048.   for (i=0 ; i < mrg->count ; i++)
  2049.     error|=nisam_close(mrg->file[i]);
  2050.   return error;
  2051. }
  2052.