home *** CD-ROM | disk | FTP | other *** search
/ Freelog 65 / Freelog065.iso / BAS / Bureautique / Gnumeric / gnumeric-1.3.92-rc1.exe / files-textopen.xml < prev    next >
Text File  |  2004-11-01  |  57KB  |  1,741 lines

  1. <sect1 id="sect-file-textImport">
  2.   <title>Importing Text Files</title>
  3.  
  4. <!-- TODO: ask- In text import druid, what does row selection do? Why the highlight? -->
  5.  
  6.   <para>
  7.     &gnum; can import data which is organized as text fields
  8.     structured in some systematic fashion either from a file or from
  9.     the clipboard. Importing structured text may require extensive
  10.     intervention on the part of the user so &gnum; provides a
  11.     <interface>Text Import</interface> druid, which is a three paneled
  12.     dialog with configuration options. For text imported from files,
  13.     this druid appears after the file has been opened, using the file
  14.     format named "Text Import (configurable)" in the <interface>File
  15.     Open</interface> dialog, as is explained in <xref
  16.     linkend="sect-file-open" />. For text imported from the clipboard,
  17.     the druid appears when a user attempts to paste the text into a
  18.     worksheet, as is explained in <xref
  19.     linkend="sect-movecopy-xclipboard" />.
  20.   </para>
  21.  
  22.   <para>
  23.     The text import druid contains three panels but the middle panel
  24.     differs depending on the structuring system used, either with data
  25.     fields separated by a special character or with data fields
  26.     occurring at equally spaced intervals in each line. The first
  27.     panel allows the user to configure the character encoding, line
  28.     break characters, structuring system, and line range. The second
  29.     panel allows the user to define the columns by either, for
  30.     separated data, setting the separating character and text
  31.     delimiting character, or, for fixed space data, by setting the
  32.     column spacing. The third panel allows the user to select which
  33.     columns to import and define their data types.
  34.   </para>
  35.  
  36.     <tip>
  37.     <title>The steps involved in the text import druid.</title>
  38.  
  39.     <para></para>
  40. <!-- TODO: render hack- remove this spacing hack  -->
  41.  
  42.     <orderedlist>
  43.       <listitem>
  44.         <para>
  45.       Launch the  <interface>Text Import</interface> druid using,
  46.       in the <guimenu>File</guimenu>, the
  47.       <guimenuitem>Open</guimenuitem> and selecting the "Text import
  48.       (configurable)" file format type.
  49.     </para>
  50.       </listitem>
  51.       <listitem>
  52.         <para>
  53.       Define the character encoding of the text block.
  54.     </para>
  55.       </listitem>
  56.       <listitem>
  57.         <para>
  58.       Define the characters indicating the breaks between the lines.
  59.     </para>
  60.       </listitem>
  61.       <listitem>
  62.         <para>
  63.       Select the line range from the text block to be imported.
  64.     </para>
  65.       </listitem>
  66.       <listitem>
  67.         <para>
  68.       Go to the second panel, which will be different for data
  69.       structured by separating characters and data structured by
  70.       fixed spacing.
  71.     </para>
  72.       </listitem>
  73.       <listitem>
  74.         <para>
  75.       (For separated data) Define the separating character.
  76.     </para>
  77.       </listitem>
  78.       <listitem>
  79.         <para>
  80.       (For separated data) Define the character grouping a text field.
  81.     </para>
  82.       </listitem>
  83.       <listitem>
  84.         <para>
  85.       (For fixed width data) Define the field widths.
  86.     </para>
  87.       </listitem>
  88.       <listitem>
  89.         <para>
  90.       Go to the third panel.
  91.     </para>
  92.       </listitem>
  93.       <listitem>
  94.         <para>
  95.       Configure the inclusion of empty outside columns.
  96.     </para>
  97.       </listitem>
  98.       <listitem>
  99.         <para>
  100.       Select the locale that will influence the formating of the
  101.       numerical elements in each column.
  102.     </para>
  103.       </listitem>
  104.        <listitem>
  105.         <para>
  106.       Select the numerical formats for the data in each columns.
  107.     </para>
  108.       </listitem>
  109.       <listitem>
  110.         <para>
  111.       Select the columns to be included in the imported block.
  112.     </para>
  113.       </listitem>
  114.       <listitem>
  115.         <para>
  116.       Click on the <guibutton>Finish</guibutton> button.
  117.     </para>
  118.       </listitem>
  119.     </orderedlist>
  120.  
  121.   </tip>
  122.  
  123.   <para>
  124.     This explanation of the <interface>Text Import</interface> druid
  125.     will first start with a discussion of text files including
  126.     character encodings and line break delimiters. The explanation
  127.     will then cover the various strategies used to structure numeric
  128.     data in text files. Following these discussions, the components of
  129.     the druid will be presented and, finally, a detailed explanation
  130.     of each step in the use of the druid will be presented.
  131.   </para>
  132.  
  133.  
  134.   <sect2 id="sect-file-textImport-complex">
  135.     <title>The complexities of text format files</title>
  136.  
  137.     <para>
  138.       The use of text format files to store and transmit data for use
  139.       in a spreadsheet involves three somewhat complex decisions which
  140.       determine how the file expresses and separates each data
  141.       value. These complexities must be understood for a user to be
  142.       able to use the <interface>Text Import</interface> druid
  143.       effectively. These complexities exist because of the limitations
  144.       of early computers and because or the historical development of
  145.       computer systems by different manufacturers and programmers, in
  146.       different countries, targeting different types of users,
  147.       speaking different languages.
  148.     </para>
  149.  
  150.     <para>
  151.       The first complexity involves the different systems which relate
  152.       the contents of a computer file to the characters in a written
  153.       language. All text files on a computer consist of a long
  154.       sequence of binary digits. Text files are files in which these
  155.       digits are used to indicate different textual
  156.       characters. Character 'encodings' are standardized systems which
  157.       relate the binary digits in a computer file to a formal system
  158.       of characters which includes both text glyphs (shapes) and
  159.       formatting indicators. Each encoding defines a way to interpret
  160.       the binary digits and uses the characters from a particular
  161.       character set. The alternative character encoding strategies are
  162.       explained in greater detail in <xref
  163.       linkend="sect-file-textImport-complex-encoding"/>, below.
  164.     </para>
  165.  
  166.     <para>
  167.       The second complexity involves the decision of how to separate
  168.       the characters in a file into different lines. Text files
  169.       explicitly determine the end of each line of a file with a
  170.       specific character or sequence of characters. The complexity
  171.       involves the particular character sequence used to determine the
  172.       end of each line. Different conventions have been used in
  173.       different computer systems. The alternative line breaking
  174.       strategies are explained in greater detail in <xref
  175.       linkend="sect-file-textImport-complex-lineBreak"/>, below.
  176.     </para>
  177.  
  178.     <para>
  179.       The third complexity involves the decision of how to separate
  180.       the characters in each line into separate value fields. Again,
  181.       different strategies exist. These can be separated into two
  182.       broad categories: strategies which use a character or sequence
  183.       of characters to separate the values, so called 'delimited' or
  184.       'separated' strategies, and strategies which use the position of
  185.       the character in the line to separate the values, so called
  186.       'fixed-width' strategies. The alternative data structuring
  187.       strategies are explained in greater detail in <xref
  188.       linkend="sect-file-textImport-complex-dataStruct"/>, below.
  189.     </para>
  190.  
  191.  
  192.     <para>
  193.       Fortunately, the &gnum; <interface>Text Import</interface> druid
  194.       provides users with a way to preview the information in a text
  195.       file. This enables users to change the settings which determine
  196.       each of these three conventions until the text in the preview
  197.       correctly shows the contents of the data file. Therefore, while
  198.       the details of these three steps are complex, the practical
  199.       impact on users is minimal. Users can simply experiment until
  200.       the file appears correct without having to understand each of
  201.       these complexities in detail.
  202.     </para>
  203.  
  204.  
  205.   <sect3 id="sect-file-textImport-complex-encoding">
  206.     <title>Character Encodings</title>
  207.  
  208.  
  209.     <para>
  210.       The use of text files to store data in a structured fashion for
  211.       use by spreadsheet programs, and more generally all text files,
  212.       require some scheme to relate the binary number in the computer
  213.       file itself to the characters of a written language. Such
  214.       schemes are called <wordasword>'encodings'</wordasword>.
  215.  
  216.     </para>
  217.  
  218.     <para>
  219.       The origin of computers led to the invention of a number of
  220.       different encoding schemes. Due to the limitation of early
  221.       computer hardware, these encoding schemes all restricted
  222.       themselves to character sets which contained only the most
  223.       essential characters of the English language. The desire to
  224.       support characters which were not in this basic set of
  225.       characters led to the creation of new encoding schemes,
  226.       many of which restricted themselves to the characters in
  227.       specific languages. One encoding scheme, called UTF-8, has now
  228.       emerged as the best encoding scheme for the future for a
  229.       multitude of reasons including its ability to co-exist with
  230.       current operating systems and its ability to encode all of the
  231.       characters in the largest set of characters which has been
  232.       consistently defined, the Universal Character Set. However, the
  233.       existence of the diversity of encoding schemes means that for
  234.       the foreseeable future, files will be created and distributed
  235.       using several different schemes. This is especially true for
  236.       files containing text in languages other than English.
  237.     </para>
  238.  
  239.     <para>
  240.       This complex situation generally does not impact users.  &gnum;
  241.       has been designed to deal with most of the complexity. Many
  242.       kinds of flies, such as the &gnum; file format itself, describe
  243.       their encoding scheme internally in such a way that it can be
  244.       easily recognized. &gnum; also provides an easy approach to
  245.       changing the encoding scheme in case this proves necessary.
  246.     </para>
  247.  
  248.     <para>
  249.       Encoding schemes merely prove a hindrance to users when opening
  250.       files. There is no danger that data be lost or that any other
  251.       serious problem arise by selecting the wrong scheme. If the
  252.       wrong scheme is selected, either the file will contain
  253.       characters which are non-sensical and &gnum; will open an error
  254.       dialog asking the user to select a different encoding scheme, or
  255.       the preview area will display non-sensical characters. These
  256.       non-sensical characters may simply be characters grouped
  257.       together which do not occur in any language, such as
  258.       "åÕÛÛÞ", or may be characters for which
  259.       a graphical representation (a glyph) does not exist in the font
  260.       being used and is therefore displayed using a small box with
  261.       four numbers inside, such as € and ‚. Each of
  262.       these errors indicates that the encoding scheme used to read the
  263.       file was not the same encoding scheme as was used to create the
  264.       file. The difficulty is then to determine what encoding scheme
  265.       to use. A simple process of trial and error should lead to
  266.       picking the right scheme.
  267.    </para>
  268.  
  269.     <para>
  270.       A basic strategy to find the right encoding for a file being
  271.       imported into &gnum; is, first, to use the scheme proposed by
  272.       &gnum; and, then, to hunt for the correct encoding. The default
  273.       encoding scheme is the one defined by the locale setting of the
  274.       user and this is also the default scheme &gnum; uses to create
  275.       text files.
  276. <!-- TODO: encoding- add xref to locale. -->
  277.  
  278.       If the default encoding is incorrect, the correct encoding must
  279.       be found by trial and error. One strategy to use is to examine
  280.       the major wester encodings and then the major regional
  281.       encodings. The major western encoding schemes are ASCII,
  282.       ISO-8859-1, and UTF-8, but ASCII is a subset of the other two so
  283.       it does not need to be tried on its own. The major regional
  284.       encodings are the IS0-8859-x schemes since these have become
  285.       quite popular in GNU operating systems. Alternatively, the
  286.       various character sets used by the Microsoft operating systems
  287.       can be attempted. The encoding schemes are listed under
  288.       "Western", "Unicode", and the alphabet names. 
  289.     </para>
  290.  
  291. <!-- TODO: encoding- expand discussion of each type to be useful. -->
  292. <!--
  293.     <para>
  294.       The ASCII character set and encoding
  295.            * single byte, only seven bits used.
  296.  
  297.  
  298.       The ISO-8859-x family of encoding schemes
  299.            * single byte, all eight bits used
  300.  
  301.         [From Wikipedia: http://en.wikipedia.org/wiki/ISO_8859-1]
  302.       Albanian, Basque, Catalan, Danish, Dutch, English,
  303.       Faroese, French (missing only œ), Finnish, German
  304.       (missing „ and “), Icelandic, Irish, Italian, Norwegian,
  305.       Portuguese, Rhaeto-Romanic, Scottish, Spanish, Swedish. Other
  306.       languages covered include Afrikaans and Swahili. Thus, this
  307.       character encoding is used throughout the American continent,
  308.       Western Europe, Australia, and much of Africa. 
  309.  
  310.        UTF-8 
  311.  
  312.     </para>
  313.  
  314. -->
  315.  
  316.     <para>
  317.       The World Wide Web has many resources dedicated to explaining
  318.       encoding systems and other related information. One of the best
  319.       sites discussing UTF-8 and Unicode is the <ulink type="http"
  320.       url="http://www.cl.cam.ac.uk/~mgk25/unicode.html" >UTF-8 and
  321.       Unicode FAQ for UNIX/Linux</ulink> page maintained by Markus
  322.       Kuhn. 
  323.  
  324.       The Unicode project has a <ulink type="http"
  325.       url="http://www.unicode.org">web site</ulink> which includes an
  326.       online copy of their standard character set. 
  327.  
  328.       A discussion of the ISO-8859 family of encodings can be found at
  329.       a page titled: "<ulink type="http"
  330.       url="http://czyborra.com/charsets/iso8859.html" >The ISO-8859
  331.       Alphabet Soup</ulink>", which may alternatively be found <ulink
  332.       type="http"
  333.       url="http://www.unicodecharacter.com/charsets/iso8859.html"
  334.       >here</ulink>. A similar discussion on Wikipedia, focusing on
  335.       the western alphabets, can be found <ulink type="http"
  336.       url="http://en.wikipedia.org/wiki/ISO_8859-1" >here</ulink>.
  337.  
  338.     </para>
  339.  
  340.  
  341. <!-- TODO: encoding- make a table of the available encodings. Here or below -->
  342. <!-- TODO: ask- encodings available are determined by gnum/pango? -->
  343.  
  344.   </sect3>
  345.  
  346.  
  347.  
  348.  
  349.  
  350.  
  351.  
  352.  
  353.  
  354.   <sect3 id="sect-file-textImport-complex-lineBreak">
  355.     <title>Line break delimiters</title>
  356.  
  357.      <para>
  358.         The use of text files to store data in a structured fashion
  359.         for use by spreadsheet programs requires a scheme to separate
  360.         each line of the file. Structured text files rely on the files
  361.         having explicitly defined rows within the file as one
  362.         component in the structuring system. Each of these rows is
  363.         defined by a character sequence indicating the end of a row.
  364.      </para>
  365.  
  366.      <para>
  367.        Two characters that are part of the ASCII code, an early
  368.        encoding that became a widely followed standard, were included
  369.        to help define the end of the line. These are the 'linefeed'
  370.        character and the 'carriage return' character, named after the
  371.        two processes which occur when a typewriter starts a new line:
  372.        first the typewriter barrel rolls - the linefeed - then the
  373.        whole carriage with the sheet of paper moves back to the
  374.        starting point -the carriage return. In the same way that
  375.        different computing systems have used different encoding
  376.        schemes,  three different approaches became common for defining
  377.        the end of the line.
  378.      </para>
  379.  
  380.      <para>
  381.        In GNU operating systems and other systems that inherit from
  382.        the UNIX legacy, the end of a line was defined simply using the
  383.        'linefeed' character. The Macintosh operating system chose
  384.        instead to use only the 'carriage return' character. The
  385.        Windows operating system uses both characters in the sequence
  386.        'carriage return' then 'linefeed'. 
  387.      </para>
  388.  
  389.      <para>
  390.        A user opening a file into &gnum; will see, in the preview area
  391.        of the <interface>Text Import</interface> druid, whether or not
  392.        the line breaks have been recognized correctly and will be able
  393.        to alter the recognition settings. An incompatible setup will
  394.        either yield a single unbroken line of text, lines of text with
  395.        extra, empty rows between them, or lines of text with extra
  396.        symbols at the start or end of each line.
  397.      </para>
  398.  
  399. <!-- TODO: ask- line break delimters Does having all 3 set ever not work? -->
  400.      <para>
  401.        The correct line break delimiters can be established by
  402.        checking or unchecking the alternatives. The preview area will
  403.        then show the result of the file interpreted with these
  404.        settings. 
  405.      </para>
  406.  
  407.  </sect3>
  408.  
  409.  
  410.  
  411.  
  412.  
  413.  
  414.  
  415.  
  416.  
  417.  
  418. <!-- TODO: write- section on data structuring strategies. -->
  419.  
  420.   <sect3 id="sect-file-textImport-complex-dataStruct">
  421.     <title>Data Structuring Strategies</title>
  422.  
  423.      <para>
  424.        The use of text files to store data in a structured fashion for
  425.        use by spreadsheet programs also requires some scheme to
  426.        separate each value within every line. Two different approaches
  427.        are used to separate these values. The first strategy, uses a
  428.        particular character or character sequence to denote the start
  429.        and end of each value. Such strategies are called 'Separated
  430.        Value' or 'Delimited Value' systems. The second strategy places
  431.        each value stating at a specified position in the line. Such
  432.        strategies are called 'Fixed Width' strategies because they
  433.        inherently require that each value have a pre-determined size.
  434.      </para>
  435.  
  436.      <para>
  437.        Separated Value structuring systems distinguish the contents of
  438.        each value using pre-determined characters to separate the
  439.        values. Certain characters have become common in such schemes,
  440.        for-example 'Comma Separated Value' files use a comma character
  441.        to separate values while 'Tab Separated Value' files use a tab
  442.        character. &gnum; allows the user to define the value separator
  443.        to be any one of several common characters or a specific
  444.        sequence of characters, either on their own or in
  445.        combination. For example, a file could use both space
  446.        characters and tab characters to separate values. Similarly, a
  447.        file could be read which used the entire word 'STOP' to separate
  448.        values like the common scheme to separate sentences in a
  449.        telegram.
  450.      </para>
  451.  
  452.      <para>
  453.        Separate Value structuring systems often also include a method
  454.        to surround a single text value which may itself contain the
  455.        character used to separate values. The quote character is often
  456.        used in this role but &gnum; allows users to configure any
  457.        character in this role. For example, a file which used the
  458.        comma to separate values could nonetheless contain a value like
  459.        "Zoe, Sally, Dodji" if this value had appropriate text
  460.        indicating characters at either end.
  461.     </para>
  462.  
  463.     <para>
  464.       Fixed Width structuring systems are common formats for the
  465.       output of database tables since the contents of these tables
  466.       have often been defined as variables of a particular size.
  467. <!-- TODO: dataStruct- get example for dB variable CHAR14 -->
  468.       To import these files, users must specify exactly the start of
  469.       each column so that the importer can separate the values on each
  470.       row. 
  471.  
  472.     </para>
  473.  
  474.     </sect3>
  475.  
  476.   </sect2>
  477.  
  478.  
  479.  
  480.  
  481.  
  482.  
  483.  
  484.  
  485.  
  486.  
  487.   <sect2 id="note-file-textImport-druid">
  488.     <title>
  489.       The Components of the <interface>Text Import</interface> Druid
  490.     </title>
  491.  
  492.     <para>
  493.       The <interface>Text Import</interface> druid consists of three
  494.       panels with the middle panel differing according to the type of
  495.       data structuring used. 
  496.     </para>
  497.  
  498.     <para>
  499.       The first panel allows users to configure the character encoding
  500.       used by the file, to determine the character sequences used to
  501.       separate lines, configure the type of structuring being used and
  502.       select the lines of the file to import.  The second column allows
  503.       the user to define the separation strategy used for each
  504.       value. For separated value files this involves defining the
  505.       separating character sequences and the text indicating
  506.       character. For fixed width files, this involves defining the
  507.       width of each column.  The third panel allows the user to select
  508.       the columns to be included during the import and to select the
  509.       format of the values in each column.
  510.     </para>
  511.  
  512.     <para>
  513.       Users navigate the <interface>Text Import</interface> druid by
  514.       clicking on the <guibutton>Forward</guibutton> button on each
  515.       panel after they have configured the settings properly. The
  516.       third panel contains a <guibutton>Finish</guibutton> which
  517.       causes the file to be imported to a workbook using all the
  518.       settings as they are configured.
  519.     </para>
  520.  
  521.  
  522.     <sect3 id="sect-file-textImport-druid-panel1">
  523.       <title>
  524.         The first panel of the <interface>Text Import</interface> Druid.
  525.       </title>
  526.  
  527.       <para>
  528.         The first panel of the <interface>Text Import</interface>
  529.         Druid allows users to set the file encoding, to determine the
  530.         character sequences used to separate lines, configure the type
  531.         of structuring being used and select the lines of the file to
  532.         import.
  533.       </para>
  534.  
  535.       <figure id="fig-file-textImport-druid-panel1">
  536.         <title>
  537.       The first panel of the <interface>Text Import</interface>
  538.       druid with the component areas labeled with callouts.
  539.     </title>
  540.     <screenshot>
  541.           <mediaobject> 
  542.         <imageobject> 
  543.           <imagedata fileref="figures/textguru-import-panel1-withTags.png"
  544.                      format="PNG" />
  545.         </imageobject>
  546.         <textobject>
  547.           <para> 
  548.             This screenshot depicts the first panel 'Text Import'
  549.             druid with callouts labeling the different areas.
  550.           </para>
  551.         </textobject>
  552.         <caption>
  553.               <para>
  554.             The different components of the first panel of the
  555.             <interface>Text Import</interface> druid with each component
  556.             labeled with a callout.
  557.               </para>
  558.         </caption>
  559.       </mediaobject>
  560.     </screenshot>
  561.       </figure>
  562.  
  563.       <para>
  564.         The purpose of each labeled component in <xref
  565.         linkend="fig-file-textImport-druid-panel1" /> is
  566.         explained below:
  567.  
  568.  
  569.  
  570.  
  571.     <variablelist>
  572.       <title>The components of the first panel</title>
  573.  
  574.       <varlistentry>
  575.         <term>
  576.           <emphasis role="bold">1</emphasis> - The file encoding
  577.           selection menu.
  578.         </term>
  579.         <listitem>
  580.           <para>
  581.             This drop down menu provides a list of encoding
  582.             schemes for the characters in the text file.  By
  583.             default, &gnum; selects the encoding scheme used by
  584.             the locale of the user.  See <xref
  585.             linkend="sect-file-textImport-complex-encoding" /> for more
  586.             details.
  587.           </para>
  588.         </listitem>
  589.           </varlistentry>
  590.  
  591.       <varlistentry>
  592.         <term>
  593.           <emphasis role="bold">2</emphasis> - The line break
  594.           character selector.
  595.         </term>
  596.         <listitem>
  597.           <para>
  598.             These three check boxes can be selected individually
  599.             or together to define the sequences which will be
  600.             interpreted as line break indicators. Generally,
  601.             selecting all three boxes will produce the correct
  602.             results. 
  603. <!-- TODO: Is having all three line separators checked ever wrong? -->
  604.           </para>
  605.           <para>
  606.             The errors produced if the wrong combination of boxes
  607.             is selected will include the entire file being placed
  608.             on a single line, empty lines appearing between the
  609.             lines of the file, or undefined symbols appearing at
  610.             the beginning or end of almost every line. See <xref
  611.             linkend="sect-file-textImport-complex-lineBreak" /> for more
  612.             details.
  613.           </para>
  614.         </listitem>
  615.           </varlistentry>
  616.  
  617.       <varlistentry>
  618.         <term>
  619.           <emphasis role="bold">3</emphasis> - The data
  620.           structuring system selector.
  621.         </term>
  622.         <listitem>
  623.           <para>
  624.             These two push buttons allow the choice between the
  625.             two different structuring schemes, data structured by
  626.             placing a separating character between the data values
  627.             and data organized in fixed width columns. Note that
  628.             this choice will determine which panel will be shown
  629.             as the second panel of the druid. See <xref
  630.             linkend="sect-file-textImport-complex-dataStruct" /> for more
  631.             details. 
  632.           </para>
  633.         </listitem>
  634.           </varlistentry>
  635.  
  636.       <varlistentry>
  637.         <term>
  638.           <emphasis role="bold">4</emphasis> - The line range spinboxes.
  639.         </term>
  640.         <listitem>
  641.           <para>
  642.             These two spin buttons allow the user to select the
  643.             start and end rows for the data import. The spin boxes
  644.             can be used either by typing a new value in the text
  645.             entry area where the numbers are displayed, or by
  646.             using the mouse button to click on the up arrow to
  647.             increase the number and the down arrow to decrease the
  648.             number.
  649.           </para>
  650.           <para>
  651.             For instance, if the text file contained a large
  652.             header area with meta information, this header could
  653.             be excluded from the data imported to the &gnum;
  654.             worksheet by increasing the number of the starting,
  655.             "From", line.
  656.           </para>
  657.         </listitem>
  658.           </varlistentry>
  659.  
  660.       <varlistentry>
  661.         <term>
  662.           <emphasis role="bold">5</emphasis> - The preview area.
  663.         </term>
  664.         <listitem>
  665.           <para>
  666.             This area displays a preview of the file as it will be
  667.             interpreted when the the settings that are currently
  668.             selected in this first panel are applied.
  669.           </para>
  670.         </listitem>
  671.           </varlistentry>
  672.       <varlistentry>
  673.         <term>
  674.           <emphasis role="bold">6</emphasis> - The button area.
  675.         </term>
  676.         <listitem>
  677.           <para>
  678.             These four buttons allow the user to navigate the
  679.             druid. The <guibutton>Help</guibutton> button should
  680.             open the &gnum; manual to this section. The
  681.             <guibutton>Cancel</guibutton> button will dismiss the
  682.             dialog and return the user to the worksheet. The
  683.             <guibutton>Back</guibutton> button is disabled since
  684.             this is the first panel of the druid and the
  685.             <guibutton>Forward</guibutton> button will bring up
  686.             the next panel in the druid.
  687.           </para>
  688.         </listitem>
  689.           </varlistentry>
  690.  
  691.  
  692.         </variablelist>
  693.  
  694.       </para>
  695.  
  696.     </sect3>
  697.  
  698.     <sect3 id="sect-file-textImport-druid-panel2separated">
  699.       <title>
  700.         The second panel of the <interface>Text Import</interface>
  701.         Druid used for separated data
  702.       </title>
  703.  
  704.       <para>
  705.         The second panel of the <interface>Text Import</interface>
  706.         Druid used for separated data allows the user to configure the
  707.         character sequences used to separate the values in each row
  708.         and to configure the text delimiting characters. &gnum;, by
  709.         default, guesses which characters are being used to separate
  710.         values and pre-sets those characters. The user can, however,
  711.         reconfigure these characters.  </para>
  712.  
  713.       <figure id="fig-file-textImport-druid-panel2a">
  714.         <title>
  715.       The second panel of the <interface>Text Import</interface>
  716.       druid for separated data with
  717.       the component areas labeled with callouts. 
  718.     </title>
  719.     <screenshot>
  720.           <mediaobject> 
  721.         <imageobject> 
  722.           <imagedata fileref="figures/textguru-import-panel2a-withTags.png"
  723.                      format="PNG" />
  724.         </imageobject>
  725.         <textobject>
  726.           <para> 
  727.             This screenshot depicts the second panel 'Text Import'
  728.             druid for separated data with callouts labeling the
  729.             different areas. 
  730.           </para>
  731.         </textobject>
  732.         <caption>
  733.               <para>
  734.             The different components of the second panel of the
  735.             <interface>Text Import</interface> druid for separated data
  736.             with each component labeled with a callout.
  737.               </para>
  738.         </caption>
  739.       </mediaobject>
  740.     </screenshot>
  741.       </figure>
  742.  
  743.       <para>
  744.         The purpose of each labeled component in <xref
  745.         linkend="fig-file-textImport-druid-panel2a" /> is
  746.         explained below:
  747.  
  748.     <variablelist>
  749.       <title>The components of the second panel for structured data</title>
  750.  
  751.       <varlistentry>
  752.         <term>
  753.           <emphasis role="bold">1</emphasis> - The separator
  754.         definition area.
  755.         </term>
  756.         <listitem>
  757.           <para>
  758.  
  759.             This are allows the user to define the characters used
  760.             to separate data value fields within each
  761.             row. The checkboxes can be pressed to add or remove
  762.             characters from those treated as
  763.             separators. Additionally, the 'custom' type allows the
  764.             user to define either other single characters, or a
  765.             particular character sequence used to separate
  766.             values. The preview area in the panel will show the
  767.             file processed with the rules which have already been
  768.             applied.
  769.           </para>
  770.  
  771.           <para>
  772.             Generally, this type of file structuring uses a single
  773.             character to separate fields but it is possible to use
  774.             either several different characters or to use a
  775.             sequence of characters. For example, it would be
  776.             possible to use the old telegraphic convention of
  777.             separating phrases with the word 'STOP' by selecting
  778.             the 'custom' separator type and entering the character
  779.             sequence 'STOP' in the text field.
  780.           </para>
  781.  
  782.           <para>
  783.             This area also includes a checkbox enabling two
  784.             separator sequences that immediately follow one
  785.             another, to be treated as a single separator. This
  786.             option will only be useful where data is imported with
  787.             one or more completely empty columns and no partially
  788.             filled columns. If this option is checked and the data
  789.             file has partially filled columns of data, the columns
  790.             will be jumbled during the text import operation.
  791.           </para>
  792.  
  793.           <para>
  794.             See <xref linkend="sect-file-textImport-complex-dataStruct" />
  795.             for more details.
  796.           </para>
  797.         </listitem>
  798.           </varlistentry>
  799.  
  800.       <varlistentry>
  801.         <term>
  802.           <emphasis role="bold">2</emphasis> - The text indicating
  803.           character area.
  804.         </term>
  805.         <listitem>
  806.           <para>
  807.             Separated value files often additionally define a
  808.             character used to indicate the start and end of a data
  809.             element which should be considered a single text
  810.             entry. This strategy allows the inclusion of text
  811.             entries which include the value separator.
  812.           </para>
  813.  
  814.           <para>
  815.             For example, a file which is structured as a comma
  816.             separated value file, could use the double quotation
  817.             mark to delimit text values and would then be able to
  818.             include text values such as: 'Zoe, Mark, Sally'.
  819.           </para>
  820.         </listitem>
  821.           </varlistentry>
  822.  
  823.        <varlistentry>
  824.         <term>
  825.           <emphasis role="bold">3</emphasis> - The preview area.
  826.         </term>
  827.         <listitem>
  828.           <para>
  829.             This area displays a preview of the file as it will be
  830.             interpreted when the the settings that are currently
  831.             selected in the first and second panels are applied.
  832.           </para>
  833.         </listitem>
  834.           </varlistentry>
  835.  
  836.        <varlistentry>
  837.         <term>
  838.           <emphasis role="bold">4</emphasis> - The button area.
  839.         </term>
  840.         <listitem>
  841.           <para>
  842.             These four buttons allow the user to navigate the
  843.             druid. The <guibutton>Help</guibutton> button should
  844.             open the &gnum; manual to this section. The
  845.             <guibutton>Cancel</guibutton> button will dismiss the
  846.             dialog and return the user to the worksheet. The
  847.             <guibutton>Back</guibutton> button will take the user
  848.             back to the first panel, without, however, changing
  849.             the settings in this second panel. The
  850.             <guibutton>Forward</guibutton> button will bring up
  851.             the next panel in the druid.
  852.           </para>
  853.         </listitem>
  854.           </varlistentry>
  855.  
  856.       </variablelist>
  857.  
  858.       </para>
  859.  
  860.     </sect3>
  861.  
  862.  
  863.     <sect3 id="sect-file-textImport-druid-panel2fixed">
  864.       <title>
  865.         The second panel of the <interface>Text Import</interface>
  866.         Druid used for fixed width data
  867.       </title>
  868.  
  869.       <para>
  870.         The second panel of the <interface>Text Import</interface>
  871.         Druid used for fixed width data allows the user to define the
  872.         widths of each column to be imported. &gnum; provides a
  873.         mechanism to automatically guess the widths of the columns and
  874.         allows the user, using the mouse, to define the widths of the
  875.         columns.
  876.       </para>
  877.  
  878.       <figure id="fig-file-textImport-druid-panel2b">
  879.         <title>
  880.       The second panel of the <interface>Text Import</interface>
  881.       druid for fixed width data with the component areas labeled
  882.       with callouts. 
  883.     </title>
  884.     <screenshot>
  885.           <mediaobject> 
  886.         <imageobject> 
  887.           <imagedata fileref="figures/textguru-import-panel2b-withTags.png"
  888.                      format="PNG" />
  889.         </imageobject>
  890.         <textobject>
  891.           <para> 
  892.             This screenshot depicts the second panel 'Text Import'
  893.             druid for fixed width data with callouts labeling the
  894.             different areas. 
  895.           </para>
  896.         </textobject>
  897.         <caption>
  898.               <para>
  899.             The different components of the second panel of the
  900.             <interface>Text Import</interface> druid for fixed width
  901.             data with each component labeled with a callout.
  902.               </para>
  903.         </caption>
  904.       </mediaobject>
  905.     </screenshot>
  906.       </figure>
  907.  
  908.       <para>
  909.         The purpose of each labeled component in <xref
  910.         linkend="fig-file-textImport-druid-panel2b" /> is
  911.         explained below:
  912.  
  913.     <variablelist>
  914.       <title>
  915.         The components of the second panel for fixed width data
  916.       </title>
  917.  
  918.       <varlistentry>
  919.         <term>
  920.           <emphasis role="bold">1</emphasis> - The automatic
  921.           column discovery button.
  922.         </term>
  923.         <listitem>
  924.           <para>
  925.             This left most button, named <guibutton>Auto Column
  926.             Discovery</guibutton>, will cause &gnum; to scan the
  927.             file an attempt to assign the columns
  928.             automatically. The example presented in <xref
  929.             linkend="fig-file-textImport-druid-panel2b" /> shows
  930.             one result after this button has been pressed: many of
  931.             the columns were discovered automatically, but the
  932.             second and third columns were
  933.             misidentified. Nonetheless, the automatic mechanism
  934.             provides a useful starting point. The definition of
  935.             the columns can be refined using the methods described
  936.             below.
  937.           </para>
  938.         </listitem>
  939.           </varlistentry>
  940.  
  941.       <varlistentry>
  942.         <term>
  943.           <emphasis role="bold">2</emphasis> - The column
  944.           definition clearing button.
  945.         </term>
  946.         <listitem>
  947.           <para>
  948.  
  949.             This right most button, named
  950.             <guibutton>Clear</guibutton>, will clear all the
  951.             column definitions and reset the file to a single
  952.             column. This button should be used cautiously since
  953.             there is no way to reverse its action and any
  954.             carefully prepared column definition layout will be
  955.             irretrievably lost.
  956.  
  957.           </para>
  958.         </listitem>
  959.           </varlistentry>
  960.  
  961.       <varlistentry>
  962.         <term>
  963.           <emphasis role="bold">3</emphasis> - The preview and
  964.         column width definition area.
  965.         </term>
  966.         <listitem>
  967.           <para>
  968.             This area acts as both a preview area and an area
  969.             where users can define the columns widths.
  970.           </para>
  971.           <para>
  972.         As a preview area, this area
  973.             displays a preview of the file as it will be
  974.             interpreted when the the settings that are currently
  975.             selected in this first panel are applied.
  976.           </para>
  977.           <para>
  978.             This area can also be used to define column
  979.             widths. When the panel first appears, a single column
  980.             will be defined. The automatic column discovery
  981.             mechanism may split this single column into many more
  982.             columns. The mouse can then be used to further divide
  983.             columns or to join previously separate columns.
  984.           </para>
  985.           <para>
  986.             A new column can be defined by placing the mouse
  987.             pointer where the column should start and
  988.             double-clicking with the primary mouse button. This
  989.             will split the column which used to contain this
  990.             position and add a new column starting at this
  991.             location.
  992.           </para>
  993.           <para>
  994.             To remove the definition of a column which already
  995.             exists or to alter the ending position of a column,
  996.             the context menu must be used. The context menu
  997.             appears by clicking with one of the secondary mouse
  998.             buttons. A column which has already been defined can
  999.             be merged with the column on the left or right using
  1000.             the <guimenuitem>Delete and Merge Left</guimenuitem>
  1001.             or <guimenuitem>Delete and Merge right</guimenuitem>
  1002.             menu items. The size of a column can be increased by
  1003.             placing the mouse pointer inside the column area or
  1004.             header and using the <guimenuitem>Widen</guimenuitem>
  1005.             or <guimenuitem>Narrow</guimenuitem> menu items,
  1006.             respectively. Either of these will change the width of
  1007.             the column by changing the right hand end of the
  1008.             column.
  1009.           </para>
  1010.           <para>
  1011.             The context menu can also be used to define new
  1012.             columns using the <guimenuitem>Split</guimenuitem> menu
  1013.             item but the double-click approach described above
  1014.             should be easier.
  1015.           </para>
  1016.         </listitem>
  1017.           </varlistentry>
  1018.  
  1019.       <varlistentry>
  1020.         <term>
  1021.           <emphasis role="bold">4</emphasis> - The button area.
  1022.         </term>
  1023.         <listitem>
  1024.           <para>
  1025.             These four buttons allow the user to navigate the
  1026.             druid. The <guibutton>Help</guibutton> button should
  1027.             open the &gnum; manual to this section. The
  1028.             <guibutton>Cancel</guibutton> button will dismiss the
  1029.             dialog and return the user to the worksheet. The
  1030.             <guibutton>Back</guibutton> button will take the user
  1031.             back to the first panel, without, however, changing
  1032.             the settings in this second panel. The
  1033.             <guibutton>Forward</guibutton> button will bring up
  1034.             the next panel in the druid.
  1035.           </para>
  1036.         </listitem>
  1037.           </varlistentry>
  1038.  
  1039.         </variablelist>
  1040.  
  1041.       </para>
  1042.  
  1043.     </sect3>
  1044.  
  1045.  
  1046.     <sect3 id="sect-file-textImport-druid-panel3">
  1047.       <title>
  1048.         The third panel of the <interface>Text Import</interface>
  1049.       Druid
  1050.       </title>
  1051.  
  1052.       <para>
  1053.         This panel allows users to select and format the columns to be
  1054.         imported to the &gnum; workbook. The first button allows the
  1055.         exclusion of empty columns on either of the outer sides of the
  1056.         columns with data. The second button allows the user to define
  1057.         the locale used to interpret the values in the file. The
  1058.         remaining area allows the user to predefine the data format to
  1059.         be used for all the values in each column. This area also
  1060.         allows the users to select which columns in the file will be
  1061.         imported to the &gnum; worksheet. Finally, this panel provides
  1062.         the <guibutton>Finish</guibutton> which is used to dismiss the
  1063.         dialog and import the file.
  1064.       </para>
  1065.  
  1066.       <figure id="fig-file-textImport-druid-panel3">
  1067.         <title>
  1068.       The third panel of the <interface>Text Import</interface>
  1069.       druid with the component areas labeled with callouts.
  1070.     </title>
  1071.     <screenshot>
  1072.           <mediaobject> 
  1073.         <imageobject> 
  1074.           <imagedata fileref="figures/textguru-import-panel3-withTags.png"
  1075.                      format="PNG" />
  1076.         </imageobject>
  1077.         <textobject>
  1078.           <para> 
  1079.             This screenshot depicts the third panel 'Text Import'
  1080.             druid with callouts labeling the different areas.
  1081.           </para>
  1082.         </textobject>
  1083.         <caption>
  1084.               <para>
  1085.             The different components of the third panel of the
  1086.             <interface>Text Import</interface> druid with each component
  1087.             labeled with a callout.
  1088.               </para>
  1089.         </caption>
  1090.       </mediaobject>
  1091.     </screenshot>
  1092.       </figure>
  1093.  
  1094.       <para>
  1095.         The purpose of each labeled component in <xref
  1096.         linkend="fig-file-textImport-druid-panel3" /> is
  1097.         explained below:
  1098.  
  1099.     <variablelist>
  1100.       <title>The components of the third panel</title>
  1101.  
  1102.       <varlistentry>
  1103.         <term>
  1104.           <emphasis role="bold">1</emphasis> - The trim of empty
  1105.         outer columns drop down list button.
  1106.         </term>
  1107.         <listitem>
  1108.           <para>
  1109.             This button provides a list allowing the user to
  1110.             select whether to trim any outer columns which are
  1111.             completely empty. The choices are to delete the
  1112.             columns on both sides, on neither side, or on one side
  1113.             only. This will only affect columns which have been
  1114.             previously defined but which contain no data values at
  1115.             all. 
  1116.           </para>
  1117.         </listitem>
  1118.           </varlistentry>
  1119.  
  1120.       <varlistentry>
  1121.         <term>
  1122.           <emphasis role="bold">2</emphasis> - Locale definition
  1123.           for import drop down menu button.
  1124.         </term>
  1125.         <listitem>
  1126.           <para>
  1127.             This button provides a list of locales which can be
  1128.             set. The chosen locale will affect how numeric values
  1129.             are interpreted when then are imported. For instance,
  1130.             the locale will define the character expected as the
  1131.             decimal separator which is the period character (.) in
  1132.             some locales, and the comma character (,) in
  1133.             others. These locales generally then use the other
  1134.             character as the spacer grouping the digits in
  1135.             thousands. 
  1136. <!-- TODO: add xref to localization discuss and to number formats. -->
  1137.           </para>
  1138.         </listitem>
  1139.           </varlistentry>
  1140.  
  1141.       <varlistentry>
  1142.         <term>
  1143.           <emphasis role="bold">3</emphasis> - The column data
  1144.           format selection list.
  1145.         </term>
  1146.         <listitem>
  1147.           <para>
  1148.             This list allows predetermining the format which
  1149.           &gnum; will assign to each of the values in the columns
  1150.           selected below. Cell data formats are explained in <xref
  1151.           linkend="sect-data-format"/>.
  1152.           </para>
  1153.           <para>
  1154.             To use this list, first, one or more columns must be
  1155.             selected in the preview area below, then, a data
  1156.             format in this list can be selected, and finally any
  1157.             details of the format can be configured. Number
  1158.             formats for instance allow the user to force numbers
  1159.             to contain fixed number of digits after the decimal
  1160.             point.
  1161.           </para>
  1162.         </listitem>
  1163.           </varlistentry>
  1164.  
  1165.       <varlistentry>
  1166.         <term>
  1167.           <emphasis role="bold">4</emphasis> - The column
  1168.           selection, inclusion, and file preview area.
  1169.         </term>
  1170.         <listitem>
  1171.           <para>
  1172.             This area allows users to select columns which will be
  1173.             preformatted, to select which columns to include in
  1174.             the import and to preview the file. Each single column
  1175.             can be selected by clicking with the mouse pointer on
  1176.             the column header. Any single column can be excluded
  1177.             from the data imported to the &gnum; worksheet by
  1178.             clicking in the checkbox in the column header to
  1179.             remove the check mark. The area also provides a
  1180.             preview of the data in the text file showing the
  1181.             effect of the with the current configuration.
  1182.           </para>
  1183.         </listitem>
  1184.           </varlistentry>
  1185.  
  1186.       <varlistentry>
  1187.         <term>
  1188.           <emphasis role="bold">5</emphasis> - The button area.
  1189.         </term>
  1190.         <listitem>
  1191.           <para>
  1192.             These four buttons allow the user to navigate the
  1193.             druid. The <guibutton>Help</guibutton> button should
  1194.             open the &gnum; manual to this section. The
  1195.             <guibutton>Cancel</guibutton> button will dismiss the
  1196.             dialog and return the user to the worksheet. The
  1197.             <guibutton>Back</guibutton> button will take the user
  1198.             back to the second panel, without, however, changing
  1199.             the settings in this third panel. The
  1200.             <guibutton>Finish</guibutton> button will dismiss the
  1201.             druid and cause the file to be imported into a new
  1202.             worksheet using the selected configuration parameters.
  1203.           </para>
  1204.         </listitem>
  1205.           </varlistentry>
  1206.  
  1207.         </variablelist>
  1208.  
  1209.       </para>
  1210.  
  1211.     </sect3>
  1212.  
  1213.  
  1214.  
  1215.   </sect2>
  1216.  
  1217. <!-- TODO: docbookv4.3 change middle <step>s into <stepalternative>s -->
  1218.  
  1219. <!-- TODO: write- section 'Procedure to use the text importer'. -->
  1220. <!--
  1221.   <sect2 id="sect-file-textImport-druid-process">
  1222.     <title>
  1223.       The procedure to use the <interface>Text Import</interface>
  1224.       Druid.
  1225.     </title>
  1226.  
  1227.     <para>
  1228.       
  1229.     </para>
  1230.  
  1231.     <para>
  1232.       Explain the optional-ness of the options.  
  1233.     </para>
  1234.  
  1235.     <procedure>
  1236.       <title>
  1237.     The procedure to use the <interface>Text Import</interface>
  1238.         Druid.
  1239.       </title>
  1240.  
  1241.       <step>
  1242.     <title>
  1243.       Open the File using the "Text import (configurable)" format.
  1244.     </title>
  1245.     <para>
  1246.       Step description
  1247.     </para>
  1248.     <substeps>
  1249.           <step>
  1250.         <title>
  1251.           Launch the <interface>File Open</interface> dialog.
  1252.         </title>
  1253.         <para>
  1254.           Substep description
  1255.         </para>
  1256.           </step>
  1257.           <step>
  1258.         <title>
  1259.           Select the folder and file to be opened.
  1260.         </title>
  1261.         <para>
  1262.           Substep description
  1263.         </para>
  1264.           </step>
  1265.           <step>
  1266.         <title>
  1267.           Select the "Text import (configurable)" format type.
  1268.         </title>
  1269.         <para>
  1270.           Substep description
  1271.         </para>
  1272.           </step>
  1273.           <step>
  1274.         <title>
  1275.           (Optional) Select the character encoding scheme.
  1276.         </title>
  1277.         <para>
  1278.           Substep description
  1279.         </para>
  1280.           </step>
  1281.           <step>
  1282.         <title>
  1283.           Open the file.
  1284.         </title>
  1285.         <para>
  1286.           Click on the <guibutton>Open</guibutton> button to open
  1287.           the file using the <interface>Text Importer</interface>.
  1288.         </para>
  1289.           </step>
  1290.     </substeps>
  1291.       </step>
  1292.  
  1293.  
  1294.        <step>
  1295.     <title>
  1296.       Configure the 1<superscript>st</superscript> panel.
  1297.     </title>
  1298.     <para>
  1299.       Step description: encoding, line break, data structuring
  1300.       scheme, line selection.
  1301.     </para>
  1302.     <substeps>
  1303.           <step>
  1304.         <title>
  1305.           Re-define the character encoding.
  1306.         </title>
  1307.         <para>
  1308.           Substep description
  1309.         </para>
  1310.           </step>
  1311.           <step>
  1312.         <title>
  1313.           Define the line break separator character sequences.
  1314.         </title>
  1315.         <para>
  1316.           Substep description
  1317.         </para>
  1318.           </step>
  1319.           <step>
  1320.         <title>
  1321.           Select the data field structuring scheme.
  1322.         </title>
  1323.         <para>
  1324.           Substep description
  1325.         </para>
  1326.           </step>
  1327.           <step>
  1328.         <title>
  1329.           Select the line region to import.
  1330.         </title>
  1331.         <para>
  1332.           Substep description
  1333.         </para>
  1334.           </step>
  1335.           <step>
  1336.         <title>
  1337.           Move to the next panel
  1338.         </title>
  1339.         <para>
  1340.           Click on the <guibutton>Forward</guibutton> to move to
  1341.           the next panel. The panel which will appear will be
  1342.           different for the two types of data structuring
  1343.           strategies. There are two sections below describing the
  1344.           second panel, section 3 and section 4, one for each of
  1345.           the two data structuring schemes.
  1346.         </para>
  1347.           </step>
  1348.     </substeps>
  1349.       </step>
  1350.       <step>
  1351.     <title>
  1352.       (Separated value structured file) 
  1353.         Configure the 2<superscript>nd</superscript> panel. 
  1354.     </title>
  1355.     <para>
  1356.       Step description
  1357.     </para>
  1358.     <substeps>
  1359.           <step>
  1360.         <title>
  1361.           Define the character sequences acting as separators.
  1362.         </title>
  1363.         <para>
  1364.           pick any combo of individual chars
  1365.         </para>
  1366.         <para>
  1367.           define a char sequence.
  1368.         </para>
  1369.         <para>
  1370.           Combine 2?
  1371.         </para>
  1372.           </step>
  1373.           <step>
  1374.         <title>
  1375.           Define the characters used to braket text fields.
  1376.         </title>
  1377.         <para>
  1378.           Substep description
  1379.         </para>
  1380.           </step>
  1381.           <step>
  1382.         <title>
  1383.           Move to the next panel
  1384.         </title>
  1385.         <para>
  1386.           Click on the <guibutton>Forward</guibutton> to move to
  1387.           the third panel.
  1388.         </para>
  1389.           </step>
  1390.     </substeps>
  1391.       </step>
  1392.  
  1393.       <step>
  1394.     <title>
  1395.       (Fixed width structured file)
  1396.         Configure the 2<superscript>nd</superscript> panel. 
  1397.     </title>
  1398.     <para>
  1399.       Step description
  1400.     </para>
  1401.     <substeps>
  1402.           <step>
  1403.         <title>
  1404.           Define the fixed-width columns.
  1405.         </title>
  1406.         <para>
  1407.           In this process, can restart at any time using the reset
  1408.         button but CAUTION can't undo a reset.
  1409.         </para>
  1410.         <para>
  1411.           Use the automatic column detection button.
  1412.         </para>
  1413.         <para>
  1414.           Define the columns manually. Dbl click.
  1415.         </para>
  1416.           </step>
  1417.           <step>
  1418.         <title>
  1419.           Move to the next panel
  1420.         </title>
  1421.         <para>
  1422.           Click on the <guibutton>Forward</guibutton> to move to
  1423.           the third panel.
  1424.         </para>
  1425.           </step>
  1426.     </substeps>
  1427.       </step>
  1428.  
  1429.       <step>
  1430.     <title>
  1431.       Configure the 3<superscript>rd</superscript> panel.
  1432.     </title>
  1433.     <para>
  1434.       Step description
  1435.     </para>
  1436.     <substeps>
  1437.           <step>
  1438.         <title>
  1439.           Select which empty outer columns to trim during import.
  1440.         </title>
  1441.         <para>
  1442.           Substep description
  1443.         </para>
  1444.           </step>
  1445.           <step>
  1446.         <title>
  1447.           Configure the locale settings used to interpret data values.
  1448.         </title>
  1449.         <para>
  1450.           Substep description
  1451.         </para>
  1452.           </step>
  1453.           <step>
  1454.         <title>
  1455.           Select the columns to be imported.
  1456.         </title>
  1457.         <para>
  1458.           Substep description
  1459.         </para>
  1460.           </step>
  1461.           <step>
  1462.         <title>
  1463.           Preselect the data formats for the elements in each column.
  1464.         </title>
  1465.         <para>
  1466.           Substep description
  1467.         </para>
  1468.           </step>
  1469.           <step>
  1470.         <title>
  1471.           Import the file.
  1472.         </title>
  1473.         <para>
  1474.           Click on the <guibutton>Finish</guibutton> button to
  1475.           import the file using all the settings as currently
  1476.           configured.
  1477.         </para>
  1478.           </step>
  1479.     </substeps>
  1480.       </step>
  1481.  
  1482.    </procedure>
  1483.  
  1484.     <para>
  1485.      The file will be opened
  1486.     </para>
  1487.  
  1488.  
  1489.   </sect2>
  1490.  section end comment to block out section -->
  1491.  
  1492.  
  1493.  
  1494.  
  1495.  
  1496. <!-- TODO: Remove the old text that follows. Kept now for inspiration.
  1497. ********************************************************************
  1498.  
  1499.  
  1500. <sect2>
  1501.   <title> OLD TEXT FOLLOWS: </title>
  1502.  
  1503.             
  1504.  
  1505.  
  1506.   <sect4>
  1507.   <title>The Number Formats</title>
  1508.  
  1509.  
  1510. <para>After selecting a column on the left select the appropriate
  1511.     format on the right. In the preview section at the bottom of the
  1512.     dialog, you can immediately see the effect of selecting that
  1513.     format. The following types of formats are available:</para>
  1514.  
  1515.  
  1516.  
  1517.  
  1518.   <variablelist>
  1519.     <varlistentry>
  1520.       <term>
  1521.       General
  1522.       </term>
  1523.       <listitem>
  1524.       <para>This format will guess for each field value whether it is text, 
  1525.       a number, a date, etc.</para>
  1526.       </listitem>
  1527.     </varlistentry>
  1528.  
  1529.  
  1530.  
  1531.  
  1532.     <varlistentry>
  1533.       <term>
  1534.       Numbers
  1535.       </term>
  1536.       <listitem>
  1537.       <para>You can choose between various number formats. The following list presents 
  1538.       just a short selection of those formats:</para>
  1539.   <figure id="file-format-numberformats">
  1540.     <title>Some Number Formats</title>
  1541.     <screen>
  1542. 0
  1543. 0.00
  1544. #,##0
  1545. #,##0_);(#,##0)
  1546. #,##0.00_);[Red](#,##0.00)
  1547.     </screen>
  1548.   </figure>
  1549.   <para>There are also formats facilitating the use of scientific notation, 
  1550.   see <xref linkend="file-format-scientificformats" />.</para>
  1551.       </listitem>
  1552.     </varlistentry>
  1553.  
  1554.  
  1555.  
  1556.  
  1557.  
  1558.     <varlistentry>
  1559.       <term>
  1560.       Currency Amounts
  1561.       </term>
  1562.       <listitem>
  1563.      <para> You can choose between various currency formats. The following list presents 
  1564.      just a short selection of those formats:</para>
  1565.   <figure id="file-format-currenyformats">
  1566.     <title>Some Currency Formats</title>
  1567.     <screen>
  1568. "$"#,##0
  1569. "$"#,##0_);(#,##0)
  1570. "$"#,##0.00_);[Red](#,##0.00)
  1571.     </screen>
  1572.   </figure>
  1573.       </listitem>
  1574.     </varlistentry>
  1575.  
  1576.  
  1577.  
  1578.  
  1579.  
  1580.  
  1581.     <varlistentry>
  1582.       <term>
  1583.       Dates and Times
  1584.       </term>
  1585.       <listitem>
  1586.       <para>You can choose between various date and time formats. Some of these formats will 
  1587.       recognize combined date/time entries. The following list presents just a short 
  1588.       selection of those formats:</para>
  1589.   <figure id="file-format-dateformats">
  1590.     <title>Some Date and Time Formats</title>
  1591.     <screen>
  1592. m/d/yy
  1593. d-mmm-yyyy
  1594. d-mm
  1595. mmm/d
  1596. mmm/ddd/yyyy
  1597. mmmm-yyyy
  1598. m/d/yyyy h:mm
  1599. yyyy
  1600. h:mm:ss AM/PM
  1601. [h]:mm:ss
  1602.     </screen>
  1603.   </figure>
  1604.       </listitem>
  1605.     </varlistentry>
  1606.     <varlistentry>
  1607.       <term>
  1608.       Percentages
  1609.       </term>
  1610.       <listitem>
  1611.       <para>You can choose between various formats that recognize percentages. 
  1612.       The following list presents just a short 
  1613.       selection of those formats:</para>
  1614.   <figure id="file-format-percentageformats">
  1615.     <title>Some Percentage Formats</title>
  1616.     <screen>
  1617. 0%
  1618. 0.00%
  1619.     </screen>
  1620.   </figure>
  1621.       </listitem>
  1622.     </varlistentry>
  1623.  
  1624.  
  1625.  
  1626.  
  1627.     <varlistentry>
  1628.       <term>
  1629.       Fractions
  1630.       </term>
  1631.       <listitem>
  1632.       <para>You can choose between a few formats that recognize fractions. 
  1633.       The following list presents just a short 
  1634.       selection of those formats:</para>
  1635.   <figure id="file-format-fractionformats">
  1636.     <title>Some Fraction Formats</title>
  1637.     <screen>
  1638. # ?/?
  1639. # ??/??
  1640.     </screen>
  1641.   </figure>
  1642.       </listitem>
  1643.     </varlistentry>
  1644.     <varlistentry>
  1645.       <term>
  1646.       Scientific Notation
  1647.       </term>
  1648.       <listitem>
  1649.       <para>You can choose between a few formats that recognize numbers in scientific notation.. 
  1650.       The following list presents just a short 
  1651.       selection of those formats:</para>
  1652.   <figure id="file-format-scientificformats">
  1653.     <title>Some Scientific Formats</title>
  1654.     <screen>
  1655. 0.00E+00
  1656. ##0.0E+0
  1657.     </screen>
  1658.   </figure>
  1659.       </listitem>
  1660.     </varlistentry>
  1661.  
  1662.  
  1663.  
  1664.  
  1665.  
  1666.     <varlistentry>
  1667.       <term>
  1668.       Text
  1669.       </term>
  1670.       <listitem>
  1671.       <para>If you want the importer to simply read the field value as text without 
  1672.       attempting to interpret it in any way, use the following text format:</para>
  1673.   <figure id="file-format-textformat">
  1674.     <title>The Text Format</title>
  1675.     <screen>
  1676. @
  1677.     </screen>
  1678.   </figure>
  1679.       </listitem>
  1680.     </varlistentry>
  1681.  
  1682.  
  1683.  
  1684.   </variablelist>
  1685.  
  1686.  
  1687.  
  1688.   <para>More details on the various formats can be found in 
  1689.     <xref linkend="file-format" />.</para>
  1690.  
  1691.     <xref linkend="sect-data-format" />.</para>
  1692.   </listitem>
  1693.   <listitem><para>
  1694.   Click the <quote><guibutton>Finish</guibutton></quote> button 
  1695.   to complete importing the file.</para>
  1696.   </listitem>
  1697.   </orderedlist>
  1698.   </sect5>
  1699.   <sect5>
  1700.   <title>The Text Import Druid for Fixed Width Fields</title>
  1701.   <orderedlist>
  1702.   <listitem>
  1703.   <para>If you selected fixed width fields you are asked to specify the widths for
  1704.   each field. Click the <quote><guibutton>Auto Column Discovery</guibutton></quote> button
  1705.   to have <application>Gnumeric</application> try to determine the fields widths automatically.</para>
  1706.   <figure id="file-format-csv-import-ex5">
  1707.     <title></title>
  1708.     <screenshot>
  1709.     <mediaobject>
  1710.             <imageobject>
  1711.               <imagedata fileref="figures/files-csv-import-ex5.png" format="PNG" />
  1712.             </imageobject>
  1713.             <textobject>
  1714.               <phrase>An image of the third page of the text import
  1715.               druid with fixed width customization.</phrase>
  1716.             </textobject>
  1717.            </mediaobject>
  1718.     </screenshot>
  1719.   </figure>  
  1720.   </listitem>
  1721.   <listitem>
  1722.   <para>Finally select the appropriate format for each input column as in 
  1723.   <xref linkend="file-format-csv-import-ex4" />.</para>
  1724.   </listitem>
  1725.   <listitem><para>
  1726.   Click the <quote><guibutton>Finish</guibutton></quote> button 
  1727.   to complete importing the file.</para>
  1728.   </listitem>
  1729.   </orderedlist>
  1730.   </sect5>
  1731.   </sect4>
  1732.  
  1733. </sect2>
  1734.  
  1735. Old text. -->
  1736.  
  1737.  
  1738. </sect1>
  1739.  
  1740.        
  1741.