home *** CD-ROM | disk | FTP | other *** search
/ Otherware / Otherware_1_SB_Development.iso / mac / misc / medical / dna_stac.cpt / dnastack.readme
Text File  |  1992-07-30  |  12KB  |  198 lines

  1. Features of DNA Translator and Aligner HyperCard 2.0 stacks
  2. Version 1.0k 6/14/92 Copyright 1990,1991,1992 D. J. Eernisse
  3. Email: usergdef@um.cc.umich.edu (internet) or usergdef@umichum (bitnet)
  4. Mailing address: Museum of Zoology, Univ. of Michigan, Ann Arbor, MI 48109
  5. For further description see:
  6.  
  7. Eernisse, D. J. 1992. DNA Translator and Aligner: HyperCard utilities
  8.     to aid phylogenetic analysis of molecules. CABIOS 8: 177-184.
  9.                    
  10. The DNA Translator is a HyperCard 2.0 stack providing three complementary
  11. sets of utilities for viewing and manipulating molecular data on a
  12. Macintosh computer. First, DNA Translator displays codon and amino acid
  13. usage data as it differs for a wide variety of organisms and organelles.
  14. Dynamically-constructed graphs display percentage usage for a particular
  15. codon relative to the other 63 codons or to only other codons with
  16. equivalent amino acid coding. A user can select from a diverse list of some
  17. 70 taxon-organelle combinations. Second, a "gene mapping" facility draws
  18. and displays 2 linearized gene maps for comparison, automatically
  19. adjustable to desired scales and locations along all or part of the mapped
  20. molecule. Maps and select corresponding complete sequence data are provided
  21. for most available fully documented mitochondrial and chloroplast DNA
  22. (mtDNA and cpDNA) sequences, which include 9 animal, 1 yeast, and 1 ciliate
  23. mtDNAs and 3 green plant cpDNAs. Additional gene maps may be user-created
  24. by a direct file conversion of standard GenBank- or EMBL-format documented
  25. sequences and their features tables. Third, DNA Translator is a powerful
  26. workbench of specialized sequence manipulation tools, catering especially
  27. to those with interests in phylogenetic analysis. A user can extract the
  28. sequence of any particular mapped gene or region by clicking on
  29. the corresponding place on the gene map or by menu selection of the gene or 
  30. feature and mapped taxon. DNA Translator can also import single or 
  31. multiple sequences in a variety of formats, including multiple aligned
  32. sequence output of various programs (EuGene, Prophet, CLUSTAL, Nexus,
  33. PHYLIP, etc.), and then further manipulate, interleave, compare or
  34. translate the gene sequences to amino acids. Multiple aligned sequences can
  35. be converted to Nexus, Hennig86 or PHYLIP for subsequent phylogenetic
  36. analysis. Most known deviations from the "universal" code, which are
  37. typical for mtDNAs, may optionally be used during translation.
  38. The codon usage, translation and gene mapping data may be exported or
  39. imported in spreadsheet format for incorporating additional molecules of
  40. interest or in various standard formats (UWGCG, GenBank,
  41. EMBL,Intelligenetics). A built-in editor supports sequence entry with
  42. optional computer-speaking for error checking, and a variety of output
  43. conversion options. The current version is freely available via anonymous
  44. ftp for noncommercial use only.
  45.      
  46. A.   Import Formats Accepted
  47.    1.   Multiple sequence alignments
  48.       a.   Simple text files of string sequences, with or without
  49.            interleaves or match characters
  50.       b.   MBIR (EuGene, Prophet) "Doolittle" progressive alignments
  51.       c.   CLUSTAL nucleo- or peptide output.
  52.       d.   Nexus (PAUP, MacClade) files
  53.       e.   Phylip "Result" output files
  54.    2.   String sequences
  55.       a.   String sequence text files of the form: Name AGCTACCT...
  56.       b.   Data input from built-in sequence entry editor
  57.       c.   Sequences extracted from the provided gene mapper
  58.       d.   String output generated by many commonly used programs
  59.    3.   GenBank/EMBL or PIR-CODATA documented sequence files
  60.       a.   Converted to string sequences for use in conversions below
  61.       b.   GenBank or EMBL documented features to spreadsheet matrix
  62.       c.   Matrix directly convertable to rescalable gene map
  63.       d.   Gene map allows extraction of any mapped or custom subsequence
  64. B. Conversions provided
  65.    1.   Multiple sequence alignments (A1) converted/exported
  66.         in the following formats:
  67.       a.   Nexus (PAUP, MacClade) with optional cost matrices added
  68.       b.   Hennig86 (Nucleotide data only)
  69.       c.   Phylip 3.2 or 3.3 formats
  70.       d.   Multiple sequence strings (A2a) with gaps preserved or deleted
  71.    2.   String sequences (A2a,B1d) converted/exported in the
  72.         following formats:
  73.       a.   Unmodified to be reimported or converted as needed
  74.       b.   As straight single sequence strings for import by MBIR
  75.            (EuGene, Prophet), Authorin, Gene Construction Kit, etc.
  76.       c.   Intelligenetics format for import by many programs
  77.       d.   GenBank, EMBL, FASTP, or PIR-CODATA formats for viewing or
  78.            import by many programs
  79.       e.   Simple interleaved format with optional match characters
  80.            for manual alignment or reimport (A1a)
  81.       f.   Direct export of corresponding sequences (e.g., all animal
  82.            mtDNA cyt. B genes) from gene mapping facility to Aligner stack
  83.       g.   A subblock of aligned strings to MULFOLD (RNA folding) format
  84.       h.   Consensus sequence created by combining two or more sequences
  85.            employing ambiguous nucleotide symbols (IUPAC-IUB)
  86.       i.   Subsequence, DNA <-> RNA,  upper <-> lower case, ACGTU -> 01233,
  87.            filter IUPAC-IUB codes, complementary strand sequence conversions
  88.       j.   Tally and display autapomorphies (site-unique nucleotides or gaps)
  89.            for sets of aligned nucleotide strings
  90.       k.   Compute compositional statistics of each nucleotide string
  91.    3.   DNA/RNA -> peptide translation
  92.       >   1st, 1st & 2nd, or all 3 possible reading frames output
  93.       >   Formatted output displays codons below amino acid abbreviations
  94.           with either 1- or 3-letter amino acid abbreviations
  95.       >   String output is useful for export or conversion (B2)
  96.       >   Can use standard or any of the provided codon usage tables
  97.       >   Custom codon usage tables can be added using a table editor
  98.       >   Codons with ambiguous nucleotide symbols (IUPAC-IUB) are
  99.           translated as appropriate when translation is unambiguous
  100.       >   Optional termination when stop codons are encountered
  101.    4.   Peptide -> DNA translation
  102.       >   Peptide strings can be backtranslated, using the reverse of
  103.           whichever codon usage table the user selects
  104.       >   Backtranslation uses IUPAC-IUB conventions for ambiguous
  105.           nucleotides 
  106. D.   Nucleotide or peptide sequence entry
  107.       >   Special Editor field has autoformatting capabilities
  108.       >   Adjustable computer speaking supported during or after entry
  109.       >   Sequences can be edited, manipulated, or exported (B2) 
  110. E.   Data provided with stack
  111.       >   Codon usage patterns for about 70 organism/organelle combinations
  112.       >   Most mitochondrial variation in coding supported (3)
  113.       >   Gene maps of 11 mtDNAs plus string sequences
  114.       >   Gene maps and matrices for 3 green plant chloroplast DNAs 
  115. F.   General Features
  116.       >   Online help facility is available from any card in stack
  117.       >   References, taxon names, and sample data provided
  118.       >   Pulldown or popup menus or dialogs used for commands
  119.       >   Buttons or pulldown menus are used for stack navigation
  120.       >   Data fields can be locked or unlocked for text entry
  121.       >   Data fields shrink down or expand by clicking
  122.       >   Contents of fields exportable as text or printable
  123.       >   Codon usage tables output for any incorporated taxon
  124.       >   Gene maps and codon usage graphs have special printing options
  125.       >   Default word processor for exported text files can be chosen
  126.       >   PAUP/MacClade specification for exported Nexus files
  127.       >   PAUP/MacClade open directly from the stack
  128.       >   Add gene mapping or utility cards as required
  129.       >   All data, scripts and resources used are easily accessible
  130.       >   Custom XFCNs by Nigel Perry enable efficient manipulations 
  131. G.   Hardware and System Requirements
  132.       >   Requires any Macintosh that can run HyperCard 2.0
  133.       >   HyperCard 2.x (2.0 or 2.1) (Widely available for Macintosh users)
  134.       >   Macintosh System 6.0.5 or greater (for HyperCard 2.0)
  135.       >   2 or more MB Ram recommended
  136. H.   Availability of current version
  137.       >   Anonymous ftp to um.cc.umich.edu (35.1.1.43)
  138.           After connection type 'cd gdef' and 'get dnastack.hqx'
  139.           Resulting file needs to be "debinhexed"
  140.           This will most likely be more current than the following
  141.           due to more frequent updates.
  142.       >   Anonymous ftp to at least the following site
  143.           Ftp.Bio.Indiana.Edu (after connection: 'cd molbio/mac'
  144.           and 'get DNASTACK.HQX')
  145.       >   EMBL file server by sending the command:
  146.           GET MAC_SOFTWARE:DNATRANSLATOR.HQX to NETSERV@EMBL.BITNET
  147.           Entire package is approximately 550K in binhexed form
  148.       >  As of 9/24/91 includes Aligner stack described below
  149.      
  150. Aligner is a freeware HyperCard 2.x stack for manual alignment of
  151. sequences by D. J. Eernisse, author of DNA Translator stack. Aligner was
  152. inspired by a stack called MultiDNA by Ralph Gonzalez, but was created
  153. completely from scratch. Enhancements compared to MultiDNA include: 1)
  154. Number of sequences that can be aligned increased from 6 to 100; 2)
  155. interleave formatting and number lines automatically adjust for the
  156. number of sequences imported; 3) now accomodates sequences up to 30,000
  157. bp or amino acid residues long; 4) imports or exports multiple sequences
  158. that are simple return-delineated strings or in 'DNA Translator' stack
  159. string format (i.e., 'Name<space>AGCTGA...<rtn>'); 5) optionally
  160. interleaves exported sequences; 6) enlarged for use on a 640 x 480
  161. standard color or larger monitor (automatically adjusts for standard
  162. small Mac screens);  7) much faster switching between sequences to be
  163. edited; 8) can toggle between match characters (dashes) to the first
  164. sequence and no match characters; 9) speaks nucleotide/peptide
  165. characters during keyboard entry or after entry starting from the
  166. current insertion point; 10) various sequence manipulations, such as
  167. lower <-> UPPER case; 11) can add/delete gaps to/from all but the 
  168. currently selected sequence; 12) align amino acids, then introduce gaps 
  169. to the corresponding unaligned nucleotide strings to preserve the 
  170. amino acid alignment; 13) custom menus; 14) several options to color 
  171. text in the alignment including a color coding of nucleotide triplets 
  172. according to their amino acid coding, with multiple alternate genetic
  173. codes supported; 15) error checking routines for comparing the
  174. nongap characters against your starting file; 16) import multiple
  175. sequences for a particular gene directly from DNA Translator stack
  176. gene mapping facility (e.g., all avaialable animal mtDNA sequences 
  177. encoding cyt B gene); 17) optional help facility displays the function 
  178. of fields or buttons as the cursor enters them.
  179.    
  180. This stack is distributed separately or as part of the more extensive
  181. DNA Translator stack package. The best way to get the most current
  182. version of either stack is via anonymous ftp to "um.cc.umich.edu) then 
  183. "cd gdef" and "get aligner.hqx" or "get dnastack.hqx" for Aligner stack 
  184. only or the entire package, respectively. Then debinhex the resulting files.
  185. Aligner by itself is under 300 K uncompressed, while DNA Translator and 
  186. associated files occupy about 1 MB on your hard disk (500K in compressed 
  187. Binhex format).
  188.  
  189. This stack is only free for any noncommercial use and is not public
  190. domain.  It is copyrighted 1991,1992 by D. J. Eernisse, and uses some XFCN
  191. resources copyrighted by Nigel Perry with similar copyright restrictions
  192. (see stack script for details). For more information, contact:
  193.        
  194. Douglas J. Eernisse Museum of Zoology, Univ. of Michigan, Ann
  195. Arbor, MI 48109 USA usergdef@um.cc.umich.edu or usergdef@umichum
  196.    
  197. For further information, tips, trouble-shooting, and version history,
  198. see the online help facility.