home *** CD-ROM | disk | FTP | other *** search
/ HTML - Publishing on the Internet / html_cdrom.iso / tools / html / windows / check / announce.csm next >
Internet Message Format  |  1995-02-22  |  5KB

  1. From: churchh@uts.cc.utexas.edu (Henry Churchyard)
  2. Subject: htmlchek - HTML Error Checker and Utilities, v4.1
  3. Newsgroups: comp.sources.misc
  4. Organization: The University of Texas at Austin; Austin, Texas
  5. Keywords: WWW HTML 2.0 HTML 3.0 Arena Netscape SGML awk perl error checker search-and-replace v.4.1
  6.  
  7. Submitted-by: churchh@uts.cc.utexas.edu (Henry Churchyard)
  8. Archive-name: htmlchek/patch02
  9. Environment: AWK || Perl
  10. Patch-To: htmlchek: Volume 47, Issue 48-54
  11.  
  12. This is a bugfix and update to my htmlchek HTML error checker program,
  13. adding several minor features for greater convenience of use, and
  14. bringing the version number to 4.1.  The program checks for quite a
  15. number of possible defects in the HTML (Hyper-Text Mark-up Language)
  16. version 2.0 SGML files used on the World-Wide Web; it makes no claim
  17. to understand all of SGML, but is easy and relatively simple to use,
  18. gives lots of information (including about many stylistically bad
  19. practices), can do local cross-reference checking and generate
  20. rudimentary reference-dependency maps, and can be run on any platform
  21. for which an awk or perl language interpreter is available.
  22.  
  23. The htmlchek distribution also includes a number of supplemental
  24. utilities, including the htmlsrpl.pl HTML-aware search-and-replace
  25. program, which uses either literal strings or regular expressions;
  26. acts either only outside HTML/SGML tags, or only within tags; can be
  27. restricted to operate only within and/or only outside specified
  28. elements; and can also upper-case tag names.  Other utilities are:
  29.  
  30.     makemenu -- Makes simple menu for HTML files, based on each file's <TITLE>;
  31.                   can also make a simple table of contents based on <H1>-<H6>
  32.                   headings.
  33.  xtraclnk.pl -- Extracts links/anchors from HTML files; isolates text
  34.                   contained in <A> and <TITLE> elements.
  35.       dehtml -- Removes all HTML markup, preliminary to spell check.
  36.       entify -- Replaces high Latin-1 alphabetic characters with ampersand
  37.                   entities for safe 7-bit transport.
  38.     metachar -- Trivial program to protect HTML/SGML metacharacters "&<>" in
  39.                   plain text that is to be included in an HTML file.
  40.  
  41.    The patched 4.1 version of htmlchek is (or soon will be) available
  42. for anonymous FTP, in convenient .tar.Z and .zip formats, at the
  43. following URL:
  44.  
  45.   ftp://ftp.cs.buffalo.edu/pub/htmlchek/
  46.  
  47.    The documentation to htmlchek can be browsed over the Web, at this
  48. location:
  49.  
  50.   http://uts.cc.utexas.edu/~churchh/htmlchek.html
  51.  
  52.    Changes in this release include:
  53.  
  54. Don't warn about null <TEXTAREA></TEXTAREA> element; only check for
  55. inappropriate whitespace within elements commonly rendered as
  56. underlined (<A> and <U>); check ordering of head tags before body tags
  57. even in absence of explicit <head>...</head>; allow comments between
  58. list items; only output non-numeric unquoted option values in each
  59. file; corrected processing of HTML3 <LH>; updated HTML 3 language
  60. definition to January 19 1995 draft; tinkered with Netscape extensions
  61. language-definition yet again; added inline=1 command-line parameter;
  62. added listfile=/lf= command-line parameter (especially for greater
  63. MS-DOS convenience); allow cf= as abbreviation of configfile=;
  64. ampersands followed by non-alphabetics generate warnings rather than
  65. errors (so corresponding erromessage was removed from entify); added
  66. "changed"/"unchanged" STDERR messages to htmlsrpl.pl output; added
  67. .gif's to documentation; added awk-perl.html to documentation; added
  68. index.html menu to documentation.
  69.  
  70.    New files in this release are:
  71.  
  72.      README.41    Update notes
  73.       index.html  HTML version of README.40, README.41, and menu
  74.    awk-perl.html  Where to obtain Awk and Perl
  75.      geterr.sh    Trivial script to extract only ERROR! messages
  76.                     from htmlchek output
  77.    geterwrn.sh    Trivial script to extract only ERROR!/Warning!
  78.                     messages from htmlchek output
  79.                   ___
  80.         awk.gif      |    .gif files used
  81.       camel.gif      |     in htmlchek HTML
  82.         ftp.gif      |     documentation  
  83.    htmlchek.gif      |    (uuencoded as .uue
  84.    htmlchks.gif      |     files in the
  85.    valdhtml.gif      |     comp.sources.misc
  86.     warning.gif   ___|     Usenet distribution)
  87.  
  88.  
  89.    To apply the patch, cd into the htmlchek source directory, unshar
  90. this file and type:
  91.  
  92.     patch < htmlc41a.ptc
  93.     patch < htmlc41b.ptc
  94.     patch < htmlc41c.ptc
  95.  
  96. Use a uudecode program to convert the .uue files to .gif's.
  97.