home *** CD-ROM | disk | FTP | other *** search
/ Languages Around the World / LanguageWorld.iso / language / japanese / 2shin / 2shin.doc next >
Text File  |  1992-01-01  |  7KB  |  140 lines

  1.               2SHIN, VERSION 1.0
  2.  
  3. WHY 2SHIN WAS CREATED:
  4.  
  5.      7-bit communication sometimes is used for transmitting Japanese language
  6. messages, although 8-bit is now most common.  BBSs like the GEnie (tm) Japan
  7. Roundtable (Catagory 12) contain messages in 7-bit Shin-JIS.  However, 8-bit
  8. Shift-JIS is the standard code type used by MS-DOS computers in Japan.  8-bit
  9. Shift-JIS is also the text type used by DOS/V, the Japanese DOS version that
  10. runs on normal IBM-ATs.  Most PC-based Japanese word processors can create
  11. 8-bit Shift-JIS files, although some don't create 7-bit Shin-JIS.  So
  12. software is sometimes needed to convert such WP files into a format that can
  13. be uploaded to Japanese BBSs that use 7-bit communication.   2SHIN is
  14. copyrighted (c) software, 1992, by Steven W. Johnston, all rights reserved.
  15. You are granted a limited license to use 2SHIN, to make copies of 2SHIN, and
  16. to distribute 2SHIN electronically subject to the following conditions:
  17.  
  18.  (1) 2SHIN may not be distributed in modified form or together with 
  19.    any other software.  This document file must accompany 2SHIN.
  20.  
  21.  (2) No fee is to be charged for copying or using this software.
  22.  
  23.      2SHIN was written in C and compiled under Microsoft (tm) C, version 5.1.
  24. It therefore contains portions of code copyrighted by Microsoft, used here
  25. per the usual license agreement.  2SHIN will run on any computer using
  26. MS-DOS, version 2.0 and above.
  27.  
  28.  WHAT 2SHIN DOES:
  29.  
  30.      This program will convert an 8-bit SHIFT-JIS Japanese language message
  31. into a 7-bit Shin JIS Japanese language message that can be used for 7-bit
  32. electronic communication.  Also since these JIS codes are supersets of normal
  33. 7-bit ASCII, normal 7-bit ASCII within the message will remain intact in the
  34. output.
  35.  
  36.  HOW TO USE 2SHIN:
  37.  
  38.      Create the message that you are interested in sending with your Japanese
  39. WP, and save the file to disk as SHIFT-JIS.  Test that the file is indeed
  40. SHIFT-JIS by viewing it with KanjiView 3.0 under English-mode DOS, or with
  41. the dos TYPE command under Japanese DOS.  Upload your message as binary or
  42. ASCII.  This is may require you to experiment with your communication
  43. software\host system.   I recommend that you use a TTY emulation, rather than
  44. ANSII or VT100, etc. terminal, since a TTY emulation is most likely to leave
  45. the ESC untouched.  Almost any communication program should support TTY
  46. emulation.  Next, convert the message file that you saved to disk with 2SHIN
  47. by typing:
  48.  
  49.        2SHIN <filename 1> <filename 2> (CR)
  50.  
  51.      Here, <filename 1> is the name of the 8-bit format file to be converted
  52. and <filename 2> is the name of the new 7-bit format Shin-JIS file that will
  53. be created.  These file names may include paths.  2SHIN will convert files of
  54. any length, provided that there is sufficient disk space for the new Shin-JIS
  55. file.  Shin-JIS files are always somewhat larger than their 8-bit equivalents
  56. because Shin-JIS uses escape code sequences.
  57.  
  58.  HOW 2SHIN WORKS:
  59.  
  60.      There are several JIS (Japan Industrial Standard) code schemes that are
  61. in common use in the world of electronic communications.  Since the font used
  62. to display Japanese is so large, 2-byte codes are used to represent the
  63. Zenkaku characters.  All JIS codes are supersets of the standard ASCII
  64. (Amercian Standard Code for Information Interchange) 7-bit characters.  This
  65. means that strings of ASCII text are often within a JIS electronic message.
  66. JIS code methods may be classified as either 8-bit or 7-bit.  For MS-DOS
  67. personal computers the only important 8-bit code type is Shift-JIS, sometimes
  68. called MS-JIS since it is used within MS-DOS PCs.  Since much electronic
  69. communication still uses only 7 data bits, methods have been developed to
  70. send JIS codes without the 8th bit.  These 7-bit codes require Zenkaku-IN and
  71. Zenkaku-OUT escape codes sequences. These codes sequences indicate whether
  72. the following bytes are normal 7-bit ASCII or Zenkaku byte pairs.  7-bit
  73. escape code sequences consist of the ESC character (Hex 1B) followed by
  74. either one or two special ASCII characters.  The most common modern 7-bit
  75. format is Shin-JIS. 2SHIN converts the Shift-JIS file into that form.
  76.  
  77.          Zenkaku-IN             Zenkaku-OUT
  78.  
  79.         " ESC $ B "             " ESC ( J "
  80.  
  81.  (FLEFO option) " ~ y "                 " ~ z "
  82.  
  83.      The FLEFO Zenkaku-IN and Zenkaku-OUT escape code sequences are a special
  84. option.  This is used to create messages for the FLEFO (Foreign Language
  85. Education Forum in the Compuserve Information Service) from 8-bit Shift-JIS.
  86. To create messages that contain FLEFO-JIS you must type the switch " /f "
  87. after <filename 2> on the command line. FLEFO-JIS is a special non-standard
  88. JIS form that was created to allow Japanese communication within the
  89. Compuserve message areas where the ESC character is not allowed.  The use of
  90. FLEFO-JIS on Compuserve will probably be temporary since Compuserve is
  91. expected someday to revise their software to allow non-English communication
  92. in the message areas and text files, by allowing 8-bit communication.
  93.  
  94.  TECHNICAL VOCABULARY:
  95.  
  96.      7-bit Character - This is any character less than Hex 80.  This document
  97. is written entirely in such 7-bit ASCII characters.
  98.  
  99.      8-bit Character - This is any character greater than Hex 7F.  On the
  100. IBM-PC's standard American font, these include the box-drawing characters and
  101. several foreign-language characters.  On Japanese PCs and on the IBM-AT
  102. running IBM JDOS4.0V, 8-bit characters display as Zenkaku and Katakana
  103. Hankaku.
  104.  
  105.      ASCII - American Standard Code for Information Interchange.  Only the
  106. 7-bit characters are standard.
  107.  
  108.      FLEFO-JIS -  Unfortunately, Compuserve's software does not allow either
  109. the ESC character or 8-bit JIS to be used within text files or forum message
  110. areas.  So members of the FLEFO (Foreign Language Education Forum) have
  111. patched together this non-standard JIS method.  Although the escape sequences
  112. contain no low ASCII control characters, escape sequences were chosen that
  113. will never occur within 7-bit JIS Suijun 1 or 2.  This allows the use of a
  114. form of 7-bit JIS even on a BBS that strips control characters, such as ESC.
  115. 2SHIN supports FLEFO-JIS conversion only when you use the /f switch on the
  116. command line.
  117.  
  118.      Hankaku -  These are Japanese and English characters that consist of
  119. only one byte.  On a typical PC display screen, 80 Hankaku characters fit
  120. across one line.  7-bit ASCII characters are examples of Hankaku characters.
  121.  
  122.      JIS - Japanese Industrial Standard, as listed in the Japanese Industrial
  123. Standard Handbooks which are available in major Japanese language bookstores.
  124. Shift-JIS - This is the JIS code scheme used by MS-DOS computers.  It is the
  125. most widely used method for electronically sending Japanese text.  Certain
  126. 8-bit characters are used to indicate a Zenkaku byte pair.  Other 8-bit
  127. characters are used to display Hankaku Katakana.
  128.  
  129.      Shin-JIS - This is the modern JIS 7-bit code.  It requires ESC code
  130. sequences in order to show that the following characters are Zenkaku or
  131. Hankaku.
  132.  
  133.      Zenkaku -  These are JIS characters that consist of two bytes.  On a
  134. typical PC display screen, 40 Zenkaku characters fit across one line.  Kanji
  135. and Hiragana are all displayed as Zenkaku.
  136.  
  137.                    (END OF DOCUMENT)
  138.  
  139.  
  140.