home *** CD-ROM | disk | FTP | other *** search
/ Borland Programmer's Resource / Borland_Programmers_Resource_CD_1995.iso / sounds / gram22 / readme.txt < prev   
Text File  |  1995-05-18  |  10KB  |  215 lines

  1.                               SPECTROGRAM (2.2)
  2.  
  3. 1.  PRINCIPLES OF OPERATION
  4.  
  5.     Most ordinary sounds are complex combinations of individual
  6. frequency components or harmonics which cover a wide frequency range and
  7. vary in intensity over time.  A spectrogram is simply a plot of the
  8. frequency content of such an audio signal as a function of time.  In
  9. this program, digital audio recordings (PCM format) are analyzed to
  10. produce a plot of frequency versus time, with harmonic intensity
  11. represented by a variable color scale.  These spectrograms reveal the
  12. fascinating hidden frequency structure of audio signals and can be used
  13. for identifying or classifying particular sounds.  When used to analyze
  14. recorded voice, spectrograms have also been know as
  15. 'voice prints'.
  16.  
  17.     Spectrogram uses a mathematical Fast Fourier Transform in
  18. performing the frequency analysis.  FFTs are usually specified by the
  19. number of input data points used in each calculation.  For a sampling
  20. rate of F (Hz), an N input point FFT will produce a frequency analysis
  21. over a frequency range of F/2.  Signal amplitude will be calculated at
  22. N/2 frequency increments in this range.  All this means is that for a
  23. digital signal sampled at 10000 Hz, a 512 point FFT will calculate
  24. signal amplitude to be found at 256 frequency increments from 0 Hz to
  25. 5000 Hz.  This will become clear as you calculate and observe
  26. different spectrograms.
  27.  
  28.     Contrary to popular opinion, higher sampling rates are not
  29. always necessary for high fidelity recording.  The choice of sampling
  30. rate depends entirely on the highest frequencies in the audio signal.
  31. The rule of thumb is to use a sampling rate that is twice the highest
  32. frequency in the audio signal.  That is, if you expect to have no
  33. frequency components above 11KHz, then a sampling rate of 22KHz is
  34. adequate.  If you examine a spectrogram and see that all of the signal
  35. is concentrated in lower frequency components at the bottom of the
  36. display, then it is a good bet that the recording was sampled at too
  37. high a rate, wasting a significant amount of memory.  This program
  38. produces the highest quality spectrograms of digital recordings which
  39. have been sampled at the appropriate rate.
  40.  
  41. 2.  SYSTEM REQUIREMENTS
  42.  
  43.     Spectrogram will run on any Windows 3.1 equipped machine.
  44. However, the intensive calculations required to develop the frequency
  45. spectrum demand the fastest processor available.  In addition, large
  46. sound files will require much memory for analysis and display, so the
  47. more memory the better.  Spectrogram will process any 8 or 16 bit audio
  48. data in PCM format including ".wav" files or raw data files.
  49. Spectrogram cannot process compressed audio data found occasionally in
  50. large .wav files.
  51.  
  52. 3.  COMPUTING AND DISPLAYING A SPECTROGRAM
  53.  
  54.     Choose "Open" from the "File" menu to load a digital sound
  55. sample file.  Once a file has been selected, Spectrogram will present
  56. the "Analysis Options" dialog box where you will specify the parameters
  57. of the frequency analysis.  To select the default values, just press the
  58. space bar.  To tailor the calculations to your own preferences, see
  59. below.
  60.  
  61.     a. SAMPLE CHARACTERISTICS
  62.  
  63.     You may enter any value of sample rate from 8000 Hz to 44100 Hz.
  64. If you have selected a .wav file, the sample rate displayed will be the
  65. rate used in the original recording.  If you have selected a raw data
  66. file, a sample rate of 11025 Hz will be initially assumed, and you
  67. should enter the correct value if necessary.
  68.  
  69.     You may also select the beginning and ending location in the
  70. selected file (in bytes) to be analyzed.  Initially, the starting and
  71. ending location of the entire file will be displayed.  If you make no
  72. change here, the entire file will be analyzed.
  73.  
  74.     You also have a choice of 8 bit or 16 bit data resolution.  Pick
  75. the value which you know corresponds to the data file you are analyzing.
  76. If you are loading a .wav file, the correct value will already be shown.
  77. If this is a raw data file, 16 bit data will be assumed, but it is up to
  78. you to specify the correct value.
  79.  
  80.     b.  FFT Selection
  81.  
  82.     You have a choice of 512, 1024, or 2048 point FFTs for the
  83. frequency analysis.  Use 512 points routinely.  Use 1024 and 2048 point
  84. FFTs only for high resolution analysis.  The higher resolution FFTs
  85. require more time to compute the spectrogram.  For this reason, it is
  86. sometimes preferable to decrease sampling rate, if increased frequency
  87. resolution is needed, rather than to use a higher resolution FFT.
  88.  
  89.     c.  Horizontal Scale Selection
  90.  
  91.     You may select a horizontal scale of 2, 4, 8, or 16ms per line.
  92. Each vertical line in the spectrogram display represents the output of
  93. one FFT calculation.  The FFT data input window is stepped sequentially
  94. through the data, performing an FFT calculation at each step.  The
  95. horizontal scale selected determines the length of the step between each
  96. FFT and thus the total number of FFTs required. Experiment with these
  97. values to pick the horizontal scale you prefer.
  98.  
  99.     d.  Display Threshold Selection
  100.  
  101.     You are also given a choice of display threshold in order to
  102. reduce clutter in noisy digital recordings.  A threshold of -3 dB or
  103. -6 dB reduces the input signal level to eliminate background clutter.
  104. Use a threshold of 0 dB regularly, and select signal reduction only if
  105. necessary to reduce clutter.
  106.  
  107.     e.  Color Palette Selection
  108.  
  109.     And finally, you have a choice of color of grayscale display.
  110. For a color display, red represents the highest signals and dark blue
  111. the lowest.  For a grayscale display, the darker the display, the higher
  112. the signal level.
  113.     
  114. Once you are satisfied with the Analysis Options, click "OK" to begin
  115. processing and display of a spectrogram of the audio data file.  The
  116. program will step sequentially through the audio file, calculate an FFT 
  117. at each step, and display the results in the Spectrogram window.  You
  118. can stop the process at any time by clicking the "Stop" button.
  119.  
  120. 4.  The Spectrogram Display
  121.  
  122.     The spectrogram display reveals the digital signal as a
  123. frequency versus time plot with signal amplitude at each frequency
  124. represented by intensity (or color).  A continuous readout of cursor
  125. position in frequency (Hz) and time (milliseconds) is displayed at the
  126. bottom left of the window.  A coordinate grid can also be added by 
  127. clicking the "Toggle Grid" button.
  128.  
  129.     The width of the spectrogram display is limited only by the
  130. display screen.  Maximizing the spectrogram window will expand the
  131. display horizontally to fill the screen.  If the spectrogram width is
  132. greater than screen width, you can use the horizontal scroll bar at the
  133. bottom of the display to position the spectrogram side-to-side.
  134.  
  135.     The height of the spectrogram display is limited by the size of
  136. the FFT chosen for analysis.  Only 256 vertical display points are
  137. needed for a 512 point FFT.  The 1024 and 2048 point FFTs require 512
  138. and 1024 points respectively.  Maximizing the spectrogram window will
  139. expand the display vertically to the size required by the FFT if not
  140. limited by the screen height.  If the spectrogram height is greater than
  141. the screen height, use the vertical scroll bar at right of the window to
  142. position the spectrogram top-to-bottom.
  143.  
  144. 5.  Modifying Spectrograms
  145.  
  146.     Once you have computed a spectrogram, you may want to make
  147. changes to its length, vertical or horizontal scale, threshold or color
  148. to improve the frequency analysis.  The menu bar across the top of the
  149. display gives options for FFT size, horizontal scale, display threshold,
  150. and color palette.  Choosing any of these options will cause the
  151. spectrogram to be recomputed with the new value you have chosen.
  152. If you want to change more than one parameter before recomputing the
  153. spectrogram, choose "Modify" from the File Menu to bring up another
  154. Analysis Options dialog box to make your selections.
  155.  
  156.     Frequently you will want to select a portion of the entire 
  157. spectrogram for recomputation rather than recompute the entire length.
  158. You can drag select this section from the spectrogram display.  Position
  159. the mouse pointer at the desired starting point, press the left mouse
  160. button and drag the mouse to the desired ending point and then release
  161. the mouse button.  The Analysis Options dialog box will then appear with
  162. the starting and ending locations filled according to your selection.
  163.  
  164.  
  165. 6.  Direct Recording and Analysis
  166.  
  167.     If you have a Windows compatible sound card installed, you will
  168. be able to directly record and analyze an audio sample through a
  169. microphone attached to your sound card.  Choose "Record New" from the
  170. File menu to initiate recording.  You will be again be presented with
  171. the Analysis Options dialog box to select the parameters of the
  172. frequency analysis.  When recording is complete, computation of the
  173. spectrogram will begin.    
  174.  
  175. 7.  Spectrogram Playback
  176.  
  177.     If you have a windows compatible sound card installed, you will
  178. also be able to play back the spectrogram by clicking the 'Play' or
  179. 'Play Wdw' buttons.  The Play button plays back the entire length of 
  180. the .wav file, while the Play Wdw button plays back only that portion of 
  181. the spectrogram which is visible in the Spectrogram Window.
  182.  
  183. 8.  Saving Audio and Bitmap Files
  184.  
  185.     You can save a .wav file of the digital audio of your
  186. spectrogram by choosing "Save Wave" from the File Menu.  You can also
  187. save a bitmap of the visible portion of the Spectrogram Window by
  188. choosing "Save Bitmap" from the File Menu.
  189.  
  190. 9.  Problem Reporting
  191.  
  192.     Programs can only be improved if users provide feedback to the
  193. author.  I can be reached at the following addresses for you to report
  194. any bugs or to provide comments or feedback.  I encourage anyone with a
  195. question to contact me at :
  196.  
  197.             DELPHI  -  RSHORNE
  198.  
  199.             INTERNET - RSHORNE@DELPHI.COM
  200.  
  201. 10.  DISTRIBUTION
  202.  
  203.     Spectrogram is Copyright 1994 by R.S. Horne and may be
  204. distributed as freeware.
  205.  
  206. 11.  CREDITS
  207.  
  208.     So many interested Internet users have given good comments and
  209. suggestions that I can't list everyone.  However, the contribution of
  210. Philip VanBaren who provided the fast integer FFT code, has been
  211. vital to the improved performance of this update.  Greg Walker and 
  212. Henrik Clausen provided invaluable suggestions and debugging help.
  213.  
  214.     
  215.