home *** CD-ROM | disk | FTP | other *** search
/ CD Direkt 1995 #6 / CDD_6_95.ISO / cdd / winanw / gram / readme.txt < prev   
Text File  |  1994-11-02  |  10KB  |  215 lines

  1.                               SPECTROGRAM (2.2)
  2.  
  3. 1.  PRINCIPLES OF OPERATION
  4.  
  5.     Most ordinary sounds are complex combinations of individual
  6. frequency components or harmonics which cover a wide frequency range and
  7. vary in intensity over time.  A spectrogram is simply a plot of the
  8. frequency content of such an audio signal as a function of time.  In
  9. this program, digital audio recordings (PCM format) are analyzed to
  10. produce a plot of frequency versus time, with harmonic intensity
  11. represented by a variable color scale.  These spectrograms reveal the
  12. fascinating hidden frequency structure of audio signals and can be used
  13. for identifying or classifying particular sounds.  When used to analyze
  14. recorded voice, spectrograms have also been know as
  15. 'voice prints'.
  16.  
  17.     Spectrogram uses a mathematical Fast Fourier Transform in
  18. performing the frequency analysis.  FFTs are usually specified by the
  19. number of input data points used in each calculation.  For a sampling
  20. rate of F (Hz), an N input point FFT will produce a frequency analysis
  21. over a frequency range of F/2.  Signal amplitude will be calculated at
  22. N/2 frequency increments in this range.  All this means is that for a
  23. digital signal sampled at 10000 Hz, a 512 point FFT will calculate
  24. signal amplitude to be found at 256 frequency increments from 0 Hz to
  25. 5000 Hz.  This will become clear as you calculate and observe
  26. different spectrograms.
  27.  
  28.     Contrary to popular opinion, higher sampling rates are not
  29. always necessary for high fidelity recording.  The choice of sampling
  30. rate depends entirely on the highest frequencies in the audio signal.
  31. The rule of thumb is to use a sampling rate that is twice the highest
  32. frequency in the audio signal.  That is, if you expect to have no
  33. frequency components above 11KHz, then a sampling rate of 22KHz is
  34. adequate.  If you examine a spectrogram and see that all of the signal
  35. is concentrated in lower frequency components at the bottom of the
  36. display, then it is a good bet that the recording was sampled at too
  37. high a rate, wasting a significant amount of memory.  This program
  38. produces the highest quality spectrograms of digital recordings which
  39. have been sampled at the appropriate rate.
  40.  
  41. 2.  SYSTEM REQUIREMENTS
  42.  
  43.     Spectrogram will run on any Windows 3.1 equipped machine.
  44. However, the intensive calculations required to develop the frequency
  45. spectrum demand the fastest processor available.  In addition, large
  46. sound files will require much memory for analysis and display, so the
  47. more memory the better.  Spectrogram will process any 8 or 16 bit audio
  48. data in PCM format including ".wav" files or raw data files.
  49. Spectrogram cannot process compressed audio data found occasionally in
  50. large .wav files.
  51.  
  52. 3.  COMPUTING AND DISPLAYING A SPECTROGRAM
  53.  
  54.     Choose "Open" from the "File" menu to load a digital sound
  55. sample file.  Once a file has been selected, Spectrogram will present
  56. the "Analysis Options" dialog box where you will specify the parameters
  57. of the frequency analysis.  To select the default values, just press the
  58. space bar.  To tailor the calculations to your own preferences, see
  59. below.
  60.  
  61.     a. SAMPLE CHARACTERISTICS
  62.  
  63.     You may enter any value of sample rate from 8000 Hz to 44100 Hz.
  64. If you have selected a .wav file, the sample rate displayed will be the
  65. rate used in the original recording.  If you have selected a raw data
  66. file, a sample rate of 11025 Hz will be initially assumed, and you
  67. should enter the correct value if necessary.
  68.  
  69.     You may also select the beginning and ending location in the
  70. selected file (in bytes) to be analyzed.  Initially, the starting and
  71. ending location of the entire file will be displayed.  If you make no
  72. change here, the entire file will be analyzed.
  73.  
  74.     You also have a choice of 8 bit or 16 bit data resolution.  Pick
  75. the value which you know corresponds to the data file you are analyzing.
  76. If you are loading a .wav file, the correct value will already be shown.
  77. If this is a raw data file, 16 bit data will be assumed, but it is up to
  78. you to specify the correct value.
  79.  
  80.     b.  FFT Selection
  81.  
  82.     You have a choice of 512, 1024, or 2048 point FFTs for the
  83. frequency analysis.  Use 512 points routinely.  Use 1024 and 2048 point
  84. FFTs only for high resolution analysis.  The higher resolution FFTs
  85. require more time to compute the spectrogram.  For this reason, it is
  86. sometimes preferable to decrease sampling rate, if increased frequency
  87. resolution is needed, rather than to use a higher resolution FFT.
  88.  
  89.     c.  Horizontal Scale Selection
  90.  
  91.     You may select a horizontal scale of 2, 4, 8, or 16ms per line.
  92. Each vertical line in the spectrogram display represents the output of
  93. one FFT calculation.  The FFT data input window is stepped sequentially
  94. through the data, performing an FFT calculation at each step.  The
  95. horizontal scale selected determines the length of the step between each
  96. FFT and thus the total number of FFTs required. Experiment with these
  97. values to pick the horizontal scale you prefer.
  98.  
  99.     d.  Display Threshold Selection
  100.  
  101.     You are also given a choice of display threshold in order to
  102. reduce clutter in noisy digital recordings.  A threshold of -3 dB or
  103. -6 dB reduces the input signal level to eliminate background clutter.
  104. Use a threshold of 0 dB regularly, and select signal reduction only if
  105. necessary to reduce clutter.
  106.  
  107.     e.  Color Palette Selection
  108.  
  109.     And finally, you have a choice of color of grayscale display.
  110. For a color display, red represents the highest signals and dark blue
  111. the lowest.  For a grayscale display, the darker the display, the higher
  112. the signal level.
  113.     
  114. Once you are satisfied with the Analysis Options, click "OK" to begin
  115. processing and display of a spectrogram of the audio data file.  The
  116. program will step sequentially through the audio file, calculate an FFT 
  117. at each step, and display the results in the Spectrogram window.  You
  118. can stop the process at any time by clicking the "Stop" button.
  119.  
  120. 4.  The Spectrogram Display
  121.  
  122.     The spectrogram display reveals the digital signal as a
  123. frequency versus time plot with signal amplitude at each frequency
  124. represented by intensity (or color).  A continuous readout of cursor
  125. position in frequency (Hz) and time (milliseconds) is displayed at the
  126. bottom left of the window.  A coordinate grid can also be added by 
  127. clicking the "Toggle Grid" button.
  128.  
  129.     The width of the spectrogram display is limited only by the
  130. display screen.  Maximizing the spectrogram window will expand the
  131. display horizontally to fill the screen.  If the spectrogram width is
  132. greater than screen width, you can use the horizontal scroll bar at the
  133. bottom of the display to position the spectrogram side-to-side.
  134.  
  135.     The height of the spectrogram display is limited by the size of
  136. the FFT chosen for analysis.  Only 256 vertical display points are
  137. needed for a 512 point FFT.  The 1024 and 2048 point FFTs require 512
  138. and 1024 points respectively.  Maximizing the spectrogram window will
  139. expand the display vertically to the size required by the FFT if not
  140. limited by the screen height.  If the spectrogram height is greater than
  141. the screen height, use the vertical scroll bar at right of the window to
  142. position the spectrogram top-to-bottom.
  143.  
  144. 5.  Modifying Spectrograms
  145.  
  146.     Once you have computed a spectrogram, you may want to make
  147. changes to its length, vertical or horizontal scale, threshold or color
  148. to improve the frequency analysis.  The menu bar across the top of the
  149. display gives options for FFT size, horizontal scale, display threshold,
  150. and color palette.  Choosing any of these options will cause the
  151. spectrogram to be recomputed with the new value you have chosen.
  152. If you want to change more than one parameter before recomputing the
  153. spectrogram, choose "Modify" from the File Menu to bring up another
  154. Analysis Options dialog box to make your selections.
  155.  
  156.     Frequently you will want to select a portion of the entire 
  157. spectrogram for recomputation rather than recompute the entire length.
  158. You can drag select this section from the spectrogram display.  Position
  159. the mouse pointer at the desired startin